第十四章 大数据管理文章目录第十四章 大数据管理14.1大数据概述14.1.1什么是大数据14.1.2大数据的特征14.2大数据的应用14.2.1感知现在 预测未来----互联网文本大数据管理与挖掘14.2.2数据服务 实时推荐----基于大数据分析的用户建模14.3大数据管理系统14.3.1NoSQL数据管理系统14.3.2 NewSQL数据库系统14.3.3 MapReduce技术14.3.4大数据管理系统的新格局14.4小结14.1大数据概述14.1.1什么是大数据大数据定义一般意义上,大数据指无法在可容忍的时间内用现有IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。大数据通常认为是PB或EB或更高级的数据,包括结构化的、半结构化的和非结构化的数据。大数据分类按大数据的应用类型分为海量交易数据(企业OLTP应用)、海量交互数据(社交网、传感器、全球定位系统、Web信息)和海量处理数据(企业OLAP应用)。14.1.2大数据的特征大数据的特征(4V)巨量(Volume)、多样(Variety)、快变(Velocity)、价值(Value)。巨量:大数据的首要特征是数量巨大,而且在持续、急剧地膨胀。主要来源有:科学研究、互联网应用和电子商务领域、传感器数据、网状点击数流量、移动设备数据、无线射频识别数据等。多样:数据的多样性通常是指异构的数据类型、不同的数据表示和语义解释。越来越多的应用所产生的数据类型不再是纯粹的关系数据,更多的是非结构化、半结构化的数据,如文本、图形、图像、音频、视频、网页、推特和博客等。快变:大数据的快变性也称为实时性,一方面指数据到达的速度很快,另一方面指能够进行处理的时间很短,或者要求响应速度很快,即实时响应。价值:大数据的价值是潜在的、巨大的。大数据不仅具有经济价值和产业价值,还具有科学价值。这是大数据最重要的特点,也是大数据的魅力所在。14.2大数据的应用14.2.1感知现在 预测未来----互联网文本大数据管理与挖掘互联网媒体文本大数据应用:时事探针时事探针系统可以实时监控、收集互联网媒体数据,并对数据进行