【每周一本书】之《大数据核心技术与实用算法》

大数据技术与应用展现出锐不可当的强大生命力,科学界与企业界寄予无比的厚望。大数据成为继20世纪末21世纪初互联网蓬勃发展以来的又一轮IT工业革命

编辑 | abby

官网 | www.datayuan.cn

微信公众号ID | datayuancn

大数据技术与应用展现出锐不可当的强大生命力,科学界与企业界寄予无比的厚望。大数据成为继20世纪末21世纪初互联网蓬勃发展以来的又一轮IT工业革命。

大数据技术是指从数据采集、清洗、集成、挖掘、分析与结果解释,进而从各种类型的巨量数据中快速获得有价值信息的全部技术。从数据挖掘和分析中,人们可以获取具有重要价值的信息。大数据技术的精髓是从大数据中产生新见解的能力、识别复杂关系和做出越来越精准的预测、从大数据中产生动力、获取知识和采取行动的能力。

大数据技术是现代科学与技术发展,尤其是计算机科学技术发展的重要成果和结晶,是科学发展史的又一新的里程碑。大数据的出现对计算机科学技术的许多领域提出了挑战与冲击,推动了IT技术的发展。

而今天,小编就要为大家推荐一本关于大数据技术的入门读物——《大数据核心技术与实用算法》。

从内容方面,该书共分为12个章节:

第一章:大数据技术概述,主要包括大数据技术框架、特征、大数据的冲击、大数据研究方法论、常用的大数据计算框架。

第二章:大数据获取与存储,主要包括数据获取的定义与数据获取领域、NewSQL和NoSQL、分布式文件系统、虚拟存储技术、云存储技术、分布式存储核心算法、数据仓库与数据集市、区块链技术等。

第三章:大数据抽取技术,主要包括数据抽取技术概述、增量数据抽取技术、非结构化数据抽取、Web数据抽取。

第四章:大数据清洗技术,主要包括数据质量与数据清洗、不完整数据清洗方法、异常数据清洗方法、重复数据清洗方法、文本清洗和数据清洗技术的实现。

第五章:大数据转换与约简,主要包括数据平滑、数据规范化、数据泛化、数据约简、数据压缩、数值约简、数值数据离散化与概念分层。

第六章:大数据集成技术,主要包括数据集成技术概述,数据迁移、数据集成模式、数据集成系统、数据集成系统的构建、数据聚类集成、实时数据集成、企业信息集成。

第七章:大数据分析技术,主要包括大数据分析定义与方法、数据分析的基本方法、高级数据分析、预测分析、大数据预测分析的应用趋势。

第八章:数据挖掘,主要包括数据挖掘理论基础、关联规则挖掘、分类、聚类方法、序列模式挖掘、Web挖掘技术、空间数据挖掘、非结构化文本数据挖掘。

第九章:大数据分析结果解释,主要包括数据分析结果的解释、数据的基本展现形式、大数据可视化、大数据可视分析。

第十章:大数据离线计算技术,主要包括数据离线计算概述、MapReduce的体系结构、Hadoop分布式计算平台、MapReduce程序设计实例。

第十一章:大数据流式计算技术。

第十二章:大数据交互式处理技术,主要包括交互式处理系统的问题、数据切分、数据钻取、Scala编程语言简介、交互式大数据处理框架Spark、交互式查询。

(0)

相关推荐