题名:
大数据技术及应用:基于Python语言   / 严宣辉[等]编著 ,
ISBN:
978-7-121-42169-3 价格: 69
语种:
chi
载体形态:
12,345页 26cm
出版发行:
出版地: 北京 出版社: 电子工业出版社 出版日期: 2021.1
内容提要:
本书共9章,围绕大数据的基本概念和大数据处理的主要环节编写。第1章主要介绍大数据的概念、特点和构成;第2章主要介绍在Windows系统中安装Linux虚拟机及构建Hadoop分布式集群的方法;第3章主要介绍大数据采集工具的使用及数据预处理的常用方法;第4章首先介绍Hadoop的发展历史、软件生态、核心组件和命令结构,然后以HDFS为重点,介绍其体系结构和特点,并详细介绍HDFS的交互式命令;第5章介绍大数据环境下存储工具HBase的数据模型;第6章介绍Hive的存储模型,第7章介绍在Hadoop平台上利用Python设计MapReduce程序的基本思路;第8章介绍大数据分析与挖掘过程中的常用算法;第9章介绍数据可视化的常用方法及常用工具。 
中图分类法:
TP274 版次: