|
题名:
|
大数据技术及应用:基于Python语言 / 严宣辉[等]编著 , |
|
ISBN:
|
978-7-121-42169-3 价格: 69 |
|
语种:
|
chi |
|
载体形态:
|
12,345页 26cm |
|
出版发行:
|
出版地: 北京 出版社: 电子工业出版社 出版日期: 2021.1 |
|
内容提要:
|
本书共9章,围绕大数据的基本概念和大数据处理的主要环节编写。第1章主要介绍大数据的概念、特点和构成;第2章主要介绍在Windows系统中安装Linux虚拟机及构建Hadoop分布式集群的方法;第3章主要介绍大数据采集工具的使用及数据预处理的常用方法;第4章首先介绍Hadoop的发展历史、软件生态、核心组件和命令结构,然后以HDFS为重点,介绍其体系结构和特点,并详细介绍HDFS的交互式命令;第5章介绍大数据环境下存储工具HBase的数据模型;第6章介绍Hive的存储模型,第7章介绍在Hadoop平台上利用Python设计MapReduce程序的基本思路;第8章介绍大数据分析与挖掘过程中的常用算法;第9章介绍数据可视化的常用方法及常用工具。 |
|
中图分类法:
|
TP274 版次: |