题名:
大数据开发基础与实践   / 黄天春, 刘振栋主编 ,
ISBN:
978-7-302-60693-2 价格: CNY39.00
语种:
chi
载体形态:
201页 图 26cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2022.6
内容提要:
本书从初学者角度详细介绍了大数据开发的基础知识和对应的项目开发实践。全书共七个项目开发案例。第一个项目是大数据集群环境搭建, 包括Linux虚拟机、JDK环境、Zookeeper、Hadoop、HBase、Spark等平台的安装和配置; 第二个项目是数据仓库构建, 包括MySQL、Hive的安装与配置; 第三个项目是Java访问Hadoop实践, 包括Java访问HDFS文件系统和MapReduce编程实践; 第四个项目是大数据采集实践, 包括利用Python编程语言、Request库采集网页数据, 并介绍利用XPath等技术对数据进行采集的方法; 第五个项目是大数据清洗实践, 包括利用编程方式和Kettle工具对数据进行清洗; 第六个项目是大数据分析实践, 包括利用Hive和Spark对数据进行清洗; 第七个项目是大数据可视化实践, 包括利用Excel和ECharts对数据进行可视化。 
主题词:
数据处理软件   高等职业教育
中图分类法:
TP274 版次: 5
主要责任者:
黄天春 主编
主要责任者:
刘振栋 主编