|
题名:
|
大数据处理框架Apache Spark设计与实现 / 许利杰,方亚芬著 , |
|
ISBN:
|
978-7-121-39171-2 价格: 84.8 |
|
语种:
|
chi |
|
载体形态:
|
11,264页 24cm |
|
出版发行:
|
出版地: 北京 出版社: 电子工业出版社 出版日期: 2020.08 |
|
内容提要:
|
本书以Apache Spark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。第一部分大数据处理框架的基础知识(第1-2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用为例概述Spark应用的执行流程。第二部分Spark大数据处理框架的核心理论(第3-4章):介绍Spark框架将应用程序转化为逻辑处理流程,进而转化为可并行执行的物理执行计划的一般过程及方法。第三部分典型的Spark应用(第5章):介绍迭代型的Spark机器学习应用和图计算应用。第四部分大数据处理框架性能和可靠性保障机制(第6-9章):介绍Spark框架的Shuffle机制、数据缓存机制、错误容忍机制、内存管理机制等。 |
|
中图分类法:
|
TP274 版次: |