作者:
出版社: 清华大学出版社
CIP号:2017207245
书号:978-7-302-47967-3
出版地:北京
出版时间:2017
定价:¥79
全书分为三篇,第一篇讲解了Hadoop的原生态组件,包括Hadoop以及Zookeeper、Hbase、Hive环境搭建与安装,以及对MapReduce、HDFS、Zookeeper、Hbase、Hive的原理介绍和实战操作。第二篇讲解了Spark的原生态组件,包括Scala、SparkSql、SparkStreaming、Dataframe,以及对Scala、SparkSql、SparkStreaming、Dataframe的原理介绍和实战操作。第三篇讲解了离线项目和在线项目,将Hadoop和Spark原生态组件进行整合。