作者:
出版社: 机械工业出版社
CIP号:2020125660
书号:978-7-111-66101-6
出版地:北京
出版时间:2020.7
定价:¥69
R语言以其对于统计分析、建模和可视化的有力支持,成为很多数据科学家、算法人员和机器学习从业者的首选语言。而Spark则得益于其高效的计算性能和良好的接口,成为人们处理大数据问题的利器。但两者一直以来都在各自的领域开疆拓土;本书的目的是通过R语言使用Apache Spark,以使两者发挥出更大的效能。本书第1~5章简单地介绍了如何大规模执行数据科学和机器学习项目。第6~9章介绍了使用Spark进行集群计算时令人激动的基本概念。第10~13章涵盖一些高级主题,包括分布式R、数据流和社区贡献等。