电子书 Spark高级数据分析 pdf txt mobi epub

原创 星辰  2017-05-27 15:52  阅读 828 次

内容简介
  本书是使用Spark进行大规模数据分析的实战宝典,由大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Spark和Scala进行数据处理的基础知识,接着讨论了如何将Spark用于机器学习,同时介绍了常见应用中几个常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询Wikipedia或分析基因数据。

作者简介
  Sandy Ryza是Cloudera公司数据科学家,Apache Spark项目的活跃代码贡献者。领导了Cloudera公司的Spark开发工作。他还是Hadoop项目管理委员会委员。

  Uri Laserson是Cloudera公司数据科学家,专注于Hadoop生态系统中的Python部分。

  Sean Owen是Cloudera公司EMEA地区的数据科学总监,也是Apache Spark项目的代码提交者。他创立了基于Spark、Spark Streaming和Kafka的Hadoop实时大规模学习项目Oryx(之前称为Myrrix)。

  Josh Wills是Cloudera公司的高级数据科学总监,Apache Crunch项目的发起者和副总裁。

 
 
限个人学习使用,不得用于商业用途,请在下载后24小时内删除。
备注:资源来自网络,如有不合理可私信我,秒删。
电子书 Spark高级数据分析 pdf txt mobi epub 免费下载
https://page55.ctfile.com/fs/14299555-204462273

 
 

本文地址:http://www.fatiao.space/archives/816
版权声明:本文为原创文章,版权归 星辰 所有,欢迎分享本文,转载请保留出处!

评论已关闭!