大数据技术丛书:Spark快速数据处理

大数据技术丛书:Spark快速数据处理

作者
凯洛(Holden Karau)
出版社
机械工业出版社 版次:第1版
出品方
机械工业出版社
语言
简体中文, 英语
页数
114页
装帧
平装
ISBN
9787111463115
重量
200 g
尺寸
20 x 14 x 0.8 cm
电子书格式
epub,pdf,txt,azw3,mobi,fb2,djvu
下载次数
5171
更新日期
2023-05-29

Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱机/独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),如何用Spark分布式处理数据,如何设置Shark,将Hive查询集成到你的Spark作业中来,如何测试Spark作业,以及如何提升Spark任务的性能。

大数据技术丛书:Spark快速数据处理 EPUB, PDF, TXT, AZW3, MOBI, FB2, DjVu, Kindle电子书免费下载。

《大数据技术丛书:Spark快速数据处理》电子书免费下载

epub下载 pdf下载 txt下载 azw3下载 mobi下载 fb2下载 djvu下载