机读格式显示(MARC)
- 000 01590nam0 2200313 450
- 010 __ |a 978-7-5198-8772-8 |d CNY148.00
- 021 __ |a CN |b 01-2024-1234
- 100 __ |a 20240604d2024 em y0chiy50 ea
- 200 1_ |a Spark大数据算法 |A Spark da shu ju suan fa |f (美) 马哈默德·帕瑞斯安(Mahmoud Parsian)著 |g 苏金国译
- 210 __ |a 北京 |c 中国电力出版社 |d 2024
- 215 __ |a xv, 485页 |c 图 |d 24cm
- 306 __ |a 英文原版由O'Reilly Media, Inc.出版2022 简体中文版由中国电力出版社出版2024
- 314 __ |a Mahmoud Parsian, 计算机科学博士, 作为开发人员、设计师、架构师和作者, 他是一位有30多年丰富经验的软件专业人士。在过去的15年里, 他一直在从事Java服务器端计算、数据库、MapReduce、Spark和分布式计算的相关工作。Parsian博士领导了Illumina的大数据团队, 专注于大规模基因组分析以及使用Spark和PySpark的分布式计算。
- 330 __ |a 本书内容讲述: Apache Spark不仅速度快, 易于使用, 还提供了丰富的分析能力和多语言支持, 这使得掌握这个集群计算框架的实用知识已经成为数据工程师和数据科学家的必备技能。利用这本实用指南, 想要了解Spark的人能从中学习实用的PySpark算法和示例。利用这本书, 你将学习以下内容: 了解如何选择Spark转换实现优化的解决方案。
- 510 1_ |a Data algorithms with spark |z eng
- 606 0_ |a 数据处理软件 |A shu ju chu li ruan jian
- 701 _1 |a 帕瑞斯安 |A pa rui si an |g (Parsian, Mahmoud) |4 著
- 702 _0 |a 苏金国 |A su jin guo |4 译
- 801 _0 |a CN |b 湖北三新 |c 20240604
- 905 __ |a XATU |d TP274/1084