机读格式显示(MARC)
- 000 01110nam0 2200265 450
- 010 __ |a 978-7-302-57508-5 |d CNY79.00
- 099 __ |a CAL 012021024653
- 100 __ |a 20210319d2021 em y0chiy50 ea
- 200 1_ |a Python大数据处理库PySpark实战 |A Python da shu ju chu li ku PySpark shi zhan |f 汪明著
- 210 __ |a 北京 |c 清华大学出版社 |d 2021
- 215 __ |a 310页 |c 图 |d 26cm
- 330 __ |a 本书分为7章,章介绍大数据的基本概念、常用的大数据分析工具;第2章介绍Spark作为大数据处理的特点和算法;第3章介绍Spark实战环境的搭建,涉及Windows和Linux操作系统;第4章介绍如何灵活应用PySpark对数据进行操作;第5章介绍PySpark ETL处理,涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容;第6章介绍PySpark如何利用MLlib库进行分布式机器学习(Titanic幸存者预测);第7章介绍一个PySpark和Kafka结合的实时项目。
- 606 0_ |a 数据处理 |A shu ju chu li
- 701 _0 |a 汪明 |A wang ming |4 著
- 801 _0 |a CN |b NMU |c 20210319
- 905 __ |a XATU |d TP274/878