MARC状态:审校 文献类型:中文图书 浏览次数:22
- 题名/责任者:
- Python大数据处理库PySpark实战/汪明著
- 出版发行项:
- 北京:清华大学出版社,2021
- ISBN及定价:
- 978-7-302-57508-5/CNY79.00
- 载体形态项:
- 310页:图;26cm
- 个人责任者:
- 汪明 著
- 学科主题:
- 数据处理
- 中图法分类号:
- TP274
- 提要文摘附注:
- 本书分为7章,章介绍大数据的基本概念、常用的大数据分析工具;第2章介绍Spark作为大数据处理的特点和算法;第3章介绍Spark实战环境的搭建,涉及Windows和Linux操作系统;第4章介绍如何灵活应用PySpark对数据进行操作;第5章介绍PySpark ETL处理,涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容;第6章介绍PySpark如何利用MLlib库进行分布式机器学习(Titanic幸存者预测);第7章介绍一个PySpark和Kafka结合的实时项目。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP274/878 | CN1865793 | 内阅图书 | 阅览 | 内阅图书 | |
TP274/878 | CN1865794 | 未央馆 | 可借 | 未央馆 | |
TP274/878 | CN1865795 | 未央馆 | 可借 | 未央馆 |
显示全部馆藏信息