机读格式显示(MARC)
- 000 01391nam0 2200289 450
- 010 __ |a 978-7-115-52466-9 |d CNY79.00
- 099 __ |a CAL 012020033714
- 100 __ |a 20200402d2020 ekmy0chiy50 ea
- 200 1_ |a 大数据Hadoop 3.X分布式处理实战 |A da shu ju Hadoop 3.X fen bu shi chu li shi zhan |f 吴章勇, 杨强编著
- 210 __ |a 北京 |c 人民邮电出版社 |d 2020
- 215 __ |a 10, 370页 |c 图 |d 26cm
- 330 __ |a 本书以实战开发为原则,以Hadoop 3.X生态系统内的主要大数据工具整合应用及项目开发为主线,通过Hadoop大数据开发中常见的11个典型模块和3个完整项目案例,详细介绍HDFS、MapReduce、HBase、Hive、Sqoop、Spark等主流大数据工具的整合使用。本书附带资源包括本书核心内容的教学视频,本书所涉及的源代码、参考资料等。 全书共14章,分为3篇,涵盖的主要内容有Hadoop及其生态组件伪分布式安装和完全分布式安装、分布式文件系统HDFS、分布式计算框架MapReduce、NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark、海量Web日志分析系统、电商商品推荐系统、分布式垃圾消息识别系统等。
- 606 0_ |a 数据处理软件 |A shu ju chu li ruan jian
- 701 _0 |a 吴章勇 |A wu zhang yong |4 编著
- 701 _0 |a 杨强 |A yang qiang |4 编著
- 801 _0 |a CN |b 百万庄 |c 20200413
- 801 _2 |a CN |b SJT |c 20200508
- 905 __ |a XATU |d TP274/789