机读格式显示(MARC)
- 010 __ |a 978-7-115-48252-5 |d CNY69.00
- 021 __ |a CN |b 01-2018-2239
- 099 __ |a CAL 012018081936
- 100 __ |a 20180606d2018 em y0chiy50 ea
- 200 1_ |a Spark高级数据分析 |A Sparkgao ji shu ju fen xi |d = Advanced analytics with Spark |f (美) 桑迪·里扎 ... [等] 著 |g 龚少成, 邱鑫译 |z eng
- 210 __ |a 北京 |c 人民邮电出版社 |d 2018
- 215 __ |a xviii, 226页 |c 图 |d 24cm
- 225 2_ |a 图灵程序设计丛书 |A tu ling cheng xu she ji cong shu
- 304 __ |a 题名页题其余责任者: (美) 于里·莱瑟森, (英) 肖恩·欧文, (美) 乔希·威尔斯著
- 306 __ |a 英文原版的翻译得到O'Reilly Media, Inc.的授权 O'Reilly Media, Inc.授权人民邮电出版社出版
- 314 __ |a 桑迪·里扎 (Sandy Ryza), Spark项目代码提交者、Hadoop项目管理委员会委员, Time Series for Spark项目创始人。于里·莱瑟森 (Uri Laserson) , MIT博士毕业, 致力于用技术解决遗传学问题, 曾利用Hadoop生态系统开发了可扩展的基因组学和免疫学技术。肖恩·欧文 (Sean Owen), Spark、Mahout项目代码提交者, Spark项目管理委员会委员。现任Cloudera公司数据科学总监。龚少成, 现任万达科技集团数据工程部总经理, 清华大学自动化系研究生毕业, 国内专注企业级大数据平台建设的先驱者之一。邱鑫, 毕业于武汉大学, 目前就职于英特尔亚太研发有限公司, 是Intel大数据团队高级工程师。
- 330 __ |a 本书是使用Spark进行大规模数据分析的实战宝典, 由知名数据科学家撰写。本书在第1版的基础上, 针对Spark近年来的发展, 对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API, MLlib和Spark SQL两个子项目也发生了较大变化, 本书为关注Spark发展趋势的读者提供了与时俱进的资料, 例如Dataset和DataFrame的使用, 以及与DataFrame API高度集成的Spark ML API。
- 410 _0 |1 2001 |a 图灵程序设计丛书
- 510 1_ |a Advanced analytics with Spark |z eng
- 606 0_ |a 数据处理软件 |A shu ju chu li ruan jian
- 701 _1 |c (美) |a 里扎 |A li za |c (Ryza, Sandy) |4 著
- 701 _1 |c (美) |a 莱瑟森 |A lai se sen |c (Laserson, Uri) |4 著
- 701 _1 |c (美) |a 欧文 |A ou wen |c (Owen, Sean) |4 著
- 702 _0 |a 龚少成 |A gong shao cheng |4 译
- 702 _0 |a 邱鑫 |A qiu xin |4 译
- 801 _0 |a CN |b 湖北三新 |c 20180606
- 905 __ |a XATU |d TP274/585