机读格式显示(MARC)
- 000 01411nam0 2200277 450
- 010 __ |a 978-7-5690-4538-3 |d CNY68.00
- 099 __ |a CAL 012021124342
- 100 __ |a 20211105d2021 em y0chiy50 ea
- 200 1_ |a 文本挖掘与Python实践 |A wen ben wa jue yu python shi jian |f 刘金花著
- 210 __ |a 成都 |c 四川大学出版社 |d 2021
- 215 __ |a 204页 |c 图 |d 26cm
- 320 __ |a 有书目 (第203-204页)
- 330 __ |a 本书从文本数据具有的特点以及文本挖掘具有的价值和意义开始,讲解了文本数据的获取和预处理的方法(包括中英文的文本预处理),给出了文本向量化表示方法。本书从统计机器学习方法和深度神经网络两个角度,介绍了包括向量空间模型以及词、句子和文档级的分布式表示;针对文本分类问题,介绍了传统文本分类方法、深度神经网络分类方法和文本分类的评价指标;针对文本聚类,包括文档相似度度量方法,介绍了基于划分、层次、密度的基础性聚类算法,以及谱聚类等高级聚类方法和文本聚类的评价指标;在理论学习的基础上,介绍了文本主题的挖掘技术,包括潜在语义分析、非负矩阵分解、概率潜在语义分析和潜在狄利克雷分布等;最后从文本内容、主题和基于时间信息三个方面介绍了文本数据可视化的方法与工具。
- 606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计
- 701 _0 |a 刘金花 |A Liu Jinhua |f 1987- |4 著
- 801 _0 |a CN |b ZJUT |c 20211105
- 905 __ |a XATU |d TP311.561/575