MARC状态:审校 文献类型:中文图书 浏览次数:3
- 题名/责任者:
- 深度剖析DeepSeek大模型:原理、开发与优化部署/丁小晶, 崔远编著
- 出版发行项:
- 北京:机械工业出版社,2025
- ISBN及定价:
- 978-7-111-77922-3/CNY119.00
- 载体形态项:
- XII, 312页:图;24cm
- 丛编项:
- AIGC与大模型技术丛书
- 个人责任者:
- 丁小晶 编著
- 个人责任者:
- 崔远 编著
- 学科主题:
- 人工智能
- 中图法分类号:
- TP18
- 一般附注:
- 机工IT CMP BOOKS
- 责任者附注:
- 丁小晶,资深大模型AI应用技术专家与管理者,拥有超过15年的计算机及AI领域经验、5年团队管理经验的技术创新与项目管理复合型人才,精通大模型技术及多语言编程,致力于AI大模型的应用和创新。
- 责任者附注:
- 崔远,毕业于兰州大学,副教授,主攻人工智能 (Al)、自然语言处理 (NLP) 和深度学习等计算机前沿技术,并致力于教学研究,承担多门专业核心课程的教学工作。
- 提要文摘附注:
- 本书共分为12章,首先介绍大模型的基础知识与发展历程,从神经网络的起源到大规模预训练模型的演化,再到Transformer、BERT与GPT等模型架构的深入剖析,帮助读者理解大模型的技术基石。其次详细解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术,包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践,介绍API调用、上下文拼接、模型微调、知识蒸馏等关键技术,并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用,如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP18/754 | CN1925293 | ![]() |
在编 | 采编中心 | |
TP18/754 | CN1925294 | ![]() |
在编 | 采编中心 | |
TP18/754 | CN1925295 | ![]() |
在编 | 采编中心 |
显示全部馆藏信息