机读格式显示(MARC)
- 010 __ |a 978-7-111-73956-2 |d CNY99.00
- 099 __ |a CAL 012024008470
- 100 __ |a 20240103e20242023em y0chiy50 ea
- 200 1_ |a ChatGPT原理与架构 |A ChatGPT yuan li yu jia gou |e 大模型的预训练、迁移和中间件编程 |f 程戈著
- 210 __ |a 北京 |c 机械工业出版社 |d 2023 |h 2024重印
- 215 __ |a 210页 |c 图 |d 24cm
- 225 2_ |a 智能系统与技术丛书 |A zhi neng xi tong yu ji shu cong shu
- 314 __ |a 程戈,博士生导师,湘潭大学计算机学院·网络空间安全学院教授,湘潭大学技术转移中心副主任,湘潭市京东智能城市与大数据研究院副院长。
- 330 __ |a 本书讲解ChatGPT及其相关技术。全书共11章,第1章深入分析了大语言模型的技术演化、技术栈等。第2章详细阐述了Transformer模型的理论基础和主要组件。第3章深入解析了GPT的生成式预训练的过程和原理。第4章主要探讨了GPT-2的层归一化、正交初始化和可逆的分词方法等技术,并详细分析了GPT-2的自回归生成过程。第5章介绍了GPT-3的稀疏注意力模式、元学习和基于内容的学习等技术,并对贝叶斯推断在概念分布中的应用进行了深入讨论。第6章详细介绍了大语言模型的预训练数据集和数据处理方法,同时阐述了分布式训练模式和技术路线。第7章深入解析了PPO算法的基本原理。第8章主要阐述了人类反馈强化学习的微调数据集以及PPO在InstructGPT中的应用。第9章深入探讨了大语言模型在低算力环境中的应用策略。第10章主要介绍了在大语言模型开发中涉及的中间件编程技术。第11章对大语言模型的发展趋势进行了预测和展望。
- 410 _0 |1 2001 |a 智能系统与技术丛书
- 517 1_ |a 大模型的预训练、迁移和中间件编程 |A da mo xing de yu xun lian、 qian yi he zhong jian jian bian cheng
- 606 0_ |a 人工智能 |A ren gong zhi neng
- 701 _0 |a 程戈 |A cheng ge |4 著
- 801 _0 |a CN |b 百万庄 |c 20240103
- 905 __ |a XATU |d TP18/695