机读格式显示(MARC)
- 000 02020nam0 2200337 450
- 010 __ |a 978-7-121-50072-5 |d CNY109.00
- 099 __ |a CAL 012025049840
- 100 __ |a 20250512d2025 ekmy0chiy50 ea
- 200 1_ |a 大模型算法 |A da mo xing suan fa |e 强化学习、微调与对齐 |d = Large Model Algorithms Reinforcement Learning, Fine-Tuning, and Alignment |f 余昌叶著
- 210 __ |a 北京 |c 电子工业出版社 |d 2025
- 215 __ |a 230页 |c 图 |d 24cm
- 225 2_ |a 通用智能与大模型丛书 |A tong yong zhi neng yu da mo xing cong shu
- 314 __ |a 余昌叶,资深算法工程师,哈尔滨工业大学优秀毕业生。曾就职于腾讯等多家一线互联网企业,拥有十年行业经验。主要研究方向为大模型、强化学习、推荐系统及图像处理。具备扎实的数学功底与深厚的算法理论基础,主导并完成多项核心技术项目的工程化落地。已获六项国家发明专利,曾荣获科研类全国航空航天模型锦标赛亚军等专业奖项,以及腾讯卓越研发奖(团队)、腾讯知识奖等多项企业级荣誉。
- 330 __ |a 本书系统地讲解了大模型技术及其后训练 (Post-Training) 相关的各类算法、实践。全书以大语言模型 (LLM) 为核心, 内容广泛且深入, 绝大部分同样适用于视觉语言模型 (VLM) 和多模态语言模型 (MLLM)。本书共10章, 第1章介绍SFT, 第2章介绍对齐算法宏观架构, 第3章介绍强化学习核心算法, 第4章介绍PPO算法, 第5章介绍RLHF, 第6章介绍DPO算法, 第7章介绍免训练的对齐和优化方法, 第8章介绍对齐算法的衍生和进化, 第9章和第10章是两个案例实践。
- 333 __ |a 《大模型算法:强化学习、微调与对齐》适合AI算法与工程领域的从业者,相关专业的学生,希望深入了解大模型技术、拥抱AI与大模型浪潮的读者阅读。
- 410 _0 |1 2001 |a 通用智能与大模型丛书
- 510 1_ |a Large Model Algorithms Reinforcement Learning, Fine-Tuning, and Alignment |z eng
- 517 0_ |a 强化学习、微调与对齐 |A qiang hua xue xi、 wei tiao yu dui qi
- 606 0_ |a 语言模型 |A yu yan mo xing |x 自然语言处理
- 701 _0 |a 余昌叶 |A yu chang ye |4 著
- 801 _0 |a CN |b YYNU |c 20250512
- 905 __ |a XATU |d TP391/384