MARC状态:审校 文献类型:中文图书 浏览次数:3
- 题名/责任者:
- 大模型算法:强化学习、微调与对齐/余昌叶著
- 出版发行项:
- 北京:电子工业出版社,2025
- ISBN及定价:
- 978-7-121-50072-5/CNY109.00
- 载体形态项:
- 230页:图;24cm
- 其它题名:
- 强化学习、微调与对齐
- 丛编项:
- 通用智能与大模型丛书
- 个人责任者:
- 余昌叶 著
- 学科主题:
- 语言模型-自然语言处理
- 中图法分类号:
- TP391
- 责任者附注:
- 余昌叶,资深算法工程师,哈尔滨工业大学优秀毕业生。曾就职于腾讯等多家一线互联网企业,拥有十年行业经验。主要研究方向为大模型、强化学习、推荐系统及图像处理。具备扎实的数学功底与深厚的算法理论基础,主导并完成多项核心技术项目的工程化落地。已获六项国家发明专利,曾荣获科研类全国航空航天模型锦标赛亚军等专业奖项,以及腾讯卓越研发奖(团队)、腾讯知识奖等多项企业级荣誉。
- 提要文摘附注:
- 本书系统地讲解了大模型技术及其后训练 (Post-Training) 相关的各类算法、实践。全书以大语言模型 (LLM) 为核心, 内容广泛且深入, 绝大部分同样适用于视觉语言模型 (VLM) 和多模态语言模型 (MLLM)。本书共10章, 第1章介绍SFT, 第2章介绍对齐算法宏观架构, 第3章介绍强化学习核心算法, 第4章介绍PPO算法, 第5章介绍RLHF, 第6章介绍DPO算法, 第7章介绍免训练的对齐和优化方法, 第8章介绍对齐算法的衍生和进化, 第9章和第10章是两个案例实践。
- 使用对象附注:
- 《大模型算法:强化学习、微调与对齐》适合AI算法与工程领域的从业者,相关专业的学生,希望深入了解大模型技术、拥抱AI与大模型浪潮的读者阅读。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP391/384 | CN1929798 | ![]() |
阅览 | 内阅图书 | |
TP391/384 | CN1929799 | ![]() |
新书:正在上架 | 未央馆 | |
TP391/384 | CN1929800 | ![]() |
新书:正在上架 | 未央馆 |
显示全部馆藏信息