西安工业大学图书馆书目检索系统

| 暂存书架(0) | 登录

MARC状态:审校 文献类型:中文图书 浏览次数:3

题名/责任者:
大模型算法:强化学习、微调与对齐/余昌叶著
出版发行项:
北京:电子工业出版社,2025
ISBN及定价:
978-7-121-50072-5/CNY109.00
载体形态项:
230页:图;24cm
并列正题名:
Large Model Algorithms Reinforcement Learning, Fine-Tuning, and Alignment
其它题名:
强化学习、微调与对齐
丛编项:
通用智能与大模型丛书
个人责任者:
余昌叶
学科主题:
语言模型-自然语言处理
中图法分类号:
TP391
责任者附注:
余昌叶,资深算法工程师,哈尔滨工业大学优秀毕业生。曾就职于腾讯等多家一线互联网企业,拥有十年行业经验。主要研究方向为大模型、强化学习、推荐系统及图像处理。具备扎实的数学功底与深厚的算法理论基础,主导并完成多项核心技术项目的工程化落地。已获六项国家发明专利,曾荣获科研类全国航空航天模型锦标赛亚军等专业奖项,以及腾讯卓越研发奖(团队)、腾讯知识奖等多项企业级荣誉。
提要文摘附注:
本书系统地讲解了大模型技术及其后训练 (Post-Training) 相关的各类算法、实践。全书以大语言模型 (LLM) 为核心, 内容广泛且深入, 绝大部分同样适用于视觉语言模型 (VLM) 和多模态语言模型 (MLLM)。本书共10章, 第1章介绍SFT, 第2章介绍对齐算法宏观架构, 第3章介绍强化学习核心算法, 第4章介绍PPO算法, 第5章介绍RLHF, 第6章介绍DPO算法, 第7章介绍免训练的对齐和优化方法, 第8章介绍对齐算法的衍生和进化, 第9章和第10章是两个案例实践。
使用对象附注:
《大模型算法:强化学习、微调与对齐》适合AI算法与工程领域的从业者,相关专业的学生,希望深入了解大模型技术、拥抱AI与大模型浪潮的读者阅读。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP391/384 CN1929798   内阅图书     阅览 内阅图书
TP391/384 CN1929799   未央馆     新书:正在上架 未央馆
TP391/384 CN1929800   未央馆     新书:正在上架 未央馆
显示全部馆藏信息
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架