MARC状态:审校 文献类型:中文图书 浏览次数:1
- 题名/责任者:
- 强化学习算法入门/(日) 曾我部东马著 段琼译
- 出版发行项:
- 北京:中国水利水电出版社,2024
- ISBN及定价:
- 978-7-5226-1761-9/CNY69.80
- 载体形态项:
- 175页:图;21cm
- 并列正题名:
- Reinforcement lerning
- 丛编项:
- 智博人工智能技术丛书
- 个人责任者:
- 曾我部东马 著
- 个人次要责任者:
- 段琼 译
- 学科主题:
- 机器学习-算法
- 中图法分类号:
- TP181
- 相关题名附注:
- 封面题副题名:从“平均值”开始的强化学习算法基础及应用
- 责任者附注:
- 曾我部东马,理学博士 (物理学专业)。曾任马克斯·普朗克研究所 (德国) 博士研究员、剑桥大学 (英国) 研究员。
- 书目附注:
- 有书目 (第174-175页)
- 提要文摘附注:
- 本书的目的就是为了消除这种高门槛,并通过使用初级数学中的“平均值”等概念,对强化学习中的“价值”“探索”和“马尔可夫性”等基本概念进行浅显易懂的解释。 对于每个算法,本书将使用“多臂老虎机问题”或“网格世界问题”中的一个,以易于比较的状态进行解释,这样,可以让读者更直观地理解各算法的特点和差异。此外,对于核心算法,本书提供了使用Python和MATLAB编写的两种类型的代码,通过运行这些代码,可以让读者直观地理解“原理→公式→程序”的一系列流程。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP181/428 | CN1928733 | ![]() |
阅览 | 内阅图书 | |
TP181/428 | CN1928734 | ![]() |
可借 | 未央馆 | |
TP181/428 | CN1928735 | ![]() |
可借 | 未央馆 |
显示全部馆藏信息