MARC状态:审校 文献类型:中文图书 浏览次数:39
- 题名/责任者:
- 基于函数逼近的强化学习与动态规划/(罗)卢西恩·布索尼(Lucian Busoniu)[等]著 刘全,傅启明,章宗长译
- 出版发行项:
- 北京:人民邮电出版社,2019
- ISBN及定价:
- 978-7-115-50830-0/CNY129.00
- 载体形态项:
- 249页:图;24cm
- 个人责任者:
- (罗) 布索尼 (Busoniu, Lucian) 著
- 个人次要责任者:
- 刘全 译
- 个人次要责任者:
- 傅启明 译
- 个人次要责任者:
- 章宗长 译
- 学科主题:
- 机器学习-研究
- 学科主题:
- 动态规划-研究
- 中图法分类号:
- TP181
- 题名责任附注:
- 著者还有:(荷) 罗伯特·巴布斯卡、(荷) 巴特·德·舒特、(比) 达米安·厄恩斯特
- 出版发行附注:
- 由Taylor & Francis出版集团旗下CRC出版社出版
- 责任者附注:
- 卢西恩·布索尼,荷兰代尔夫特理工大学代尔夫特系统与控制中心博士后研究员。
- 责任者附注:
- 罗伯特·巴布斯卡,荷兰代尔夫特理工大学代尔夫特系统与控制中心教授。
- 责任者附注:
- 巴特·德·舒特,荷兰代尔夫特理工大学代尔夫特系统与控制中心海洋与运输技术系教授。
- 责任者附注:
- 刘全,苏州大学教授、博士生导师。2004年毕业于吉林大学计算机软件与理论专业,获博士学位。
- 责任者附注:
- 傅启明,硕士生导师、苏州科技大学优秀青年骨干教师。
- 责任者附注:
- 章宗长,苏州大学副教授、硕士生导师,于2012年在中国科学技术大学获博士学位。
- 书目附注:
- 有书目 (第232-249页)
- 提要文摘附注:
- 本书讨论大规模连续空间的强化学习理论及方法,重点介绍使用函数逼近的强化学习和动态规划方法。该研究已成为近年来计算机科学与技术领域中最活跃的研究分支之一。全书共分6章。第1章为概述;第2章为动态规划与强化学习介绍;第3章为大规模连续空间中的动态规划与强化学习;第4章为基于模糊表示的近似值迭代;第5章为用于在线学习和连续动作控制的近似策略迭代;第6章为基于交叉熵基函数优化的近似策略搜索。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP316/830 | CN1781967 | 内阅图书 | 阅览 | 内阅图书 | |
TP316/830 | CN1781968 | 未央馆 | 可借 | 未央馆 |
显示全部馆藏信息