机读格式显示(MARC)
- 010 __ |a 978-7-111-60022-0 |d CNY119.00
- 021 __ |a CN |b 01-2016-6249
- 099 __ |a CAL 012018092124
- 100 __ |a 20180718d2018 em y0chiy50 ea
- 200 1_ |a 强化学习 |A qiang hua xue xi |d = Reinforcement learning state-of-the-art |f (荷) 马可·威宁(Marco Wiering), (荷) 马丁·范·奥特罗(Martijn van Otterlo)编著 |g 赵地 ... [等] 译 |z eng
- 210 __ |a 北京 |c 机械工业出版社 |d 2018
- 215 __ |a XXI, 464页 |c 图 |d 26cm
- 225 2_ |a 智能科学与技术丛书 |A zhi neng ke xue yu ji shu cong shu
- 304 __ |a 题名页译者还有: 刘莹, 邓仰东, 欧阳建权, 苏统华
- 330 __ |a 本书分为六大部分,详细介绍了强化学习中各领域的基本理论和新进展,内容包括:MDP、动态规划、蒙特卡罗方法、批处理强化学习、TD学习、Q学习、策略迭代的小二乘法、迁移学习、贝叶斯强化学习、一阶逻辑MDP、层次式强化学习、演化计算、预测性定义状态表示、去中心化的部分可观察MDP、博弈论和多学习器强化学习等内容,并阐述强化学习与心理和神经科学、游戏领域、机器人领域的关系和应用,后提出未来发展趋势及研究热点问题,有助于年轻的研究者了解整个强化学习领域,发现新的研究方向。
- 410 _0 |1 2001 |a 智能科学与技术丛书
- 510 1_ |a Reinforcement learning state-of-the-art |z eng
- 606 0_ |a 机器学习 |A ji qi xue xi
- 701 _1 |c (荷) |a 威宁 |A wei ning |c (Wiering, Marco) |4 编著
- 701 _1 |c (荷) |a 奥特罗 |A ao te luo |c (Otterlo, Martijn van) |4 编著
- 702 _0 |a 赵地 |A zhao di |4 译
- 702 _0 |a 刘莹 |A liu ying |4 译
- 702 _0 |a 邓仰东 |A deng yang dong |4 译
- 801 _0 |a CN |b NMU |c 20180718
- 801 _2 |a CN |b PUL |c 20180912
- 905 __ |a XATU |d TP181/78