机读格式显示(MARC)

000 02293cam 2200625 450

001 0000327084

005 20181225101500.0

010 __ |a 978-7-111-60022-0 |d CNY119.00

021 __ |a CN |b 01-2016-6249

099 __ |a CAL 012018092124

100 __ |a 20180718d2018 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a a a 001yy

106 __ |a r

200 1_ |a 强化学习 |A qiang hua xue xi |d = Reinforcement learning state-of-the-art |f (荷) 马可·威宁(Marco Wiering), (荷) 马丁·范·奥特罗(Martijn van Otterlo)编著 |g 赵地 ... [等] 译 |z eng

210 __ |a 北京 |c 机械工业出版社 |d 2018

215 __ |a XXI, 464页 |c 图 |d 26cm

225 2_ |a 智能科学与技术丛书 |A zhi neng ke xue yu ji shu cong shu

300 __ |a 华章科技

304 __ |a 题名页译者还有: 刘莹, 邓仰东, 欧阳建权, 苏统华

320 __ |a 有书目和索引

330 __ |a 本书分为六大部分，详细介绍了强化学习中各领域的基本理论和新进展，内容包括：MDP、动态规划、蒙特卡罗方法、批处理强化学习、TD学习、Q学习、策略迭代的小二乘法、迁移学习、贝叶斯强化学习、一阶逻辑MDP、层次式强化学习、演化计算、预测性定义状态表示、去中心化的部分可观察MDP、博弈论和多学习器强化学习等内容，并阐述强化学习与心理和神经科学、游戏领域、机器人领域的关系和应用，后提出未来发展趋势及研究热点问题，有助于年轻的研究者了解整个强化学习领域，发现新的研究方向。

410 _0 |1 2001 |a 智能科学与技术丛书

510 1_ |a Reinforcement learning state-of-the-art |z eng

606 0_ |a 机器学习 |A ji qi xue xi

690 __ |a TP181 |v 5

701 _1 |c (荷) |a 威宁 |A wei ning |c (Wiering, Marco) |4 编著

701 _1 |c (荷) |a 奥特罗 |A ao te luo |c (Otterlo, Martijn van) |4 编著

702 _0 |a 赵地 |A zhao di |4 译

702 _0 |a 刘莹 |A liu ying |4 译

702 _0 |a 邓仰东 |A deng yang dong |4 译

801 _0 |a CN |b NMU |c 20180718

801 _2 |a CN |b PUL |c 20180912

905 __ |a XATU |d TP181/78

920 __ |a 211010 |z 1

920 __ |a 215010 |z 1

920 __ |a 231020 |z 1

920 __ |a 221020 |z 1

920 __ |a 211030 |z 1

920 __ |a 244020 |z 2

920 __ |a 237010 |z 1

920 __ |a 211060 |z 2

920 __ |a 222010 |z 1

920 __ |a 231220 |z 2

920 __ |a 245010 |z 1

920 __ |a 242120 |z 1

920 __ |a 211320 |z 1

920 __ |a 212020 |z 1

920 __ |a 232010 |z 1

920 __ |a 261030 |z 1

920 __ |a 235010 |z 1

920 __ |a 232370 |z 1

920 __ |a 211260 |z 1

998 __ |a NMU