机读格式显示(MARC)

000 01420nam0 2200289 450

001 0000367121

005 20191118095800.0

010 __ |a 978-7-111-63177-4 |d CNY89.00

035 __ |a (A100000NLC)010365039

049 __ |a A100000NLC |b UCS01009766986 |c 010365039 |d NLC01

100 __ |a 20190819d2019 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 强化学习 |A qiang hua xue xi |b 专著 |e 原理与Python实现 |d Reinforcement learning |e theory and Python implementation |f 肖智清著 |z eng

210 __ |a 北京 |c 机械工业出版社 |d 2019

215 __ |a 239页 |c 图 |d 24cm

225 1_ |a 智能系统与技术丛书 |A Zhi Neng Xi Tong Yu Ji Shu Cong Shu

330 __ |a 本书共12章。第1章介绍强化学习的基础知识与强化学习环境库Gym的使用，并给出完整的编程实例。第2~9章介绍强化学习的理论知识。以Markov决策过程为基础模型，覆盖了所有主流强化学习理论和算法，包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。所有章节都提供了与算法配套的Python程序，使读者完全掌握强化学习算法的原理与应用。第10~12章介绍了多个热门综合案例，包括电动游戏、棋盘游戏和自动驾驶。算法部分涵盖了在《自然》《科学》等权威期刊上发表的多个深度强化学习明星算法。

510 1_ |a Reinforcement learning |e theory and Python implementation |z eng

606 0_ |a 机器学习 |A Ji Qi Xue Xi |x 算法

690 __ |a TP181 |v 5

701 _0 |a 肖智清 |A xiao zhi qing |4 著

801 _2 |a CN |b OLCC |c 20191030

905 __ |a XATU |d TP181/122

920 __ |a 261060 |z 1