机读格式显示(MARC)
- 000 01420nam0 2200289 450
- 010 __ |a 978-7-111-63177-4 |d CNY89.00
- 035 __ |a (A100000NLC)010365039
- 049 __ |a A100000NLC |b UCS01009766986 |c 010365039 |d NLC01
- 100 __ |a 20190819d2019 em y0chiy50 ea
- 200 1_ |a 强化学习 |A qiang hua xue xi |b 专著 |e 原理与Python实现 |d Reinforcement learning |e theory and Python implementation |f 肖智清著 |z eng
- 210 __ |a 北京 |c 机械工业出版社 |d 2019
- 215 __ |a 239页 |c 图 |d 24cm
- 225 1_ |a 智能系统与技术丛书 |A Zhi Neng Xi Tong Yu Ji Shu Cong Shu
- 330 __ |a 本书共12章。第1章介绍强化学习的基础知识与强化学习环境库Gym的使用,并给出完整的编程实例。第2~9章介绍强化学习的理论知识。以Markov决策过程为基础模型,覆盖了所有主流强化学习理论和算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。所有章节都提供了与算法配套的Python程序,使读者完全掌握强化学习算法的原理与应用。第10~12章介绍了多个热门综合案例,包括电动游戏、棋盘游戏和自动驾驶。算法部分涵盖了在《自然》《科学》等权威期刊上发表的多个深度强化学习明星算法。
- 510 1_ |a Reinforcement learning |e theory and Python implementation |z eng
- 606 0_ |a 机器学习 |A Ji Qi Xue Xi |x 算法
- 701 _0 |a 肖智清 |A xiao zhi qing |4 著
- 801 _2 |a CN |b OLCC |c 20191030
- 905 __ |a XATU |d TP181/122