机读格式显示(MARC)
- 000 01678nam0 2200385 450
- 010 __ |a 978-7-111-64812-3 |d CNY45.00
- 021 __ |a CN |b 01-2018-3145
- 099 __ |a CAL 012020059061
- 100 __ |a 20200514d2020 em y0chiy50 ea
- 200 1_ |a TensorFlow强化学习快速入门指南 |A TensorFlow qiang hua xue xi kuai su ru men zhi nan |e 使用Python动手搭建自学习的智能体 |f (美) 考希克·巴拉克里希南著(Kaushik Balakrishnan) |g 赵卫东译
- 210 __ |a 北京 |c 机械工业出版社 |d 2020
- 215 __ |a XII, 108页 |c 图 |d 24cm
- 225 2_ |a 大数据丛书 |A da shu ju cong shu
- 306 __ |a 由Packt Publishing Ltd授权出版 本书限中国大陆发行
- 330 __ |a 本书首先介绍了强化学习的基本原理,然后介绍典型的强化学习算法,包括时序差分、SARSA、Q-Learning、DeepQ-network、Double DQN、竞争网络结构、Rainbow、Actor-Critic、A2C、A3C、TRPO和PPO等,每种算法基本上利用了主流的开源机器学习框架TensorFlow,使用Python编程进行实现。
- 333 __ |a 本书适用于对强化学习感兴趣的普通高校师生以及相关专业人员
- 510 1_ |a TensorFlow reinforcement learning quick start guide |z eng
- 517 1_ |a 使用Python动手搭建自学习的智能体 |A shi yong Python dong shou da jian zi xue xi de zhi neng ti
- 606 0_ |a 人工智能 |A ren gong zhi neng |x 算法
- 701 _1 |c (美) |a 巴拉克里希南 |A ba la ke li xi nan |c (Balakrishnan, Kaushik) |4 著
- 702 _0 |a 赵卫东 |A zhao wei dong |4 译
- 801 _0 |a CN |b WHUTL |c 20200622
- 905 __ |a XATU |d TP18/421