机读格式显示(MARC)
- 000 01911nam0 2200361 450
- 010 __ |a 978-7-111-70072-2 |d CNY89.00
- 021 __ |a CN |b 01-2020-3794
- 049 __ |a O350200XMW |b UCS01011036886 |c 011036886
- 100 __ |a 20220603d2022 em y0chiy50 ea
- 200 1_ |a Python深度强化学习入门 |A Python Shen Du Qiang Hua Xue Xi Ru Men |e 强化学习和深度学习的搜索与控制 |f (日)伊藤多一[等]著 |g 王卫兵, 杨秋香等译
- 210 __ |a 北京 |c 机械工业出版社 |d 2022
- 215 __ |a 11,239页 |d 25cm
- 304 __ |a 著者还有:(日)今津义充、(日)须藤广大、(日)仁平将人、(日)川崎悠介、(日)酒井裕企等6人
- 330 __ |a 本书共7章。第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念;第2章通过强化学习的基本概念、马尔可夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法;第3章通过深度学习、卷积神经网络(CNN)、循环神经网络(RNN)介绍了强化学习中深度学习的特征提取方法;第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现;第5章通过策略梯度法的连续控制、学习算法和策略模型等,介绍了深度强化学习在连续控制问题中的应用及具体实现;第6章通过巡回推销员问题和魔方问题介绍了深度强化学习在组合优化中的应用及具体实现;第7章通过SeqGAN的文本生成和神经网络架构的搜索介绍了深度强化学习在时间序列数据生成的应用。
- 517 1_ |a 强化学习和深度学习的搜索与控制 |A qiang hua xue xi he shen du xue xi de sou suo yu kong zhi
- 606 0_ |a 软件工具 |A Ruan Jian Gong Ju |x 程序设计
- 701 _0 |c (日) |a 伊藤多一 |A Yi Teng Duo Yi |4 著
- 702 _0 |a 王卫兵 |A Wang Wei Bing |4 译
- 702 _0 |a 杨秋香 |A Yang Qiu Xiang |4 译
- 801 _2 |a CN |b OLCC |c 20220621
- 801 _2 |a CN |b O350200XMW |c 20220607
- 801 _0 |a CN |b XIBC |c 20220603
- 905 __ |a XATU |d TP311.561/658