机读格式显示(MARC)
- 000 01427nam0 2200325 450
- 010 __ |a 978-7-111-56960-2 |d CNY69.00
- 035 __ |a (A100000NLC)009169912
- 049 __ |a A100000NLC |b UCS01008642395 |c 009169912 |d NLC01
- 100 __ |a 20170823d2017 em y0chiy50 ea
- 200 1_ |a 多智能体机器学习 |A duo zhi neng ti ji qi xue xi |b 专著 |e 强化学习方法 |f (加)霍华德 M. 施瓦兹(Howard M. Schwartz)著 |g 连晓峰,谭励等译
- 210 __ |a 北京 |c 机械工业出版社 |d 2017
- 312 __ |a 封面英文原名:Multi-agent machine learning: a reinforcement approach
- 330 __ |a 全书共6章,首先介绍了几种常用的监督式学习方法,在此基础上,介绍了单智能体强化学习中的学习结构、值函数、马尔科夫决策过程、策略迭代、时间差分学习、Q学习和资格迹等概念和方法。然后,介绍了双人矩阵博弈问题、多人随机博弈学习问题,最后,介绍了群智能学习进化以及性格特征概念和应用。
- 510 1_ |a Multi-agent machine learning |e a reinforcement approach |z eng
- 517 1_ |a 强化学习方法 |9 qiang hua xue xi fang fa
- 606 0_ |a 机器学习 |A Ji Qi Xue Xi
- 701 _0 |c (加) |a 施瓦兹 |A shi wa zi |c (Schwartz, Howard M.) |4 著
- 702 _0 |a 连晓峰 |A lian xiao feng |f (1977-) |4 译
- 702 _0 |c (壮) |a 谭励 |A tan li |c (女, |f 1980-) |4 译
- 801 _2 |a CN |b OLCC |c 20171026
- 905 __ |a XATU |d TP181/213