机读格式显示(MARC)

000 01427nam0 2200325 450

001 0000278084

005 20201222095000.0

010 __ |a 978-7-111-56960-2 |d CNY69.00

035 __ |a (A100000NLC)009169912

049 __ |a A100000NLC |b UCS01008642395 |c 009169912 |d NLC01

100 __ |a 20170823d2017 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a y z 000yy

106 __ |a r

200 1_ |a 多智能体机器学习 |A duo zhi neng ti ji qi xue xi |b 专著 |e 强化学习方法 |f (加)霍华德 M. 施瓦兹(Howard M. Schwartz)著 |g 连晓峰，谭励等译

210 __ |a 北京 |c 机械工业出版社 |d 2017

215 __ |a 185页 |d 24cm

312 __ |a 封面英文原名：Multi-agent machine learning: a reinforcement approach

330 __ |a 全书共6章，首先介绍了几种常用的监督式学习方法，在此基础上，介绍了单智能体强化学习中的学习结构、值函数、马尔科夫决策过程、策略迭代、时间差分学习、Q学习和资格迹等概念和方法。然后，介绍了双人矩阵博弈问题、多人随机博弈学习问题，最后，介绍了群智能学习进化以及性格特征概念和应用。

510 1_ |a Multi-agent machine learning |e a reinforcement approach |z eng

517 1_ |a 强化学习方法 |9 qiang hua xue xi fang fa

606 0_ |a 机器学习 |A Ji Qi Xue Xi

690 __ |a TP181 |v 5

701 _0 |c (加) |a 施瓦兹 |A shi wa zi |c (Schwartz, Howard M.) |4 著

702 _0 |a 连晓峰 |A lian xiao feng |f (1977-) |4 译

702 _0 |c (壮) |a 谭励 |A tan li |c (女， |f 1980-) |4 译

801 _2 |a CN |b OLCC |c 20171026

905 __ |a XATU |d TP181/213

920 __ |a 261060 |z 1