机读格式显示(MARC)
- 010 __ |a 978-7-111-77687-1 |d CNY109.00
- 021 __ |a CN |b 01-2024-4607
- 099 __ |a CAL 012025058568
- 100 __ |a 20250521d2025 em y0chiy50 ea
- 200 1_ |a 多智能体强化学习 |A duo zhi neng ti qiang hua xue xi |e 基础与现代方法 |f (德) 斯特凡诺·V. 阿尔布莱希特(Stefano V. Albrecht), (希) 菲利波斯·克里斯蒂安诺斯(Filippos Christianos), (德) 卢卡斯·舍费尔(Lukas Schafer)著 |d = Multi-agent reinforcement learning |e foundations and modern approaches |f Stefano V. Albrecht, Filippos Christianos, Lukas Schafer |g 孙罗洋, 李欣然, 张海峰译 |z eng
- 210 __ |a 北京 |c 机械工业出版社 |d 2025
- 215 __ |a XII, 241页 |c 图 |d 24cm
- 225 2_ |a 智能系统与技术丛书 |A zhi neng xi tong yu ji shu cong shu
- 306 __ |a 本书中文简体字版由MIT Press通过Bardon-Chinese Media Agency授权机械工业出版社在中国大陆地区(不包括香港、澳门特别行政区及台湾地区)独家出版发行
- 314 __ |a 斯特凡诺·V. 阿尔布莱希特(Stefano V. Albrecht),爱丁堡大学信息学院人工智能专业副教授,并担任该校自主智能体研究组负责人,同时是英国皇家工程院工业研究员、阿兰·图灵研究所多智能体系统研究团队领军学者。
- 314 __ |a 菲利波斯·克里斯蒂安诺斯(Filippos Christianos),多智能体深度强化学习领域的研究科学家,主要研究如何高效地使用MARL算法。
- 314 __ |a 卢卡斯·舍费尔(Lukas Sch?fer),多智能体强化学习领域的一位资深研究人员,专注于利用深度强化学习完成更具通用性、鲁棒性和样本效率的决策制定。
- 320 __ |a 有书目 (第224-241页)
- 330 __ |a 本书系统性地总结了多智能体强化学习(MARL)的研究脉络,介绍了多智能体强化学习中的模型、求解、算法思想和技术挑战,并描述了将深度学习技术与多智能体强化学习整合以产生强大新算法的现代方法。本书的内容主要分为两部分:第一部分介绍MARL中的基本概念和基础知识;第二部分介绍基于深度学习技术的前沿MARL研究。本书不仅涵盖坚实的基础理论,还在实践层面展示了将复杂概念转化为应用方案的方法。通过具体的算法实践,读者可以加深对理论知识的理解。
- 410 _0 |1 2001 |a 智能系统与技术丛书
- 510 1_ |a Multi-agent reinforcement learning |e foundations and modern approaches |z ger
- 606 0_ |a 智能系统 |A zhi neng xi tong |x 研究
- 701 _1 |a 阿尔布莱希特 |A Aerbulaixite |g (Albrecht, Stefano V.) |4 著
- 701 _1 |a 克里斯蒂安诺斯 |A Kelisidiannuosi |g (Christianos, Filippos) |4 著
- 701 _1 |a 舍费尔 |A Shefeier |g (Sch?fer, Lukas) |4 著
- 702 _0 |a 孙罗洋 |A Sun Luoyang |4 译
- 702 _0 |a 李欣然 |A Li Xinran |4 译
- 702 _0 |a 张海峰 |A Zhang Haifeng |4 译
- 801 _0 |a CN |b NMU |c 20250528
- 905 __ |a XATU |d TP18/843