机读格式显示(MARC)
- 000 01836nam0 2200361 450
- 010 __ |a 978-7-115-63395-8 |d CNY139.80
- 099 __ |a CAL 012024037107
- 100 __ |a 20240402d2024 em y0chiy50 ea
- 200 1_ |a 智能控制与强化学习先进值迭代评判设计 |A zhi neng kong zhi yu qiang hua xue xi xian jin zhi die dai ping pan she ji |d = Intelligent control and reinforcement learning advanced value iteration critic design |f 王鼎等[等]著 |z eng
- 210 __ |a 北京 |c 人民邮电出版社 |d 2024
- 215 __ |a 236页 |c 图 |d 23cm
- 304 __ |a 题名页题其余责任者:赵明明、哈明鸣、任进
- 314 __ |a 王鼎,北京工业大学教授、博士生导师,现任计算智能与智能系统北京市重点实验室副主任。北京市自然科学基金杰出青年项目获得者。
- 330 __ |a 本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次,基于迭代历史信息,提出一种新颖的收敛速度可调节的值迭代算法,有助于加快学习速度、减少计算代价,更高效地获得非线性系统的最优控制律。结合人工智能技术,对无模型值迭代评判学习控制的发展前景也进行了讨论。
- 510 1_ |a Intelligent control and reinforcement learning advanced value iteration critic design |z eng
- 606 0_ |a 智能控制 |A zhi neng kong zhi
- 606 0_ |a 机器学习 |A ji qi xue xi
- 701 _0 |a 王鼎 |A wang ding |4 著
- 701 _0 |a 赵明明 |A zhao ming ming |4 著
- 701 _0 |a 哈明鸣 |A ha ming ming |4 著
- 801 _0 |a CN |b NMU |c 20240412
- 905 __ |a XATU |d TP273/788