
在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先的值迭代评判学习控制理论与设计方法。首先,对先值迭代框架下迭代策略的稳定性行全面深的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次,基于迭代历史信息,提出一种新颖的收敛速度可调节的值迭代算法,有助于加快学习速度、减少计算代价,更高效地获得非线性系统的最优控制律。结合人工智能技术,对无模型值迭代评判学习控制的发展前景也行了讨论。 本书内容丰富、结构清晰、由浅深、分析透彻,既可作为智能控制、强化学习、优化控制、计算智能、自适应与学习系统等领域研究人员和学生的参考书,又可供相关领域的技术人员使用。<br/>【推荐语】<br/>·新一代人工智能技术基础理论著作 ·人工智能、智能控制热研究著作 本书的出版将为相关领域工作人员有效地把握先值迭代的研究动态与最新发展现状提供有益参考。 本书内容丰富、结构清晰、由浅深、分析透彻,既可作为智能控制、强化学习、优化控制、计算智能、自适应与学习系统等领域研究人员和学生的参考书,又可供相关领域的技术人员使用。<br/>【作者】<br/>王鼎,男,北京工业大学教授、博士生导师,现任计算智能与智能系统北京市实验室副主任。北京市自然科学基金杰出青年项目获得者、科睿唯安(Clarivate)全球高被引科学家、中国科协青年人才托举工程选者,主要研究方向为智能控制与智能优化、神经网络与强化学习,涉及复杂智能控制优化、人工智能理论基础。针对不确定系统优化控制中的共性难题行了长期研究攻关,建立并逐步完善智能评判控制框架,并为工业复杂系统的智能优化控制提供了理论支撑。目前已在人工智能及相关领域的国际期刊和会议上发表学术论文120余篇,其中82篇被SCI检索(以第一作者发表在IEEE Transactions系列期刊和Automatica领域顶刊的论文共25篇),已出版专著4本,申请和已授权发明专利9项。先后荣获吴文俊人工智能优秀青年奖、中国自动化学会自然科学奖一等奖、广东省自然科学奖一等奖等。先后担任人工智能及相关领域多个著名期刊的编委,包括:IEEE Transactions on Systems, Man, and Cybernetics: Systems、IEEE Transactions on Neural Networks and Learning Systems、Neural Networks、International Journal of Robust and Nonlinear Control、International Journal of Adaptive Control and Signal Processing、Neurocomputing、自动化学报。<br/>
評論0