《智能控制与强化学习》王鼎
在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛, 自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、 跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套 的值迭代评判学习控制理论与设计方法。首先,对 值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线 控制和在线演化控制。其次,基于迭代历史信息,提出一种新颖的收敛速度可调节的值迭代算法,有助于加快学习速度、减少计算代价, 高效地获得非线性系统的 控制律。结合人工智能技术,对无模型值迭代评判学习控制的发展前景也进行了讨论。 本书内容丰富、结构清晰、由浅入深、分析透彻,既可作为智能控制、强化学习、优化控制、计算智能、自适应与学 统等领域研究人员和学生的参考书,又可供相关领域的技术人员使用。
作者简介:王鼎,北京工业大学信息科学技术学院教授、博士生导师。先后主持国家自然科学基金优秀青年项目、北京市自然科学基金杰出青年项目、科技创新2030——“新一代人工智能”重大项目(课题)等。曾入选科睿唯安(Clarivate)全球高被引科学家、爱思唯尔(Elsevier)中国高被引学者、中国科学院青年创新促进会、中国科协青年人才托举工程,并荣获广东省自然科学奖一等奖、吴文俊人工智能优秀青年奖、中国自动化学会自然科学奖一等奖等。先后担任IEEE Transactions on Systems, Man, and Cybernetics: Systems、Neural Networks、Engineering Applications of Artificial Intelligence、International Journal of Robust and Nonlinear Control、自动化学报等权威期刊编委。