【罗】卢西恩·布索尼的图书会按更新时间持续补充,适合从代表作和同主题书继续延展阅读。
基于函数逼近的强化学习与动态规划
【罗】卢西恩·布索尼
评分 暂无
本书讨论大规模连续空间的强化学习理论及方法,重点介绍使用函数逼近的强化学习和动态规划方法。该研究已成为近年来计算机科学与技术领域中最活跃的研究分支之一。全书共分6 章。第1 章为概述;第2 章为动态规划与强化学习介绍;第3 章为大规模连续空间中的动态规划与强化学习;第4 章为基于模糊表示的近似值迭代;第5 章为用于在线学习和连续动作控制的近似策略迭代;第6 章为基于交叉熵基函数优化的近似策略