<p>本书讨论大规模连续空间的强化学习理论及方法，重点介绍使用函数逼近的强化学习和动态规划方法。该研究已成为近年来计算机科学与技术领域中最活跃的研究分支之一。全书共分6 章。第1 章为概述；第2 章为动态规划与强化学习介绍；第3 章为大规模连续空间中的动态规划与强化学习；第4 章为基于模糊表示的近似值迭代；第5 章为用于在线学习和连续动作控制的近似策略迭代；第6 章为基于交叉熵基函数优化的近似策略搜索。本书可以作为理工科高等院校计算机专业和自动控制专业研究生的教材，也可以作为相关领域科技工作者和工程技术人员的参考书。</p>

基于函数逼近的强化学习与动态规划

历史上最美的10个实验

勾股定理

Linux程序设计

随机过程

如何打造读书IP

认知异化

这就是GEO

豆包AI赚钱手册

韧性练习

成为了不起的自己

《基于函数逼近的强化学习与动态规划》 - 【罗】卢西恩·布索尼 | 无名图书

WebKit