杨敬文 腾讯游戏AI研究中心高级算法研究员。毕业于南京大学机器学习与数据挖掘研究所,获南京大学“优秀毕业生”称号、南京大学计算机优秀硕士毕业论文奖。曾获全国大学生大数据竞赛第yi名,在国际顶会发表多篇论文和技术文章。长期从事强化学习在游戏领域的研究与应用,是竞速类、格斗类、射击类、多人在线战术竞技类等强化学习AI项目的主要负责人之一,具有丰厚的强化学习研究和落地的经验。
深度强化学习核心算法与应用
陈世勇,苏博览,杨敬文
评分 暂无
强化学习是实现决策智能的主要途径之一。经历数十年的发展,强化学习领域已经枝繁叶茂,技术内容纷繁复杂,这也为初学者快速入门造成障碍。本书是一本深度强化学习领域的入门读物。全书分为四部分。第一部分主要阐述强化学习领域的基本理论知识;第二部分讲解深度强化学习常用算法的原理、各算法之间的继承与发展,以及各自的算法流程;第三部分总结深度强化学习算法在游戏、推荐系统等领域的应用;第四部分探讨了该领域存在的问题