杨毅远的作品

杨毅远

杨毅远清华大学硕士在读， Datawhale成员。主要研究方向为时空数据挖掘、智能传感系统、深度学习。曾获全国大学生智能汽车竞赛总冠军、中国国家奖学金，发表SCI/EI论文7篇，其中以第一作者身份在SCI的Q1区、Q2区及中国计算机学会（CCF）A、B类会议中发表论文4篇。江季北京大学硕士在读， Datawhale成员。主要研究方向为强化学习、机器人。曾获大学生电子设计竞赛——2018年嵌入式系统专题邀请赛（英特尔杯）一等奖，发表顶会论文1篇、专利2项。

Easy RL：强化学习教程

王琦, 杨毅远, 江季

评分 8.5分

强化学习作为机器学习及人工智能领域的一种重要方法，在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。本书结合了李宏毅老师的“深度强化学习”、周博磊老师的“强化学习纲要”、李科浇老师的“世界冠军带你从零实践强化学习”公开课的精华内容，在理论严谨的基础上深入浅出地介绍马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa、Q 学习等传统强化学习算法，以及策略梯度、近端策略优化、深度Q 网络、

杨毅远

围绕这位作者继续看

常见主题

计算机深度学习机器学习强化学习实践人工智能