关于我们
书单推荐
新书推荐
|
Joy RL 读者对象:机器学习人员
本书是《EasyRL:强化学习教程》的配套实践教程。本书将在第一版的基础上以更加严谨的风格深入浅出地介绍马尔可夫决策过程、蒙特卡罗方法、时序差分方法、Sarsa、Q-learning等传统强化学习算法,以及策略梯度、近端策略优化、深度Q网络、深度确定性策略梯度等常见深度强化学习算法的基本概念和方法,并以大量生动有趣的例子帮助读者理解强化学习问题的建模过程以及核心算法的细节。同时,增加最大熵学习、多智能体学习、离线强化学习等内容,极大丰富强化学习的入门内容。
你还可能感兴趣
我要评论
|