
强化学习作为机器学习及人工智能领域的一种重要方法,在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。 本书结合了李宏毅老师的“深度强化学习”、周博磊老师的“强化学习纲要”、李科浇老师的“世界冠军带你从零实践强化学习”公课的精华内容,在理论严谨的基础上深浅出地介绍马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa、Q 学习等传统强化学习算法,以及策略梯度、近端策略优化、深度Q 网络、深度确定性策略梯度等常见深度强化学习算法的基本概念和方法,并以大量生动有趣的例子帮助读者理解强化学习问题的建模过程以及核心算法的细节。 此外,本书还提供习题解答以及Python 代码实现,可以让读者行端到端、从理论到轻松实践的全生态学习,充分掌握强化学习算法的原理并能行实战。 本书适合对强化学习感兴趣的读者阅读,也可以作为相关课程的配套教材。<br/>【推荐语】<br/>(1)萃取强化学习热门公课精华的课程伴侣! 对李宏毅“深度强化学习”、周博磊“强化学习纲要”和李科浇“世界冠军带你从零实践强化学习”3门累积播放过百万的公课行内容精选和公式推导,对较难理解的知识行重讲解和补充强化,方便读者边看视频边查阅学习。 (2)GitHub下载量过万的源教程,迭代升级的门指南! 本“蘑菇书”系中科院王琦、清华杨毅远、北大江季3位Datawhale成员继“南瓜书”《机器学习公式详解》后第2本自学笔记,源教程发布于GitHub不到10个月,已有1.1万下载量及3.3k Star数。本“蘑菇书”吸收读者对于源教程上百次的反馈,利用简单生动的例子解释强化学习概念,对重难公式详细推导、分析,设置原创关键词、习题和面试题,配有Python实现代码,方便读者轻松门。 (3)原课程作者 李宏毅、周博磊、李科浇,以及强化学习领域 汪军、张伟楠、李升波、胡裕靖亲笔推荐! (4)4项配套资源,让你收获满满! 可下载Python实现代码;可下载习题和面试题答案;学习交流服务。(本书后在“资源与支持”页获取)<br/>【作者】<br/>王琦 中国科学院大学硕士在读,Datawhale成员。主要研究方向为深度学习、数据挖掘。曾获中国大学生计算机设计大赛二等奖、亚太地区大学生数学建模竞赛 (APMCM)二等奖和“挑战杯”竞赛江苏省选拔赛二等奖,发表 SCI/EI 论文3篇。 杨毅远 清华大学硕士在读, Datawhale成员。主要研究方向为时空数据挖掘、智能传感系统、深度学习。曾获全国大学生智能汽车竞赛总冠军、中国国家奖学金,发表SCI/EI论文7篇,其中以作者身份在SCI的Q1区、Q2区及中国计算机学会(CCF)A、B类会议中发表论文4篇。 江季 北京大学硕士在读, Datawhale成员。主要研究方向为强化学习、机器人。曾获大学生电子设计竞赛——2018年嵌式系统专题邀请赛(英特尔杯)一等奖,发表顶会论文1篇、专利2项。<br/>

評論0