个人在学习强化学习过程中的系统化笔记与整理。主要参考了两门公开课程,并按模块化方式记录推导、要点与实现片段。仅用于学习与交流。
课程版权归原作者与平台所有,本文档仅做学习笔记引用与链接,不包含任何课程资源的再分发。
- 以
0开头 的 Markdown 文件:对应 《强化学习基础(鲁鹏)》 的笔记。 - 其他序号文件:对应 《强化学习的数学原理》 的笔记。
- script文件是作者用于调整笔记图片路径的脚本
这是我在学习过程中的笔记,难免存在疏漏或错误。欢迎通过以下方式交流与改进:
- 提交 Issue(建议使用清晰的标题前缀,如
[Errata]、[Question]、[Suggestion]) - 发送邮件至 3077807213@qq.com
- 如有更正或补充,欢迎提交 Pull Request