Skip to content

xiaozhejiya/reinforement-learning-notes

Repository files navigation

强化学习学习笔记 (Reinforcement Learning Notes)

个人在学习强化学习过程中的系统化笔记与整理。主要参考了两门公开课程,并按模块化方式记录推导、要点与实现片段。仅用于学习与交流

参考课程与致谢

  • 强化学习基础(本科生课程) ---- 北京邮电大学 鲁鹏老师

    链接:Bilibili

  • 强化学习的数学原理:从零到透彻理解(完结) ---- 西湖大学 赵世钰老师

    链接:Bilibili

课程版权归原作者与平台所有,本文档仅做学习笔记引用与链接,不包含任何课程资源的再分发。

仓库结构与命名规则

  • 0 开头 的 Markdown 文件:对应 《强化学习基础(鲁鹏)》 的笔记。
  • 其他序号文件:对应 《强化学习的数学原理》 的笔记。
  • script文件是作者用于调整笔记图片路径的脚本

勘误与贡献

这是我在学习过程中的笔记,难免存在疏漏或错误。欢迎通过以下方式交流与改进:

  • 提交 Issue(建议使用清晰的标题前缀,如 [Errata][Question][Suggestion]
  • 发送邮件至 3077807213@qq.com
  • 如有更正或补充,欢迎提交 Pull Request

About

本仓库是我在系统学习强化学习(Reinforcement Learning, RL)过程中的笔记与实践集合。内容以推导为主、实现为辅,覆盖从马尔可夫决策过程到策略梯度、时序差分、函数逼近与深度强化学习的核心概念与常见算法。笔记主要参考两门公开课程(《强化学习基础》与《强化学习的数学原理》),并在此基础上加入了个人理解、要点总结、公式整理。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages