🚀《动手学强化学习》课程笔记 本仓库包含《动手学强化学习》课程的完整学习笔记,并实现了核心强化学习算法。 训练的测试环境为: 离散动作空间:CartPole-v1 连续动作空间:Pendulum-v1 所有代码均基于 Python 并使用 PyTorch 均经过测试。 💡说明 文件夹/文件 说明 Chap/ Chap开头的文件夹包含,各种强化学习算法实现 (DQN, PPO等) Note0.md Chap1---Chap9的笔记(基于 markdown) Note1.md Chap10---Chap14的笔记(基于 markdown) README.md 项目说明 rl_utils.py 强化学习工具库