🚀《动手学强化学习》课程笔记

本仓库包含《动手学强化学习》课程的完整学习笔记，并实现了核心强化学习算法。

所有代码均基于 Python 并使用 PyTorch 均经过测试。

💡说明

文件夹/文件	说明
`Chap/`	Chap开头的文件夹包含，各种强化学习算法实现 (DQN, PPO等)
`Note0.md`	Chap1---Chap9的笔记(基于 markdown)
`Note1.md`	Chap10---Chap14的笔记(基于 markdown)
`README.md`	项目说明
`rl_utils.py`	强化学习工具库

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
.vscode		.vscode
Chap10-Actor-Critic		Chap10-Actor-Critic
Chap11-TRPO		Chap11-TRPO
Chap12-PPO		Chap12-PPO
Chap13-DDPG		Chap13-DDPG
Chap14-SAC		Chap14-SAC
Chap2-KBandit		Chap2-KBandit
Chap4-DP		Chap4-DP
Chap5-TD		Chap5-TD
Chap6-DynaQ		Chap6-DynaQ
Chap7-DQN		Chap7-DQN
Chap8-DQN_improve		Chap8-DQN_improve
Chap9-PolicyGradient		Chap9-PolicyGradient
.DS_Store		.DS_Store
Note0.md		Note0.md
Note1.md		Note1.md
README.md		README.md
TRPO的数学推导.md		TRPO的数学推导.md
rl_utils.py		rl_utils.py