Solving Gymnasium's Car Racing with Reinforcement Learning

Soft-Actor Critic (SAC)

Deep Q Learning (DQN)

Proximal Policy Optimization (PPO)

Results

Hardware: Google Colab L4

Model Type	Discrete	Average Reward	Training Time	Total Training Steps	HuggingFace
PPO	No	887.84	5:33:03	751,614	Link
SAC	No	787.69	6:29:16	750,000	Link
DQN	Yes	897.77	5:41:22	750,000	Link

Training Notes

Set ent_coef for PPO as it encourages exploration of other actions. Stable Baselines3 defaults the value to 0.0. More Information
Do not set your eval_freq too low, as it can sometimes cause instability during learning due to being interrupted by evaluation. (e.g. >=10,000)
buffer_size defaults to 1,000,000, which requires a significant memory for DQN and SAC. Try setting it to a more practical value when using the original observation space (e.g., 200,000)
Set the gray_scale flag in the notebooks to True to allow DQN and SAC to run without using the High-RAM option in Google Colab (buffer size <= 150,000). This converts the observation space from (96 x 96 x 3) images to (84 x 84) grayscale images.

Finding Theta Blog Posts

Solving Gymnasium's Car Racing with Reinforcement Learning

Name		Name	Last commit message	Last commit date
Latest commit History 90 Commits
Images		Images
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
[Car Racing] Deep Q-Network (DQN).ipynb		[Car Racing] Deep Q-Network (DQN).ipynb
[Car Racing] Proximal Policy Optimization (PPO).ipynb		[Car Racing] Proximal Policy Optimization (PPO).ipynb
[Car Racing] Soft Actor-Critic (SAC).ipynb		[Car Racing] Soft Actor-Critic (SAC).ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Solving Gymnasium's Car Racing with Reinforcement Learning

Soft-Actor Critic (SAC)

Deep Q Learning (DQN)

Proximal Policy Optimization (PPO)

Results

Training Notes

Finding Theta Blog Posts

About

Uh oh!

Releases

Packages

Languages

License

kuds/rl-car-racing

Folders and files

Latest commit

History

Repository files navigation

Solving Gymnasium's Car Racing with Reinforcement Learning

Soft-Actor Critic (SAC)

Deep Q Learning (DQN)

Proximal Policy Optimization (PPO)

Results

Training Notes

Finding Theta Blog Posts

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages