joyrl

### 你是否已经阅读并同意《Datawhale开源项目行为准则》？

- [X] 我已阅读并同意[《Datawhale开源项目行为准则》](https://github.com/datawhalechina/DOPMC/blob/main/CODE_OF_CONDUCT.md)

### 项目简介

该项目旨在开发一个强化学习的黑盒开源平台，并给读者呈现一个pip安装包的形式，让读者跳过复杂的强化算法和神经网络的设计，直接通过修改配置文件(yaml)来使用强化学习去解决相关任务。用户只需要对强化学习和深度学习有一个非常初步的认识就能够通过我们的平台解决相关问题。

### 立项理由

目前蘑菇书发行已经有一段时间，已经具有一定的读者基础，并深入了解了读者们更多的需求，也发现了更多的读者往往是非强化学习方向的交叉学科研究者，他们想将强化学习应用于各个领域，而苦于陷入强化学习算法设计的细节无法自拔。配合蘑菇书通俗讲解的一些概念，我们决定来开发这样一个平台帮助他们

### 项目受众

主要受众是想利用强化学习解决各类应用任务的交叉学科读者，其次是强化学习者

### 项目亮点

目前已有的项目主要有openai的[spinninguprl](https://spinningup.openai.com/en/latest/)和stable baselines，ray的[RLlib](https://docs.ray.io/en/latest/rllib/index.html)以及清华的tianshou。
openai的spinninguprl目前的算法不是很全面，stable baselines虽然较为全面但是运行效率较低，对新手很不友好，且目前读者主要使用torch做人工智能相关的研究，stable baselines[torch]目前也比较残缺。RLlib弥补了在多线程并行方面的工作，但是仍然对新手或者交叉学科研究者不够友好，文档说明不够简单易用，且需要配置的东西有很多。
tianshou则有些华而不实的感觉。

### 项目规划

我们主要是实现各个算法以及补全一些常用的应用环境，主要工作内容如下：
1. 以配置文件为基础的强化学习框架，即如何根据配置文件来设计网络
2. 补全算法：包括单智能体强化学习、多智能体强化学习等等，我们旨在与时俱进，补全所有的流行算法
3. pip安装包版本发行，目前还没有相关的经验
4. 可视化编程平台（这个是比较超前的计划，可以面向诸如青少年等更多的受众，把我们的rl的easy发挥到极致！！！）


### 项目负责人

https://github.com/JohnJim0816
https://github.com/qiwang067
https://github.com/yyysjz1997

### 备注：发起立项申请后DOPMC将会在 72h 之内给出答复，如超时未答复请添加DOPMC负责人微信（微信号：at-Sm1les）问询~

- [ ] 我已知悉上述备注

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

joyrl #85

你是否已经阅读并同意《Datawhale开源项目行为准则》？

项目简介

立项理由

项目受众

项目亮点

项目规划

项目负责人

备注：发起立项申请后DOPMC将会在 72h 之内给出答复，如超时未答复请添加DOPMC负责人微信（微信号：at-Sm1les）问询~

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

joyrl #85

Description

你是否已经阅读并同意《Datawhale开源项目行为准则》？

项目简介

立项理由

项目受众

项目亮点

项目规划

项目负责人

备注：发起立项申请后DOPMC将会在 72h 之内给出答复，如超时未答复请添加DOPMC负责人微信（微信号：at-Sm1les）问询~

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions