RL_Navigation

基于强化学习的机器人导航。本项目Fork自EpMineEnv.
我们设计了一个包含辅助任务的强化学习导航框架，使用PPO算法训练模型，完成点目标视觉导航。具体请参考实验报告。

1 环境配置

1.1 方案A：使用Docker和WSL2

1.1.1 配置WSL2图形界面和Docker

微软WSL2官方文档
 Docker文档
注意在WSL2内安装Docker而不是在Windows上安装Docker Desktop。

1.1.2 构建镜像

cd /path/to/this/repo
docker build -t rl_nav:latest .

GUI的部分参考了WSLg的文档

1.1.3 运行容器

docker compose up -d

之后可以Attach到容器中。

1.2 方案B：使用conda

conda create -n mine_env python=3.8 -y && \
conda activate mine_env && \
pip install setuptools==65.5.0 pip==21 && \
pip install wheel==0.38.0 && \
pip install mlagents-envs opencv-python==4.5.5.64 && \
pip install stable-baselines3==1.5.0 gym torch accelerate && \
pip install protobuf~=3.20 tensorboard ipykernel pynput

1.3 最后：下载仿真环境

参考原项目仿真环境下载部分。让drl可执行文件（drl.x86_64或drl.exe）在EpMineEnv-main/envs/SingleAgent/MineField/目录下。(例如，在Windows下修改下载的MineField_Windows-0510-random文件夹名称为MineField，并移动到EpMineEnv-main/envs/SingleAgent/)

2 Checkpoint

给出训练好的checkpoint文件，从OneDrive下载（42MB）
可以通过训练脚本中的model.set_parameters()方法，或评估脚本中--model-path参数，传入checkpoint路径。

该checkpoint的测试结果为：

Deterministic Action:
    Mean reward: 11.51 +/- 2.38
    Mean episode length: 47.39 +/- 92.33
    Success rate: 0.96
Non-deterministic Action:
    Mean reward: 11.71 +/- 2.07
    Mean episode length: 44.18 +/- 64.36
    Success rate: 0.99

注意，由于Unity环境的随机性，测试结果可能会有所不同。

demo.mp4

3 训练

在训练前，先调整n_envs参数，设置训练的环境数量。由于给定的环境存在问题，训练固定种子仍然存在随机性。默认的训练参数应该得到与Baseline_with_pose类似的结果。

cd EpMineEnv-main
python train_ppo_simple.py

4 评估

在评估前，前往EpMineEnv-main/models/nav_policy.py中，修改约222行的：

# pose_projection = self.pose_projection(pose.detach() / 3)  # (batch_size, hidden_dim), avoid gradient
pose_projection = self.pose_projection(x["state"][:, -1, :].float() / 3)  # use real pose and normalize

将第一行取消注释，第二行注释，以确保评估时使用训练得到的pose。
使用evaluate.py脚本评估训练好的模型，需要指定模型路径。

cd EpMineEnv-main
python evaluate.py --model-path /path/to/your/checkpoint.zip

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
EpMineEnv-main		EpMineEnv-main
appendix		appendix
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
compose.yaml		compose.yaml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

RL_Navigation

1 环境配置

1.1 方案A：使用Docker和WSL2

1.1.1 配置WSL2图形界面和Docker

1.1.2 构建镜像

1.1.3 运行容器

1.2 方案B：使用conda

1.3 最后：下载仿真环境

2 Checkpoint

3 训练

4 评估

About

Uh oh!

Releases

Packages

Languages

License

Soappyooo/RL_Navigation

Folders and files

Latest commit

History

Repository files navigation

RL_Navigation

1 环境配置

1.1 方案A：使用Docker和WSL2

1.1.1 配置WSL2图形界面和Docker

1.1.2 构建镜像

1.1.3 运行容器

1.2 方案B：使用conda

1.3 最后：下载仿真环境

2 Checkpoint

3 训练

4 评估

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages