-
Notifications
You must be signed in to change notification settings - Fork 4k
Open
Description
Minimind项目实在是太棒了,第一次让我能够从0训练一个可以对话的chat模型,并且效果非常惊艳,不得不让人一直使用。
在高频使用下,想将训练环节变得更加容易,要是可以用鼠标点点点就完成训练任务,那将大大降低训练的易用程度。
✨✨✨因此我为Minimind开发了训练环节的Web UI,任何一个用户都可以在本地部署并且使用web进行训练。
目前维护在我个人的仓库分支中:https://github.com/yuyu5333/minimind/tree/feat/as_a_tools
我向Minimind项目同时也提出了PR(#524)
非常希望能够支持Minimind成为Training Web UI开发者参与者,后续会持续更新~
Update 11-24
- 支持 GRPO、SPO
- 训练进程中实时更新进度,不用长时间开启日志框(频繁前后端交互会导致web缓存逐步增加)
- 优化训练界面,更加用户友好
Update
- 精度验证:结论:使用web训练不会对Minimind产生性能和效果方面的影响
- 联动 SwanLab( wandb ) 一键跳转:对于选择 SwanLab日志监控 的训练进程,一键跳转到对应Swanlab日志
- 支持一键多卡并行训练,可自由选择卡数
- 支持dpo、ppo训练
- 提供更安全地web启动方式,避免因为vscode、trae等远程连接断开而导致训练中断,见使用“方法1”
使用方法(需要提前将数据集下载到minimind/dataset文件夹中):
git clone https://github.com/yuyu5333/minimind.git
cd minimind
git checkout feat/as_a_tools
pip install -r requirements.txt
# 方法1:使用自动进程管理启动
bash trainer_web/start_web_ui.sh
# 方法2:直接运行train_web_ui.py
python trainer_web/train_web_ui.py- 如果使用的是云服务器,配合Vscode、TRAE等远程连接软件会自动进行端口转发,从云端启动服务可在本地进行Web操作:
以下是训练Web UI效果展示:
Todo list:
- 多卡并行训练
- Swanlab
- RL训练
- DPO
- PPO
- GRPO
- SPO
- 蒸馏
- 进程优化
- 优化界面
- 系统支持
- Linux
- Windwos
- MacOS
- More .....
欢迎大家提出问题,已知问题:
- 当前UI界面在不同分辨率大小下会导致参数栏目换行
- 训练进程结束后没有及时退出“训练进程”栏目
- 训练log没有第一时间跟随本地log进行更新
- 删除最底端一条进程之后,会导致日志框显示不全,需要刷新一下界面
jingyaogongyuyu5333
Metadata
Metadata
Assignees
Labels
No labels

