Name	Name	Last commit message	Last commit date
parent directory ..
README.md	README.md
train_viscoder_3b.sh	train_viscoder_3b.sh
train_viscoder_7b.sh	train_viscoder_7b.sh

Name

Last commit message

Last commit date

Training VisCoder

This directory contains training scripts and instructions for reproducing the VisCoder-3B and VisCoder-7B models using ms-swift.

1. Setup ms-swift

conda create -n swift python=3.10 -y
conda activate swift

git clone https://github.com/modelscope/ms-swift.git
cd ms-swift

pip install -e .
sh requirements/install_all.sh
pip install flash-attn -U --no-build-isolation

# Optional: for logging
pip install wandb

2. Prepare Data

Download the VisCode-200K dataset:

huggingface-cli download TIGER-Lab/VisCode-200K\
 --repo-type=dataset --resume-download --local-dir data

3. Run Training Scripts

bash train_viscoder_3b.sh
bash train_viscoder_7b.sh

Each script launches full fine-tuning with DeepSpeed and FlashAttention, using Qwen2.5-Coder as the base model.

⚠️ Notes

To start training quickly using ms-swift, you may need to remove the default dataset config:

rm ms-swift/swift/llm/dataset/data/dataset_info.json
echo "[]" > ms-swift/swift/llm/dataset/data/dataset_info.json

For detailed training options, refer to the ms-swift CLI documentation.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

Training VisCoder

1. Setup ms-swift

2. Prepare Data

3. Run Training Scripts

⚠️ Notes

FilesExpand file tree

train

Directory actions

More options

Directory actions

More options

Latest commit

History

train

Folders and files

parent directory

README.md

Training VisCoder

1. Setup ms-swift

2. Prepare Data

3. Run Training Scripts

⚠️ Notes