LoRA tuning для Mix-of-Experts моделей

Обучение

Обучаем LoRA адаптер для MoE LLM модели на наших данных. Сохраняем полученный адаптер в output_dir. Для запуска скрипта представлено описание минимального набора аргументов. Описание всех аргументов можно найти в файле train.py.

Установите зависимости в отдельную виртуальную среду:

python3 -m venv train_moe_env
. ./train_moe_env/bin/activate
pip install -r train_requirements.txt

Запуск обучения:

python train.py 
  --data_path "train_data.json" 
  --output_dir ./results

Объединение LoRA адаптера с LLM

Для inference модели необходимо предварительно объединить основную LLM с обученным LoRA адаптером. Объединённая модель записывается внутрь папки с адаптером в новую директорию merged_model.

Скрипт следует запускать в той же виртуальной среде, что и обучение. Для запуска скрипта представлено описание минимального набора аргументов. Описание всех аргументов можно найти в файле merge_lora.py.

python merge_lora.py \
  --base path_to_base_model \ # Название базовой модели или путь до базовой модели
  --adapter path_to_lora_adapter \ # Путь до чекпоинта LoRA адаптера, полученного на шаге обучения
  --prompt "Докажи теорему о неподвижной точке" \ # Текст который пойдет в качестве входного в уже смерженную модель для проверки правильности мержа
  --trust-remote-code \ # Флаг необходимый для корректной загрузки hf-checkpoint

Запуск inference

В результате запуска модели по каждому контексту (диалогу) будет получена ответная реплика модели на консоли.

Для запуска скрипта представлено описание минимального набора аргументов. Описание всех аргументов можно найти в файле inference.py.

Установите зависимости в отдельную виртуальную среду:

python3 -m venv inference_moe_env
. ./inference_moe_env/bin/activate
pip install -r inf_requirements.txt

Запуск inference:

python inference.py \
  --model_name path_to_merged_model \ # Путь до смерженной модели
  --tokenizer_path path_to_tokenizer \ # Путь до токенизатора 
  --data_path test_data.json # Путь до данных на которых мы хотим получить предсказания реплики

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

LoRA tuning для Mix-of-Experts моделей

Обучение

Объединение LoRA адаптера с LLM

Запуск inference

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
README.md		README.md
inf_requirements.txt		inf_requirements.txt
inference.py		inference.py
merge_lora.py		merge_lora.py
test_data.json		test_data.json
train.py		train.py
train_data.json		train_data.json
train_requirements.txt		train_requirements.txt
utils.py		utils.py

ai-forever/moe-lora-tuning

Folders and files

Latest commit

History

Repository files navigation

LoRA tuning для Mix-of-Experts моделей

Обучение

Объединение LoRA адаптера с LLM

Запуск inference

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages