Ajuste fino do Phi-3 com Lora

Ajuste fino do modelo de linguagem Phi-3 Mini da Microsoft usando LoRA (Low-Rank Adaptation) em um conjunto de dados personalizado de instruções para chat.

O LORA ajudará a melhorar a compreensão das conversas e a geração de respostas.

Guia passo a passo para ajustar o Phi-3 Mini:

Importações e Configuração

Instalando loralib

pip install loralib
# Alternatively
# pip install git+https://github.com/microsoft/LoRA

Comece importando as bibliotecas necessárias, como datasets, transformers, peft, trl e torch.
Configure o logging para acompanhar o processo de treinamento.

Você pode optar por adaptar algumas camadas substituindo-as por equivalentes implementados no loralib. Atualmente, suportamos apenas nn.Linear, nn.Embedding e nn.Conv2d. Também oferecemos suporte ao MergedLinear para casos em que uma única nn.Linear representa mais de uma camada, como em algumas implementações da projeção qkv da atenção (veja Notas Adicionais para mais detalhes).

# ===== Before =====
# layer = nn.Linear(in_features, out_features)

# ===== After ======

import loralib as lora

# Add a pair of low-rank adaptation matrices with rank r=16
layer = lora.Linear(in_features, out_features, r=16)

Antes de iniciar o loop de treinamento, marque apenas os parâmetros do LoRA como treináveis.

import loralib as lora
model = BigModel()
# This sets requires_grad to False for all parameters without the string "lora_" in their names
lora.mark_only_lora_as_trainable(model)
# Training loop
for batch in dataloader:

Ao salvar um checkpoint, gere um state_dict que contenha somente os parâmetros do LoRA.

# ===== Before =====
# torch.save(model.state_dict(), checkpoint_path)

# ===== After =====
torch.save(lora.lora_state_dict(model), checkpoint_path)

Ao carregar um checkpoint usando load_state_dict, certifique-se de definir strict=False.

# Load the pretrained checkpoint first
model.load_state_dict(torch.load('ckpt_pretrained.pt'), strict=False)
# Then load the LoRA checkpoint
model.load_state_dict(torch.load('ckpt_lora.pt'), strict=False)

Agora o treinamento pode prosseguir normalmente.

Hiperparâmetros

Defina dois dicionários: training_config e peft_config. O training_config inclui hiperparâmetros para o treinamento, como taxa de aprendizado, tamanho do batch e configurações de logging.

O peft_config especifica parâmetros relacionados ao LoRA, como rank, dropout e tipo de tarefa.

Carregamento do Modelo e Tokenizer

Especifique o caminho para o modelo Phi-3 pré-treinado (por exemplo, "microsoft/Phi-3-mini-4k-instruct"). Configure as definições do modelo, incluindo uso de cache, tipo de dado (bfloat16 para precisão mista) e implementação da atenção.

Treinamento

Ajuste fino do modelo Phi-3 usando o conjunto de dados personalizado de instruções para chat. Utilize as configurações do LoRA definidas em peft_config para uma adaptação eficiente. Monitore o progresso do treinamento usando a estratégia de logging especificada.
Avaliação e Salvamento: Avalie o modelo ajustado.
Salve checkpoints durante o treinamento para uso posterior.

Exemplos

Aviso Legal:
Este documento foi traduzido utilizando o serviço de tradução por IA Co-op Translator. Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autorizada. Para informações críticas, recomenda-se tradução profissional humana. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Ajuste fino do Phi-3 com Lora

Guia passo a passo para ajustar o Phi-3 Mini:

FilesExpand file tree

FineTuning_Lora.md

Latest commit

History

FineTuning_Lora.md

File metadata and controls

Ajuste fino do Phi-3 com Lora

Guia passo a passo para ajustar o Phi-3 Mini: