O mundo dos LLMs open source é empolgante e está em constante evolução. Esta lição tem como objetivo fornecer uma visão detalhada sobre modelos open source. Se procura informações sobre como os modelos proprietários se comparam aos modelos open source, aceda à lição "Explorando e Comparando Diferentes LLMs". Esta lição também abordará o tema de ajuste fino, mas uma explicação mais detalhada pode ser encontrada na lição "Ajuste Fino de LLMs".
- Compreender os Modelos Open Source
- Entender os benefícios de trabalhar com Modelos Open Source
- Explorar os modelos disponíveis no Hugging Face e no Azure AI Studio
O software open source desempenhou um papel crucial no crescimento da tecnologia em várias áreas. A Open Source Initiative (OSI) definiu 10 critérios para software ser classificado como open source. O código-fonte deve ser compartilhado abertamente sob uma licença aprovada pela OSI.
Embora o desenvolvimento de LLMs tenha elementos semelhantes ao desenvolvimento de software, o processo não é exatamente o mesmo. Isso gerou muitas discussões na comunidade sobre a definição de open source no contexto dos LLMs. Para que um modelo esteja alinhado com a definição tradicional de open source, as seguintes informações devem estar disponíveis publicamente:
- Conjuntos de dados usados para treinar o modelo.
- Pesos completos do modelo como parte do treinamento.
- O código de avaliação.
- O código de ajuste fino.
- Pesos completos do modelo e métricas de treinamento.
Atualmente, existem apenas alguns modelos que atendem a esses critérios. O modelo OLMo criado pelo Allen Institute for Artificial Intelligence (AllenAI) é um exemplo que se enquadra nessa categoria.
Para esta lição, referiremos os modelos como "modelos abertos" daqui para frente, pois podem não atender aos critérios acima no momento da redação.
Altamente Personalizáveis - Como os modelos abertos são lançados com informações detalhadas de treinamento, pesquisadores e desenvolvedores podem modificar os componentes internos do modelo. Isso permite a criação de modelos altamente especializados, ajustados para uma tarefa ou área de estudo específica. Alguns exemplos incluem geração de código, operações matemáticas e biologia.
Custo - O custo por token para usar e implementar esses modelos é menor do que o dos modelos proprietários. Ao construir aplicações de IA generativa, é importante considerar o desempenho em relação ao custo ao trabalhar com esses modelos para o seu caso de uso.
Flexibilidade - Trabalhar com modelos abertos permite flexibilidade no uso de diferentes modelos ou na combinação deles. Um exemplo disso é o HuggingChat Assistants, onde o utilizador pode selecionar diretamente o modelo usado na interface:
LLama2, desenvolvido pela Meta, é um modelo aberto otimizado para aplicações baseadas em chat. Isso deve-se ao seu método de ajuste fino, que incluiu uma grande quantidade de diálogos e feedback humano. Com este método, o modelo produz resultados mais alinhados às expectativas humanas, proporcionando uma melhor experiência ao utilizador.
Alguns exemplos de versões ajustadas do Llama incluem Japanese Llama, que se especializa em japonês, e Llama Pro, que é uma versão aprimorada do modelo base.
Mistral é um modelo aberto com forte foco em alto desempenho e eficiência. Ele utiliza a abordagem Mixture-of-Experts, que combina um grupo de modelos especializados em um sistema onde, dependendo da entrada, certos modelos são selecionados para uso. Isso torna o cálculo mais eficaz, pois os modelos abordam apenas as entradas nas quais são especializados.
Alguns exemplos de versões ajustadas do Mistral incluem BioMistral, que é focado na área médica, e OpenMath Mistral, que realiza cálculos matemáticos.
Falcon é um LLM criado pelo Technology Innovation Institute (TII). O Falcon-40B foi treinado com 40 bilhões de parâmetros, demonstrando desempenho superior ao GPT-3 com menor orçamento computacional. Isso deve-se ao uso do algoritmo FlashAttention e da atenção multiquery, que reduz os requisitos de memória no momento da inferência. Com esse tempo de inferência reduzido, o Falcon-40B é adequado para aplicações de chat.
Alguns exemplos de versões ajustadas do Falcon incluem o OpenAssistant, um assistente construído com modelos abertos, e o GPT4ALL, que oferece desempenho superior ao modelo base.
Não há uma resposta única para escolher um modelo aberto. Um bom ponto de partida é usar o recurso de filtro por tarefa do Azure AI Studio. Isso ajudará a entender os tipos de tarefas para os quais o modelo foi treinado. O Hugging Face também mantém um LLM Leaderboard que mostra os modelos com melhor desempenho com base em certos critérios.
Ao procurar comparar LLMs entre os diferentes tipos, Artificial Analysis é outro ótimo recurso:
Se estiver a trabalhar num caso de uso específico, procurar versões ajustadas focadas na mesma área pode ser eficaz. Experimentar múltiplos modelos abertos para ver como eles se comportam de acordo com as suas expectativas e as dos seus utilizadores é outra boa prática.
A melhor parte dos modelos abertos é que pode começar a trabalhar com eles rapidamente. Confira o Catálogo de Modelos do Azure AI Foundry, que apresenta uma coleção específica do Hugging Face com os modelos discutidos aqui.
Depois de concluir esta lição, confira a nossa coleção de aprendizado de IA generativa para continuar a aprofundar os seus conhecimentos sobre IA generativa!
Aviso Legal:
Este documento foi traduzido utilizando o serviço de tradução por IA Co-op Translator. Embora nos esforcemos pela precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional humana. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.



