Мир LLM с открытым исходным кодом захватывающий и постоянно развивается. Этот урок нацелен на глубокое изучение моделей с открытым исходным кодом. Если вы ищете информацию о том, как проприетарные модели сравниваются с моделями с открытым исходным кодом, перейдите к уроку "Изучение и сравнение различных LLM". В этом уроке также будет рассмотрена тема тонкой настройки, но более подробное объяснение можно найти в уроке "Тонкая настройка LLM".
- Понять, что такое модели с открытым исходным кодом
- Осознать преимущества работы с моделями с открытым исходным кодом
- Изучить доступные модели на Hugging Face и в Azure AI Studio
Программное обеспечение с открытым исходным кодом сыграло ключевую роль в развитии технологий в различных областях. Инициатива Open Source (OSI) определила 10 критериев для программного обеспечения, чтобы оно классифицировалось как открытое. Исходный код должен быть открыто опубликован под лицензией, одобренной OSI.
Хотя разработка LLM имеет схожие элементы с разработкой программного обеспечения, процесс не совсем идентичен. Это вызвало множество обсуждений в сообществе о том, как определить открытый исходный код в контексте LLM. Чтобы модель соответствовала традиционному определению открытого исходного кода, следующая информация должна быть общедоступной:
- Наборы данных, использованные для обучения модели.
- Полные веса модели как часть обучения.
- Код для оценки.
- Код для тонкой настройки.
- Полные веса модели и метрики обучения.
На данный момент существует лишь несколько моделей, соответствующих этим критериям. Модель OLMo, созданная Институтом искусственного интеллекта Аллена (AllenAI), является одной из таких моделей.
Для целей этого урока мы будем называть такие модели "открытыми моделями", так как они могут не соответствовать вышеуказанным критериям на момент написания.
Высокая настраиваемость - Поскольку открытые модели публикуются с подробной информацией об обучении, исследователи и разработчики могут модифицировать внутреннюю структуру модели. Это позволяет создавать высокоспециализированные модели, настроенные для выполнения конкретных задач или исследований. Примеры включают генерацию кода, математические операции и биологию.
Стоимость - Стоимость за токен при использовании и развертывании таких моделей ниже, чем у проприетарных моделей. При создании приложений на основе генеративного ИИ следует учитывать соотношение производительности и цены для вашего конкретного случая использования.
Гибкость - Работа с открытыми моделями позволяет быть гибким в использовании различных моделей или их комбинаций. Примером может служить HuggingChat Assistants, где пользователь может выбрать модель, используемую непосредственно в интерфейсе:
LLama2, разработанная Meta, является открытой моделью, оптимизированной для приложений на основе чатов. Это связано с методом тонкой настройки, который включал большое количество диалогов и обратной связи от пользователей. Благодаря этому методу модель выдает результаты, которые больше соответствуют ожиданиям человека, что улучшает пользовательский опыт.
Примеры тонко настроенных версий Llama включают Japanese Llama, которая специализируется на японском языке, и Llama Pro, которая является улучшенной версией базовой модели.
Mistral — это открытая модель, ориентированная на высокую производительность и эффективность. Она использует подход Mixture-of-Experts, который объединяет группу специализированных экспертных моделей в одну систему, где в зависимости от входных данных выбираются определенные модели. Это делает вычисления более эффективными, так как модели обрабатывают только те входные данные, в которых они специализируются.
Примеры тонко настроенных версий Mistral включают BioMistral, которая ориентирована на медицинскую область, и OpenMath Mistral, которая выполняет математические вычисления.
Falcon — это LLM, созданная Институтом технологических инноваций (TII). Falcon-40B была обучена на 40 миллиардах параметров, что показало лучшую производительность, чем у GPT-3, при меньших вычислительных затратах. Это стало возможным благодаря использованию алгоритма FlashAttention и многозапросного внимания, которые позволяют сократить требования к памяти во время вывода. Благодаря сокращенному времени вывода Falcon-40B подходит для приложений на основе чатов.
Примеры тонко настроенных версий Falcon включают OpenAssistant, помощник, построенный на открытых моделях, и GPT4ALL, который обеспечивает более высокую производительность, чем базовая модель.
Нет единого ответа на вопрос, как выбрать открытую модель. Хорошим началом может быть использование функции фильтрации по задачам в Azure AI Studio. Это поможет вам понять, для каких задач была обучена модель. Hugging Face также поддерживает рейтинг LLM, который показывает лучшие модели на основе определенных метрик.
Если вы хотите сравнить LLM разных типов, Artificial Analysis — еще один отличный ресурс:
Если вы работаете над конкретным случаем использования, эффективным может быть поиск тонко настроенных версий, ориентированных на ту же область. Экспериментирование с несколькими открытыми моделями, чтобы понять, как они соответствуют вашим ожиданиям и ожиданиям ваших пользователей, также является хорошей практикой.
Лучшее в открытых моделях — это то, что вы можете начать работать с ними довольно быстро. Ознакомьтесь с каталогом моделей Azure AI Foundry, который включает в себя специальную коллекцию Hugging Face с обсуждаемыми здесь моделями.
После завершения этого урока ознакомьтесь с нашей коллекцией обучения генеративному ИИ, чтобы продолжить углублять свои знания в области генеративного ИИ!
Отказ от ответственности:
Этот документ был переведен с использованием сервиса автоматического перевода Co-op Translator. Хотя мы стремимся к точности, пожалуйста, учитывайте, что автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его родном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется профессиональный перевод человеком. Мы не несем ответственности за любые недоразумения или неправильные интерпретации, возникающие в результате использования данного перевода.



