Създаване с моделите от семейството Meta

Въведение

В този урок ще разгледаме:

Двата основни модела от семейството Meta - Llama 3.1 и Llama 3.2
Разбиране на случаите на употреба и сценариите за всеки модел
Примерен код, който показва уникалните характеристики на всеки модел

Семейството модели Meta

В този урок ще разгледаме 2 модела от семейството Meta или "Llama Herd" - Llama 3.1 и Llama 3.2

Тези модели се предлагат в различни варианти и са налични на GitHub Model marketplace. Ето повече подробности за използването на GitHub Models за прототипиране с AI модели.

Варианти на моделите:

Llama 3.1 - 70B Instruct
Llama 3.1 - 405B Instruct
Llama 3.2 - 11B Vision Instruct
Llama 3.2 - 90B Vision Instruct

Забележка: Llama 3 също е наличен в GitHub Models, но няма да бъде разглеждан в този урок

Llama 3.1

С 405 милиарда параметри, Llama 3.1 попада в категорията отворени LLM модели.

Този модел е ъпгрейд на по-ранната версия Llama 3, като предлага:

По-голям контекстен прозорец - 128k токена срещу 8k токена
По-голям максимален брой изходни токени - 4096 срещу 2048
По-добра мултиезична поддръжка - благодарение на увеличения брой тренировъчни токени

Това позволява на Llama 3.1 да се справя с по-сложни случаи на употреба при създаване на GenAI приложения, включително:

Вградени повиквания на функции - възможност за извикване на външни инструменти и функции извън работния процес на LLM
По-добра производителност при RAG - благодарение на по-големия контекстен прозорец
Генериране на синтетични данни - възможност за създаване на ефективни данни за задачи като фино настройване

Вградени повиквания на функции

Llama 3.1 е фино настроен да бъде по-ефективен при извикване на функции или инструменти. Той разполага и с два вградени инструмента, които моделът може да разпознае като необходими за използване според подадения от потребителя промпт. Тези инструменти са:

Brave Search - може да се използва за получаване на актуална информация, като например времето, чрез уеб търсене
Wolfram Alpha - може да се използва за по-сложни математически изчисления, така че не е необходимо да пишете собствени функции

Можете също да създадете свои собствени инструменти, които LLM може да извиква.

В примерния код по-долу:

Дефинираме наличните инструменти (brave_search, wolfram_alpha) в системния промпт.
Изпращаме потребителски промпт, който пита за времето в определен град.
LLM ще отговори с повикване към инструмента Brave Search, което ще изглежда така <|python_tag|>brave_search.call(query="Stockholm weather")

Забележка: Този пример само извършва повикването на инструмента, ако искате да получите резултатите, ще трябва да създадете безплатен акаунт на страницата на Brave API и да дефинирате самата функция

import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "meta-llama-3.1-405b-instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)


tool_prompt=f"""
<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Environment: ipython
Tools: brave_search, wolfram_alpha
Cutting Knowledge Date: December 2023
Today Date: 23 July 2024

You are a helpful assistant<|eot_id|>
"""

messages = [
    SystemMessage(content=tool_prompt),
    UserMessage(content="What is the weather in Stockholm?"),

]

response = client.complete(messages=messages, model=model_name)

print(response.choices[0].message.content)

Llama 3.2

Въпреки че е LLM, едно ограничение на Llama 3.1 е мултимодалността. Това означава възможността да се използват различни типове входни данни, като изображения, като промпти и да се предоставят отговори. Тази способност е една от основните характеристики на Llama 3.2. Други характеристики включват:

Мултимодалност - възможност за обработка както на текстови, така и на визуални промпти
Вариации с малък и среден размер (11B и 90B) - осигуряват гъвкави опции за внедряване
Вариации само с текст (1B и 3B) - позволяват модела да бъде внедрен на edge / мобилни устройства и осигуряват ниска латентност

Поддръжката на мултимодалност представлява голяма стъпка в света на отворените модели. Примерният код по-долу използва както изображение, така и текстов промпт, за да получи анализ на изображението от Llama 3.2 90B.

Мултимодална поддръжка с Llama 3.2

import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import (
    SystemMessage,
    UserMessage,
    TextContentItem,
    ImageContentItem,
    ImageUrl,
    ImageDetailLevel,
)
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
model_name = "Llama-3.2-90B-Vision-Instruct"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

response = client.complete(
    messages=[
        SystemMessage(
            content="You are a helpful assistant that describes images in details."
        ),
        UserMessage(
            content=[
                TextContentItem(text="What's in this image?"),
                ImageContentItem(
                    image_url=ImageUrl.load(
                        image_file="sample.jpg",
                        image_format="jpg",
                        detail=ImageDetailLevel.LOW)
                ),
            ],
        ),
    ],
    model=model_name,
)

print(response.choices[0].message.content)

Обучението не спира тук, продължете пътешествието

След като завършите този урок, разгледайте нашата колекция за обучение по Генеративен AI, за да продължите да развивате знанията си в областта на Генеративния AI!

Отказ от отговорност:
Този документ е преведен с помощта на AI преводаческа услуга Co-op Translator. Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи могат да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за каквито и да е недоразумения или неправилни тълкувания, произтичащи от използването на този превод.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Създаване с моделите от семейството Meta

Въведение

Семейството модели Meta

Llama 3.1

Вградени повиквания на функции

Llama 3.2

Мултимодална поддръжка с Llama 3.2

Обучението не спира тук, продължете пътешествието

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Създаване с моделите от семейството Meta

Въведение

Семейството модели Meta

Llama 3.1

Вградени повиквания на функции

Llama 3.2

Мултимодална поддръжка с Llama 3.2

Обучението не спира тук, продължете пътешествието