Skip to content

Latest commit

 

History

History
93 lines (56 loc) · 12.6 KB

File metadata and controls

93 lines (56 loc) · 12.6 KB

Модели отвореног кода

Увод

Свет LLM-ова отвореног кода је узбудљив и стално се развија. Ова лекција има за циљ да пружи детаљан увид у моделе отвореног кода. Ако тражите информације о томе како се власнички модели упоређују са моделима отвореног кода, посетите лекцију "Истраживање и поређење различитих LLM-ова". Ова лекција ће такође обухватити тему фино подешавања, али детаљније објашњење можете пронаћи у лекцији "Фино подешавање LLM-ова".

Циљеви учења

  • Стицање разумевања модела отвореног кода
  • Разумевање предности рада са моделима отвореног кода
  • Истраживање доступних модела отвореног кода на Hugging Face и Azure AI Studio

Шта су модели отвореног кода?

Софтвер отвореног кода одиграо је кључну улогу у развоју технологије у различитим областима. Иницијатива за отворени код (OSI) дефинисала је 10 критеријума за софтвер који се класификује као отвореног кода. Изворни код мора бити јавно доступан под лиценцом коју је одобрио OSI.

Иако развој LLM-ова има сличне елементе као развој софтвера, процес није потпуно исти. Ово је изазвало много дискусија у заједници о дефиницији отвореног кода у контексту LLM-ова. Да би модел био у складу са традиционалном дефиницијом отвореног кода, следеће информације треба да буду јавно доступне:

  • Скуп података који су коришћени за обуку модела.
  • Комплетне тежине модела као део обуке.
  • Код за евалуацију.
  • Код за фино подешавање.
  • Комплетне тежине модела и метрике обуке.

Тренутно постоји само неколико модела који испуњавају ове критеријуме. OLMo модел који је креирао Allen Institute for Artificial Intelligence (AllenAI) је један од њих.

За ову лекцију, моделе ћемо називати "отворени модели" у даљем тексту, јер можда не испуњавају горе наведене критеријуме у време писања.

Предности отворених модела

Висока прилагодљивост - Пошто се отворени модели објављују са детаљним информацијама о обуци, истраживачи и програмери могу модификовати унутрашњост модела. Ово омогућава креирање високо специјализованих модела који су фино подешени за одређени задатак или област истраживања. Неки примери укључују генерисање кода, математичке операције и биологију.

Цена - Цена по токену за коришћење и примену ових модела је нижа у поређењу са власничким моделима. Приликом изградње апликација за генеративну вештачку интелигенцију, треба узети у обзир однос перформанси и цене у складу са вашим случајем употребе.

Цена модела
Извор: Artificial Analysis

Флексибилност - Рад са отвореним моделима омогућава флексибилност у коришћењу различитих модела или њиховом комбиновању. Пример за то су HuggingChat Assistants, где корисник може директно у корисничком интерфејсу изабрати модел који се користи:

Изабери модел

Истраживање различитих отворених модела

Llama 2

LLama2, развијен од стране компаније Meta, је отворени модел оптимизован за апликације засноване на чету. Ово је резултат његовог метода фино подешавања, који је укључивао велики број дијалога и повратних информација од људи. Захваљујући овом методу, модел производи резултате који су више у складу са људским очекивањима, што пружа боље корисничко искуство.

Неки примери фино подешених верзија Llama укључују Japanese Llama, који је специјализован за јапански језик, и Llama Pro, који је побољшана верзија основног модела.

Mistral

Mistral је отворени модел са снажним фокусом на високе перформансе и ефикасност. Користи приступ Mixture-of-Experts, који комбинује групу специјализованих експертских модела у један систем где се, у зависности од улазних података, одређени модели бирају за употребу. Ово чини рачунање ефикаснијим јер модели обрађују само улазе у којима су специјализовани.

Неки примери фино подешених верзија Mistral укључују BioMistral, који је фокусиран на медицинску област, и OpenMath Mistral, који обавља математичке прорачуне.

Falcon

Falcon је LLM који је креирао Technology Innovation Institute (TII). Falcon-40B је обучен на 40 милијарди параметара, што је показало боље перформансе од GPT-3 уз мањи буџет за рачунарске ресурсе. Ово је резултат коришћења алгоритма FlashAttention и multiquery attention који омогућавају смањење захтева за меморијом током времена инференције. Са овим смањеним временом инференције, Falcon-40B је погодан за апликације за чет.

Неки примери фино подешених верзија Falcon су OpenAssistant, асистент изграђен на отвореним моделима, и GPT4ALL, који пружа боље перформансе од основног модела.

Како изабрати

Не постоји један одговор на питање како изабрати отворени модел. Добро место за почетак је коришћење функције Azure AI Studio за филтрирање по задацима. Ово ће вам помоћи да разумете за које типове задатака је модел обучен. Hugging Face такође одржава LLM Leaderboard који вам показује најбоље моделе на основу одређених метрика.

Када желите да упоредите LLM-ове различитих типова, Artificial Analysis је још један одличан ресурс:

Квалитет модела
Извор: Artificial Analysis

Ако радите на одређеном случају употребе, претрага фино подешених верзија које су фокусиране на исту област може бити ефикасна. Експериментисање са више отворених модела како бисте видели како се они понашају у складу са вашим и очекивањима ваших корисника је још једна добра пракса.

Следећи кораци

Најбоља ствар код отворених модела је то што можете брзо почети да радите са њима. Погледајте Azure AI Foundry Model Catalog, који садржи специфичну Hugging Face колекцију са овим моделима о којима смо овде говорили.

Учење се не завршава овде, наставите путовање

Након што завршите ову лекцију, погледајте нашу Generative AI Learning колекцију како бисте наставили да унапређујете своје знање о генеративној вештачкој интелигенцији!


Одрицање од одговорности:
Овај документ је преведен помоћу услуге за превођење вештачке интелигенције Co-op Translator. Иако настојимо да обезбедимо тачност, молимо вас да имате у виду да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на његовом изворном језику треба сматрати меродавним извором. За критичне информације препоручује се професионални превод од стране људи. Не преузимамо одговорност за било каква погрешна тумачења или неспоразуме који могу произаћи из коришћења овог превода.