generative-ai-for-beginners/translations/sr/16-open-source-models/README.md at main · jarkalmar/generative-ai-for-beginners

Увод

Свет отворених LLM модела је узбудљив и стално се развија. Ова лекција има за циљ да пружи детаљан преглед отворених модела. Ако тражите информације о томе како се власнички модели упоређују са отвореним моделима, идите на лекцију "Истраживање и упоређивање различитих LLM модела". Ова лекција ће такође обрадити тему фино подешавање, али детаљније објашњење можете пронаћи у лекцији "Фино подешавање LLM модела".

Циљеви учења

Стекните разумевање о отвореним моделима
Разумевање предности рада са отвореним моделима
Истраживање отворених модела доступних на Hugging Face и Azure AI Studio

Шта су отворени модели?

Отворени софтвер има кључну улогу у развоју технологије у разним областима. Иницијатива за отворени софтвер (OSI) је дефинисала 10 критеријума за софтвер да би био класификован као отворен. Изворни код мора бити јавно доступан под лиценцом коју одобри OSI.

Иако развој LLM модела има сличне елементе као развој софтвера, процес није сасвим исти. Ово је изазвало много дискусија у заједници о дефиницији отвореног кода у контексту LLM модела. Да би модел био у складу са традиционалном дефиницијом отвореног кода, следеће информације треба да буду јавно доступне:

Скуп података коришћен за тренирање модела.
Потпуни тежински параметри модела као део тренинга.
Код за евалуацију.
Код за фино подешавање.
Потпуни тежински параметри модела и метрике тренинга.

Тренутно постоји само неколико модела који испуњавају ове критеријуме. OLMo модел који је креирао Allen Institute for Artificial Intelligence (AllenAI) је један од њих.

За ову лекцију, убудуће ћемо моделе називати "отворени модели" јер можда не испуњавају горе наведене критеријуме у тренутку писања.

Предности отворених модела

Висока прилагодљивост - Пошто се отворени модели објављују са детаљним информацијама о тренингу, истраживачи и програмери могу модификовати унутрашњост модела. Ово омогућава креирање високо специјализованих модела који су фино подешени за одређени задатак или област студија. Неки примери су генерисање кода, математичке операције и биологија.

Трошкови - Трошак по токену за коришћење и имплементацију ових модела је нижи него код власничких модела. При изградњи апликација заснованих на генеративној вештачкој интелигенцији, треба размотрити однос перформанси и цене када радите са овим моделима за ваш конкретан случај употребе.

Извор: Artificial Analysis

Флексибилност - Рад са отвореним моделима омогућава флексибилност у коришћењу различитих модела или њиховом комбиновaњу. Пример за то су HuggingChat асистенти где корисник може директно у корисничком интерфејсу изабрати модел који се користи:

Истраживање различитих отворених модела

Llama 2

LLama2, који је развио Meta, је отворени модел оптимизован за апликације засноване на ћаскању. То је због његове методе фино подешавања, која је укључивала велики број дијалога и људских повратних информација. Овом методом модел производи резултате који су више у складу са људским очекивањима, што пружа боље корисничко искуство.

Неки примери фино подешених верзија Llama укључују Japanese Llama, који је специјализован за јапански језик, и Llama Pro, који је унапређена верзија основног модела.

Mistral

Mistral је отворени модел са снажним фокусом на високе перформансе и ефикасност. Користи приступ Mixture-of-Experts који комбинује групу специјализованих експертских модела у један систем где се у зависности од улаза бирају одређени модели за коришћење. Ово чини израчунавање ефикаснијим јер модели обрађују само оне улазе у којима су специјализовани.

Неки примери фино подешених верзија Mistral укључују BioMistral, који је фокусиран на медицинску област, и OpenMath Mistral, који изводи математичке прорачуне.

Falcon

Falcon је LLM који је креирао Technology Innovation Institute (TII). Falcon-40B је трениран на 40 милијарди параметара и показало се да постиже боље резултате од GPT-3 уз мањи буџет за рачунарске ресурсе. То је због коришћења FlashAttention алгоритма и multiquery attention који му омогућавају смањење захтева за меморијом током извођења. Са овим скраћеним временом извођења, Falcon-40B је погодан за апликације за ћаскање.

Неки примери фино подешених верзија Falcon су OpenAssistant, асистент изграђен на отвореним моделима, и GPT4ALL, који пружа боље перформансе од основног модела.

Како изабрати

Не постоји један одговор за избор отвореног модела. Добро место за почетак је коришћење функције филтрирања по задатку у Azure AI Studio. Ово ће вам помоћи да разумете за које типове задатака је модел трениран. Hugging Face такође одржава LLM табелу лидера која вам показује најбоље перформансе модела на основу одређених метрика.

Када желите да упоредите LLM моделе различитих типова, Artificial Analysis је још један одличан ресурс:

Извор: Artificial Analysis

Ако радите на специфичном случају употребе, претраживање фино подешених верзија које су фокусиране на исту област може бити ефикасно. Испробавање више отворених модела да бисте видели како се понашају у складу са вашим и очекивањима ваших корисника је такође добра пракса.

Следећи кораци

Најбоља ствар код отворених модела је што можете брзо почети да радите са њима. Погледајте Azure AI Foundry Model Catalog, који садржи посебну Hugging Face колекцију са моделима које смо овде поменули.

Учење се овде не зауставља, наставите путовање

Након завршетка ове лекције, погледајте нашу Generative AI Learning колекцију да бисте наставили да унапређујете своје знање о генеративној вештачкој интелигенцији!

Одрицање од одговорности: Овај документ је преведен коришћењем AI услуге за превођење Co-op Translator. Иако се трудимо да превод буде тачан, молимо вас да имате у виду да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на његовом изворном језику треба сматрати ауторитетним извором. За критичне информације препоручује се професионални људски превод. Нисмо одговорни за било каква неспоразума или погрешна тумачења која произилазе из коришћења овог превода.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Увод

Циљеви учења

Шта су отворени модели?

Предности отворених модела

Истраживање различитих отворених модела

Llama 2

Mistral

Falcon

Како изабрати

Следећи кораци

Учење се овде не зауставља, наставите путовање

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Увод

Циљеви учења

Шта су отворени модели?

Предности отворених модела

Истраживање различитих отворених модела

Llama 2

Mistral

Falcon

Како изабрати

Следећи кораци

Учење се овде не зауставља, наставите путовање