Свет отворених LLM модела је узбудљив и стално се развија. Ова лекција има за циљ да пружи детаљан преглед отворених модела. Ако тражите информације о томе како се власнички модели упоређују са отвореним моделима, идите на лекцију "Истраживање и упоређивање различитих LLM модела". Ова лекција ће такође обрадити тему фино подешавање, али детаљније објашњење можете пронаћи у лекцији "Фино подешавање LLM модела".
- Стекните разумевање о отвореним моделима
- Разумевање предности рада са отвореним моделима
- Истраживање отворених модела доступних на Hugging Face и Azure AI Studio
Отворени софтвер има кључну улогу у развоју технологије у разним областима. Иницијатива за отворени софтвер (OSI) је дефинисала 10 критеријума за софтвер да би био класификован као отворен. Изворни код мора бити јавно доступан под лиценцом коју одобри OSI.
Иако развој LLM модела има сличне елементе као развој софтвера, процес није сасвим исти. Ово је изазвало много дискусија у заједници о дефиницији отвореног кода у контексту LLM модела. Да би модел био у складу са традиционалном дефиницијом отвореног кода, следеће информације треба да буду јавно доступне:
- Скуп података коришћен за тренирање модела.
- Потпуни тежински параметри модела као део тренинга.
- Код за евалуацију.
- Код за фино подешавање.
- Потпуни тежински параметри модела и метрике тренинга.
Тренутно постоји само неколико модела који испуњавају ове критеријуме. OLMo модел који је креирао Allen Institute for Artificial Intelligence (AllenAI) је један од њих.
За ову лекцију, убудуће ћемо моделе називати "отворени модели" јер можда не испуњавају горе наведене критеријуме у тренутку писања.
Висока прилагодљивост - Пошто се отворени модели објављују са детаљним информацијама о тренингу, истраживачи и програмери могу модификовати унутрашњост модела. Ово омогућава креирање високо специјализованих модела који су фино подешени за одређени задатак или област студија. Неки примери су генерисање кода, математичке операције и биологија.
Трошкови - Трошак по токену за коришћење и имплементацију ових модела је нижи него код власничких модела. При изградњи апликација заснованих на генеративној вештачкој интелигенцији, треба размотрити однос перформанси и цене када радите са овим моделима за ваш конкретан случај употребе.
Флексибилност - Рад са отвореним моделима омогућава флексибилност у коришћењу различитих модела или њиховом комбиновaњу. Пример за то су HuggingChat асистенти где корисник може директно у корисничком интерфејсу изабрати модел који се користи:
LLama2, који је развио Meta, је отворени модел оптимизован за апликације засноване на ћаскању. То је због његове методе фино подешавања, која је укључивала велики број дијалога и људских повратних информација. Овом методом модел производи резултате који су више у складу са људским очекивањима, што пружа боље корисничко искуство.
Неки примери фино подешених верзија Llama укључују Japanese Llama, који је специјализован за јапански језик, и Llama Pro, који је унапређена верзија основног модела.
Mistral је отворени модел са снажним фокусом на високе перформансе и ефикасност. Користи приступ Mixture-of-Experts који комбинује групу специјализованих експертских модела у један систем где се у зависности од улаза бирају одређени модели за коришћење. Ово чини израчунавање ефикаснијим јер модели обрађују само оне улазе у којима су специјализовани.
Неки примери фино подешених верзија Mistral укључују BioMistral, који је фокусиран на медицинску област, и OpenMath Mistral, који изводи математичке прорачуне.
Falcon је LLM који је креирао Technology Innovation Institute (TII). Falcon-40B је трениран на 40 милијарди параметара и показало се да постиже боље резултате од GPT-3 уз мањи буџет за рачунарске ресурсе. То је због коришћења FlashAttention алгоритма и multiquery attention који му омогућавају смањење захтева за меморијом током извођења. Са овим скраћеним временом извођења, Falcon-40B је погодан за апликације за ћаскање.
Неки примери фино подешених верзија Falcon су OpenAssistant, асистент изграђен на отвореним моделима, и GPT4ALL, који пружа боље перформансе од основног модела.
Не постоји један одговор за избор отвореног модела. Добро место за почетак је коришћење функције филтрирања по задатку у Azure AI Studio. Ово ће вам помоћи да разумете за које типове задатака је модел трениран. Hugging Face такође одржава LLM табелу лидера која вам показује најбоље перформансе модела на основу одређених метрика.
Када желите да упоредите LLM моделе различитих типова, Artificial Analysis је још један одличан ресурс:
Ако радите на специфичном случају употребе, претраживање фино подешених верзија које су фокусиране на исту област може бити ефикасно. Испробавање више отворених модела да бисте видели како се понашају у складу са вашим и очекивањима ваших корисника је такође добра пракса.
Најбоља ствар код отворених модела је што можете брзо почети да радите са њима. Погледајте Azure AI Foundry Model Catalog, који садржи посебну Hugging Face колекцију са моделима које смо овде поменули.
Након завршетка ове лекције, погледајте нашу Generative AI Learning колекцију да бисте наставили да унапређујете своје знање о генеративној вештачкој интелигенцији!
Одрицање од одговорности: Овај документ је преведен коришћењем AI услуге за превођење Co-op Translator. Иако се трудимо да превод буде тачан, молимо вас да имате у виду да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на његовом изворном језику треба сматрати ауторитетним извором. За критичне информације препоручује се професионални људски превод. Нисмо одговорни за било каква неспоразума или погрешна тумачења која произилазе из коришћења овог превода.



