Ulimwengu wa LLM za chanzo huria ni wa kusisimua na unabadilika kila wakati. Somo hili linakusudia kutoa muhtasari wa kina kuhusu miundo ya chanzo huria. Ikiwa unatafuta maelezo kuhusu jinsi miundo ya wamiliki inavyolinganishwa na miundo ya chanzo huria, nenda kwenye somo la "Kuchunguza na Kulinganisha LLM Tofauti". Somo hili pia litashughulikia mada ya kurekebisha lakini maelezo zaidi yanaweza kupatikana kwenye somo la "Kurekebisha LLM".
- Kupata uelewa wa Miundo ya Chanzo Huria
- Kuelewa faida za kufanya kazi na Miundo ya Chanzo Huria
- Kuchunguza miundo ya chanzo huria inayopatikana kwenye Hugging Face na Azure AI Studio
Programu ya chanzo huria imekuwa na jukumu muhimu katika ukuaji wa teknolojia katika nyanja mbalimbali. Mpango wa Chanzo Huria (OSI) umefafanua vigezo 10 vya programu ili kuainishwa kama chanzo huria. Msimbo wa chanzo lazima ushirikishwe wazi chini ya leseni iliyoidhinishwa na OSI.
Ingawa maendeleo ya LLM yana vipengele sawa na maendeleo ya programu, mchakato si sawa kabisa. Hii imeleta mjadala mwingi katika jamii kuhusu ufafanuzi wa chanzo huria katika muktadha wa LLM. Ili modeli iweze kuendana na ufafanuzi wa jadi wa chanzo huria, taarifa zifuatazo zinapaswa kupatikana hadharani:
- Seti za data zilizotumika kufundisha modeli.
- Uzito kamili wa modeli kama sehemu ya mafunzo.
- Msimbo wa tathmini.
- Msimbo wa kurekebisha.
- Uzito kamili wa modeli na vipimo vya mafunzo.
Kwa sasa kuna modeli chache tu zinazolingana na vigezo hivi. Modeli ya OLMo iliyoundwa na Taasisi ya Allen ya Akili Bandia (AllenAI) ni moja inayolingana na kategoria hii.
Kwa somo hili, tutarejelea modeli kama "miundo huria" kuendelea mbele kwani huenda zisilingane na vigezo vilivyo hapo juu wakati wa kuandika.
Inaweza Kubadilishwa Sana - Kwa kuwa miundo huria hutolewa na maelezo ya kina ya mafunzo, watafiti na watengenezaji wanaweza kurekebisha mambo ya ndani ya modeli. Hii inawezesha uundaji wa modeli maalum sana ambazo zimeboreshwa kwa kazi maalum au eneo la utafiti. Baadhi ya mifano ya hili ni kizazi cha msimbo, operesheni za hisabati na biolojia.
Gharama - Gharama kwa kila tokeni ya kutumia na kupeleka modeli hizi ni ya chini kuliko ile ya modeli za wamiliki. Wakati wa kujenga programu za AI za kizazi, kuangalia utendaji dhidi ya bei wakati wa kufanya kazi na modeli hizi kwa kesi yako ya matumizi inapaswa kufanywa.
Uwezo wa Kubadilika - Kufanya kazi na miundo huria kunakuwezesha kubadilika kwa kutumia modeli tofauti au kuzichanganya. Mfano wa hili ni HuggingChat Assistants ambapo mtumiaji anaweza kuchagua modeli inayotumika moja kwa moja kwenye kiolesura cha mtumiaji:
LLama2, iliyotengenezwa na Meta ni modeli huria ambayo imeboreshwa kwa programu za mazungumzo. Hii ni kutokana na mbinu yake ya kurekebisha, ambayo ilijumuisha kiwango kikubwa cha mazungumzo na maoni ya binadamu. Kwa mbinu hii, modeli hutoa matokeo zaidi yanayolingana na matarajio ya binadamu ambayo hutoa uzoefu bora wa mtumiaji.
Baadhi ya mifano ya matoleo yaliyorekebishwa ya Llama ni pamoja na Japanese Llama, ambayo inajikita katika Kijapani na Llama Pro, ambayo ni toleo lililoboreshwa la modeli ya msingi.
Mistral ni modeli huria yenye mtazamo mkubwa wa utendaji wa hali ya juu na ufanisi. Inatumia mbinu ya Mixture-of-Experts ambayo inachanganya kundi la modeli maalum za wataalamu katika mfumo mmoja ambapo kulingana na pembejeo, modeli fulani huchaguliwa kutumika. Hii inafanya hesabu kuwa bora zaidi kwani modeli zinashughulikia tu pembejeo ambazo zimebobea.
Baadhi ya mifano ya matoleo yaliyorekebishwa ya Mistral ni pamoja na BioMistral, ambayo inajikita katika uwanja wa matibabu na OpenMath Mistral, ambayo inafanya hesabu za hisabati.
Falcon ni LLM iliyoundwa na Taasisi ya Ubunifu wa Teknolojia (TII). Falcon-40B ilifundishwa kwa vigezo bilioni 40 ambavyo vimeonyeshwa kufanya vizuri zaidi kuliko GPT-3 kwa bajeti ndogo ya hesabu. Hii ni kutokana na matumizi yake ya algorithmi ya FlashAttention na umakini wa maswali mengi ambayo inawezesha kupunguza mahitaji ya kumbukumbu wakati wa utabiri. Kwa muda huu mfupi wa utabiri, Falcon-40B inafaa kwa programu za mazungumzo.
Baadhi ya mifano ya matoleo yaliyorekebishwa ya Falcon ni OpenAssistant, msaidizi aliyejengwa juu ya miundo huria na GPT4ALL, ambayo hutoa utendaji wa juu kuliko modeli ya msingi.
Hakuna jibu moja la kuchagua modeli huria. Sehemu nzuri ya kuanzia ni kutumia kipengele cha kuchuja kwa kazi cha Azure AI Studio. Hii itakusaidia kuelewa ni aina gani za kazi ambazo modeli imefundishwa. Hugging Face pia ina LLM Leaderboard ambayo inaonyesha modeli zinazofanya vizuri zaidi kulingana na vipimo fulani.
Unapotafuta kulinganisha LLMs katika aina tofauti, Artificial Analysis ni rasilimali nyingine nzuri:
Ikiwa unafanya kazi kwenye kesi maalum ya matumizi, kutafuta matoleo yaliyorekebishwa ambayo yanazingatia eneo hilo hilo kunaweza kuwa na ufanisi. Kujaribu modeli huria nyingi ili kuona jinsi zinavyofanya kazi kulingana na matarajio yako na ya watumiaji wako ni mazoezi mazuri.
Sehemu bora kuhusu miundo huria ni kwamba unaweza kuanza kufanya kazi nayo haraka. Angalia Katalogi ya Modeli ya Azure AI Foundry, ambayo ina mkusanyiko maalum wa Hugging Face na modeli hizi tulizojadili hapa.
Baada ya kukamilisha somo hili, angalia Mkusanyiko wa Kujifunza AI ya Kizazi ili kuendelea kuongeza maarifa yako ya AI ya Kizazi!
Kanusho:
Hati hii imetafsiriwa kwa kutumia huduma ya kutafsiri ya AI Co-op Translator. Ingawa tunajitahidi kwa usahihi, tafadhali fahamu kuwa tafsiri za kiotomatiki zinaweza kuwa na makosa au kutokuwa sahihi. Hati ya asili katika lugha yake ya asili inapaswa kuzingatiwa kama chanzo cha mamlaka. Kwa taarifa muhimu, tafsiri ya kitaalamu ya binadamu inapendekezwa. Hatutawajibika kwa kutoelewana au tafsiri zisizo sahihi zinazotokana na matumizi ya tafsiri hii.



