Skip to content

Latest commit

 

History

History
86 lines (49 loc) · 7.61 KB

File metadata and controls

86 lines (49 loc) · 7.61 KB

Open Source Models

Utangulizi

Ulimwengu wa LLM za chanzo huria ni wa kusisimua na unaendelea kubadilika kila wakati. Somo hili linalenga kutoa mtazamo wa kina juu ya mifano ya chanzo huria. Ikiwa unatafuta taarifa juu ya jinsi mifano ya umiliki inavyolinganishwa na mifano ya chanzo huria, nenda kwenye somo la "Kuchunguza na Kulinganisha LLM Tofauti". Somo hili pia litashughulikia mada ya urekebishaji wa kina lakini maelezo zaidi yanaweza kupatikana katika somo la "Urekebishaji wa Kina wa LLM".

Malengo ya Kujifunza

  • Kupata uelewa wa Mifano ya Chanzo Huria
  • Kuelewa faida za kufanya kazi na Mifano ya Chanzo Huria
  • Kuchunguza mifano huria inayopatikana kwenye Hugging Face na Azure AI Studio

Mifano ya Chanzo Huria ni Nini?

Programu za chanzo huria zimekuwa na jukumu muhimu katika ukuaji wa teknolojia katika nyanja mbalimbali. Shirika la Chanzo Huria (OSI) limefafanua vigezo 10 vya programu ili kuainisha kama chanzo huria. Msimbo wa chanzo lazima usambazwe wazi chini ya leseni iliyokubaliwa na OSI.

Wakati maendeleo ya LLM yana vipengele vinavyofanana na maendeleo ya programu, mchakato si sawa kabisa. Hii imesababisha mijadala mingi katika jamii juu ya ufafanuzi wa chanzo huria katika muktadha wa LLM. Ili mfano uwe sambamba na ufafanuzi wa jadi wa chanzo huria, taarifa zifuatazo zinapaswa kupatikana hadharani:

  • Seti za data zilizotumika kufundisha mfano.
  • Uzito kamili wa mfano kama sehemu ya mafunzo.
  • Msimbo wa tathmini.
  • Msimbo wa urekebishaji wa kina.
  • Uzito kamili wa mfano na vipimo vya mafunzo.

Kwa sasa kuna mifano michache tu inayokidhi vigezo hivi. Mfano wa OLMo ulioanzishwa na Taasisi ya Allen ya Akili Bandia (AllenAI) ni mmoja anayefaa katika kategoria hii.

Kwa somo hili, tutarejelea mifano kama "mifano huria" kuendelea kwani huenda haikidhi vigezo hapo juu wakati wa kuandika.

Faida za Mifano Huria

Inayoweza Kubadilishwa kwa Kina - Kwa kuwa mifano huria hutolewa na taarifa za kina za mafunzo, watafiti na waendelezaji wanaweza kubadilisha mambo ya ndani ya mfano. Hii inaruhusu kuunda mifano maalum sana iliyorekebishwa kwa kazi au eneo fulani la utafiti. Mifano ya hii ni kama uzalishaji wa msimbo, operesheni za hisabati na biolojia.

Gharama - Gharama kwa tokeni kwa kutumia na kupeleka mifano hii ni chini kuliko ile ya mifano ya umiliki. Unapojenga programu za AI za kizazi, kuangalia utendaji dhidi ya bei unapotumia mifano hii kwa matumizi yako ni muhimu.

Model Cost Chanzo: Artificial Analysis

Uwezo wa Kubadilika - Kufanya kazi na mifano huria kunakuwezesha kuwa na uhuru wa kutumia mifano tofauti au kuziunganisha. Mfano wa hili ni HuggingChat Assistants ambapo mtumiaji anaweza kuchagua mfano unaotumika moja kwa moja kwenye kiolesura cha mtumiaji:

Choose Model

Kuchunguza Mifano Huria Tofauti

Llama 2

LLama2, iliyotengenezwa na Meta ni mfano huria ulioboreshwa kwa matumizi ya mazungumzo. Hii ni kutokana na njia yake ya urekebishaji wa kina, ambayo ilijumuisha mazungumzo mengi na maoni ya binadamu. Kwa njia hii, mfano hutoa matokeo zaidi yanayolingana na matarajio ya binadamu ambayo yanatoa uzoefu bora kwa mtumiaji.

Mifano ya toleo zilizorekebishwa za Llama ni pamoja na Japanese Llama, inayobobea katika Kijapani na Llama Pro, toleo lililoboreshwa la mfano wa msingi.

Mistral

Mistral ni mfano huria wenye msisitizo mkubwa wa utendaji na ufanisi. Inatumia mbinu ya Mixture-of-Experts inayochanganya kundi la mifano maalum ya wataalamu katika mfumo mmoja ambapo kulingana na ingizo, mifano fulani huchaguliwa kutumika. Hii hufanya hesabu kuwa bora zaidi kwani mifano inashughulikia tu ingizo walilobobea.

Mifano ya toleo zilizorekebishwa za Mistral ni pamoja na BioMistral, inayolenga eneo la tiba na OpenMath Mistral, inayofanya hesabu za hisabati.

Falcon

Falcon ni LLM iliyotengenezwa na Taasisi ya Ubunifu wa Teknolojia (TII). Falcon-40B ilifundishwa kwa vigezo bilioni 40 ambavyo vimeonyesha kufanya vizuri zaidi kuliko GPT-3 kwa bajeti ndogo ya kompyuta. Hii ni kutokana na matumizi ya algoriti ya FlashAttention na multiquery attention inayomruhusu kupunguza mahitaji ya kumbukumbu wakati wa utambuzi. Kwa kupunguzwa kwa muda wa utambuzi, Falcon-40B ni bora kwa matumizi ya mazungumzo.

Mifano ya toleo zilizorekebishwa za Falcon ni pamoja na OpenAssistant, msaidizi aliyejengwa kwa mifano huria na GPT4ALL, inayotoa utendaji bora zaidi kuliko mfano wa msingi.

Jinsi ya Kuchagua

Hakuna jibu moja la kuchagua mfano huria. Mahali pazuri pa kuanza ni kutumia kipengele cha kuchuja kwa kazi cha Azure AI Studio. Hii itakusaidia kuelewa aina za kazi ambazo mfano umefundishwa. Hugging Face pia ina LLM Leaderboard inayokuonyesha mifano bora zaidi kulingana na vipimo fulani.

Unapotaka kulinganisha LLM kati ya aina tofauti, Artificial Analysis ni rasilimali nyingine nzuri:

Model Quality Chanzo: Artificial Analysis

Ikiwa unafanya kazi kwa matumizi maalum, kutafuta toleo zilizorekebishwa zinazolenga eneo hilo linaweza kuwa na ufanisi. Ku jaribu mifano huria mingi kuona jinsi inavyofanya kazi kulingana na matarajio yako na ya watumiaji ni mazoezi mazuri pia.

Hatua Zifuatazo

Sehemu bora kuhusu mifano huria ni kwamba unaweza kuanza kufanya kazi nayo haraka. Angalia Azure AI Foundry Model Catalog, ambayo ina mkusanyiko maalum wa Hugging Face na mifano tuliyojadili hapa.

Kujifunza hakukomi hapa, endelea Safari

Baada ya kumaliza somo hili, angalia Mkusanyiko wa Kujifunza AI ya Kizazi ili kuendelea kuongeza maarifa yako ya AI ya Kizazi!


Kiarifu cha Msamaha: Hati hii imetafsiriwa kwa kutumia huduma ya tafsiri ya AI Co-op Translator. Ingawa tunajitahidi kwa usahihi, tafadhali fahamu kuwa tafsiri za kiotomatiki zinaweza kuwa na makosa au upungufu wa usahihi. Hati ya asili katika lugha yake ya asili inapaswa kuchukuliwa kama chanzo cha mamlaka. Kwa taarifa muhimu, tafsiri ya kitaalamu ya binadamu inapendekezwa. Hatubebei dhamana kwa kutoelewana au tafsiri potofu zinazotokana na matumizi ya tafsiri hii.