Skip to content

Latest commit

 

History

History
93 lines (56 loc) · 8.81 KB

File metadata and controls

93 lines (56 loc) · 8.81 KB

Modele Open Source

Introducere

Lumea LLM-urilor open source este captivantă și în continuă evoluție. Această lecție își propune să ofere o privire detaliată asupra modelelor open source. Dacă sunteți în căutarea informațiilor despre cum se compară modelele proprietare cu cele open source, accesați lecția "Explorarea și Compararea Diferitelor LLM-uri". Această lecție va aborda și subiectul ajustării fine, dar o explicație mai detaliată poate fi găsită în lecția "Ajustarea Fină a LLM-urilor".

Obiective de învățare

  • Înțelegerea modelelor open source
  • Înțelegerea beneficiilor lucrului cu modele open source
  • Explorarea modelelor disponibile pe Hugging Face și Azure AI Studio

Ce sunt Modelele Open Source?

Software-ul open source a jucat un rol crucial în dezvoltarea tehnologiei în diverse domenii. Open Source Initiative (OSI) a definit 10 criterii pentru software pentru a fi clasificat ca open source. Codul sursă trebuie să fie distribuit deschis sub o licență aprobată de OSI.

Deși dezvoltarea LLM-urilor are elemente similare cu dezvoltarea software-ului, procesul nu este exact același. Acest lucru a generat multe discuții în comunitate despre definiția open source în contextul LLM-urilor. Pentru ca un model să fie aliniat cu definiția tradițională de open source, următoarele informații ar trebui să fie disponibile public:

  • Seturile de date utilizate pentru antrenarea modelului.
  • Greutățile complete ale modelului ca parte a antrenamentului.
  • Codul de evaluare.
  • Codul de ajustare fină.
  • Greutățile complete ale modelului și metricele de antrenament.

În prezent, există doar câteva modele care îndeplinesc aceste criterii. Modelul OLMo creat de Allen Institute for Artificial Intelligence (AllenAI) este unul care se încadrează în această categorie.

Pentru această lecție, vom face referire la modele ca "modele deschise" de acum înainte, deoarece este posibil să nu se potrivească cu criteriile de mai sus la momentul redactării.

Beneficiile Modelelor Deschise

Foarte personalizabile - Deoarece modelele deschise sunt lansate cu informații detaliate despre antrenament, cercetătorii și dezvoltatorii pot modifica structura internă a modelului. Acest lucru permite crearea unor modele extrem de specializate, ajustate pentru o anumită sarcină sau domeniu de studiu. Unele exemple includ generarea de cod, operații matematice și biologie.

Cost - Costul per token pentru utilizarea și implementarea acestor modele este mai mic decât cel al modelelor proprietare. Când construiți aplicații Generative AI, ar trebui să analizați performanța versus prețul în funcție de cazul dvs. de utilizare.

Costul Modelului
Sursă: Artificial Analysis

Flexibilitate - Lucrul cu modele deschise vă permite să fiți flexibil în utilizarea diferitelor modele sau combinarea acestora. Un exemplu este HuggingChat Assistants, unde utilizatorul poate selecta modelul utilizat direct în interfața utilizatorului:

Alege Modelul

Explorarea Diferitelor Modele Deschise

Llama 2

LLama2, dezvoltat de Meta, este un model deschis optimizat pentru aplicații bazate pe chat. Acest lucru se datorează metodei de ajustare fină, care a inclus o cantitate mare de dialoguri și feedback uman. Cu această metodă, modelul produce mai multe rezultate aliniate așteptărilor umane, oferind o experiență mai bună utilizatorului.

Unele exemple de versiuni ajustate fin ale Llama includ Japanese Llama, care se specializează în limba japoneză, și Llama Pro, care este o versiune îmbunătățită a modelului de bază.

Mistral

Mistral este un model deschis cu un accent puternic pe performanță și eficiență. Utilizează abordarea Mixture-of-Experts, care combină un grup de modele experte specializate într-un singur sistem, unde, în funcție de intrare, anumite modele sunt selectate pentru utilizare. Acest lucru face ca procesarea să fie mai eficientă, deoarece modelele abordează doar intrările în care sunt specializate.

Unele exemple de versiuni ajustate fin ale Mistral includ BioMistral, care se concentrează pe domeniul medical, și OpenMath Mistral, care efectuează calcule matematice.

Falcon

Falcon este un LLM creat de Technology Innovation Institute (TII). Falcon-40B a fost antrenat pe 40 de miliarde de parametri, ceea ce s-a dovedit a fi mai performant decât GPT-3 cu un buget de calcul mai mic. Acest lucru se datorează utilizării algoritmului FlashAttention și atenției multiquery, care îi permite să reducă cerințele de memorie în timpul inferenței. Cu acest timp redus de inferență, Falcon-40B este potrivit pentru aplicații de chat.

Unele exemple de versiuni ajustate fin ale Falcon sunt OpenAssistant, un asistent construit pe modele deschise, și GPT4ALL, care oferă performanțe mai ridicate decât modelul de bază.

Cum să Alegi

Nu există un răspuns unic pentru alegerea unui model deschis. Un punct bun de plecare este utilizarea funcției de filtrare după sarcină din Azure AI Studio. Acest lucru vă va ajuta să înțelegeți ce tipuri de sarcini au fost antrenate modelele. Hugging Face menține, de asemenea, un clasament LLM care vă arată cele mai performante modele pe baza anumitor metrici.

Când doriți să comparați LLM-uri între diferite tipuri, Artificial Analysis este o altă resursă excelentă:

Calitatea Modelului
Sursă: Artificial Analysis

Dacă lucrați la un caz de utilizare specific, căutarea versiunilor ajustate fin care se concentrează pe același domeniu poate fi eficientă. Experimentarea cu mai multe modele deschise pentru a vedea cum performează în funcție de așteptările dvs. și ale utilizatorilor este o altă practică bună.

Pași Următori

Partea cea mai bună despre modelele deschise este că puteți începe să lucrați cu ele destul de rapid. Consultați Catalogul de Modele Azure AI Foundry, care include o colecție specifică Hugging Face cu modelele discutate aici.

Învățarea nu se oprește aici, continuă călătoria

După ce ați finalizat această lecție, consultați Colecția de Învățare Generative AI pentru a continua să vă dezvoltați cunoștințele despre Generative AI!


Declinare de responsabilitate:
Acest document a fost tradus folosind serviciul de traducere AI Co-op Translator. Deși ne străduim să asigurăm acuratețea, vă rugăm să fiți conștienți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa natală ar trebui considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de oameni. Nu ne asumăm responsabilitatea pentru neînțelegeri sau interpretări greșite care pot apărea din utilizarea acestei traduceri.