Svijet open-source LLM-ova je uzbudljiv i stalno se razvija. Ova lekcija ima za cilj pružiti detaljan pregled open-source modela. Ako tražite informacije o tome kako se vlasnički modeli uspoređuju s open-source modelima, posjetite lekciju "Istraživanje i usporedba različitih LLM-ova". Ova lekcija također će obuhvatiti temu fine-tuninga, ali detaljnije objašnjenje možete pronaći u lekciji "Fine-Tuning LLM-ova".
- Razumjeti open-source modele
- Shvatiti prednosti rada s open-source modelima
- Istražiti dostupne open-source modele na Hugging Face i Azure AI Studio
Open-source softver igra ključnu ulogu u razvoju tehnologije u raznim područjima. Open Source Initiative (OSI) definirao je 10 kriterija za softver kako bi se klasificirao kao open-source. Izvorni kod mora biti javno dostupan pod licencom koju je odobrio OSI.
Iako razvoj LLM-ova ima slične elemente kao i razvoj softvera, proces nije potpuno isti. To je izazvalo mnogo rasprava u zajednici o definiciji open-sourcea u kontekstu LLM-ova. Da bi model bio usklađen s tradicionalnom definicijom open-sourcea, sljedeće informacije trebale bi biti javno dostupne:
- Skupovi podataka korišteni za treniranje modela.
- Puni težinski parametri modela kao dio treniranja.
- Kod za evaluaciju.
- Kod za fine-tuning.
- Puni težinski parametri modela i metrički podaci o treniranju.
Trenutno postoji samo nekoliko modela koji zadovoljavaju ove kriterije. OLMo model koji je kreirao Allen Institute for Artificial Intelligence (AllenAI) jedan je od njih.
Za ovu lekciju, modele ćemo nazivati "otvorenim modelima" jer možda ne zadovoljavaju gore navedene kriterije u trenutku pisanja.
Visoka prilagodljivost - Budući da su otvoreni modeli objavljeni s detaljnim informacijama o treniranju, istraživači i programeri mogu mijenjati unutarnje dijelove modela. To omogućuje stvaranje visoko specijaliziranih modela koji su prilagođeni za određeni zadatak ili područje istraživanja. Neki primjeri uključuju generiranje koda, matematičke operacije i biologiju.
Trošak - Trošak po tokenu za korištenje i implementaciju ovih modela niži je od troška vlasničkih modela. Prilikom izrade aplikacija za generativnu umjetnu inteligenciju, treba razmotriti omjer performansi i cijene u odnosu na vaš slučaj upotrebe.
Fleksibilnost - Rad s otvorenim modelima omogućuje fleksibilnost u korištenju različitih modela ili njihovoj kombinaciji. Primjer za to su HuggingChat asistenti gdje korisnik može odabrati model koji se koristi izravno u korisničkom sučelju:
LLama2, koji je razvio Meta, otvoreni je model optimiziran za aplikacije temeljene na razgovoru. To je rezultat metode fine-tuninga koja uključuje veliku količinu dijaloga i povratnih informacija od ljudi. Ova metoda omogućuje modelu da proizvodi rezultate koji su više usklađeni s ljudskim očekivanjima, što pruža bolje korisničko iskustvo.
Neki primjeri fine-tuniranih verzija Llama uključuju Japanese Llama, koji se specijalizira za japanski jezik, i Llama Pro, koji je poboljšana verzija osnovnog modela.
Mistral je otvoreni model s naglaskom na visoke performanse i učinkovitost. Koristi pristup Mixture-of-Experts, koji kombinira grupu specijaliziranih ekspertnih modela u jedan sustav gdje se, ovisno o ulazu, odabiru određeni modeli za korištenje. To čini izračun učinkovitijim jer modeli obrađuju samo ulaze u kojima su specijalizirani.
Neki primjeri fine-tuniranih verzija Mistrala uključuju BioMistral, koji je fokusiran na medicinsko područje, i OpenMath Mistral, koji obavlja matematičke izračune.
Falcon je LLM koji je kreirao Technology Innovation Institute (TII). Falcon-40B treniran je na 40 milijardi parametara, što se pokazalo boljim od GPT-3 uz manji proračunski kapacitet. To je rezultat korištenja algoritma FlashAttention i multiquery attention, koji omogućuju smanjenje zahtjeva za memorijom tijekom vremena izvođenja. S ovim smanjenim vremenom izvođenja, Falcon-40B je prikladan za aplikacije temeljene na razgovoru.
Neki primjeri fine-tuniranih verzija Falcona su OpenAssistant, asistent izgrađen na otvorenim modelima, i GPT4ALL, koji pruža bolje performanse od osnovnog modela.
Ne postoji jednoznačan odgovor na pitanje kako odabrati otvoreni model. Dobar početak je korištenje značajke filtriranja prema zadatku u Azure AI Studio. To će vam pomoći da razumijete za koje vrste zadataka je model treniran. Hugging Face također održava LLM Leaderboard koji prikazuje najbolje modele prema određenim metrima.
Ako želite usporediti LLM-ove različitih vrsta, Artificial Analysis je još jedan odličan resurs:
Ako radite na specifičnom slučaju upotrebe, učinkovito je potražiti fine-tunirane verzije koje su fokusirane na isto područje. Eksperimentiranje s više otvorenih modela kako biste vidjeli kako se ponašaju u skladu s vašim i očekivanjima vaših korisnika također je dobra praksa.
Najbolji dio kod otvorenih modela je to što možete brzo započeti rad s njima. Pogledajte Azure AI Foundry Model Catalog, koji sadrži specifičnu kolekciju Hugging Face modela o kojima smo ovdje raspravljali.
Nakon što završite ovu lekciju, pogledajte našu Generative AI Learning kolekciju kako biste nastavili unapređivati svoje znanje o generativnoj umjetnoj inteligenciji!
Odricanje od odgovornosti:
Ovaj dokument je preveden pomoću AI usluge za prevođenje Co-op Translator. Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati autoritativnim izvorom. Za ključne informacije preporučuje se profesionalni prijevod od strane čovjeka. Ne odgovaramo za nesporazume ili pogrešna tumačenja koja proizlaze iz korištenja ovog prijevoda.



