Svet open-source LLM je vzrušujúci a neustále sa vyvíja. Táto lekcia si kladie za cieľ poskytnúť podrobný pohľad na open-source modely. Ak hľadáte informácie o porovnaní proprietárnych modelov s open-source modelmi, prejdite na lekciu "Preskúmanie a porovnanie rôznych LLM". Táto lekcia sa tiež zaoberá témou jemného doladenia, ale podrobnejšie vysvetlenie nájdete v lekcii "Jemné doladenie LLM".
- Získať pochopenie open-source modelov
- Pochopiť výhody práce s open-source modelmi
- Preskúmať dostupné open-source modely na Hugging Face a Azure AI Studio
Open-source softvér zohral kľúčovú úlohu v rozvoji technológií v rôznych oblastiach. Open Source Initiative (OSI) definovala 10 kritérií pre softvér, aby mohol byť klasifikovaný ako open-source. Zdrojový kód musí byť otvorene zdieľaný pod licenciou schválenou OSI.
Aj keď vývoj LLM má podobné prvky ako vývoj softvéru, proces nie je úplne rovnaký. To vyvolalo veľa diskusií v komunite o definícii open-source v kontexte LLM. Aby model zodpovedal tradičnej definícii open-source, mali by byť verejne dostupné nasledujúce informácie:
- Dátové súbory použité na trénovanie modelu.
- Plné váhy modelu ako súčasť tréningu.
- Kód na hodnotenie.
- Kód na jemné doladenie.
- Plné váhy modelu a metriky tréningu.
Momentálne existuje len niekoľko modelov, ktoré spĺňajú tieto kritériá. Model OLMo vytvorený Allen Institute for Artificial Intelligence (AllenAI) je jedným z nich.
Pre túto lekciu budeme modely ďalej označovať ako "open modely", pretože v čase písania nemusia spĺňať vyššie uvedené kritériá.
Vysoká prispôsobiteľnosť - Keďže open modely sú vydávané s podrobnými informáciami o tréningu, výskumníci a vývojári môžu upravovať vnútorné časti modelu. To umožňuje vytvárať vysoko špecializované modely, ktoré sú jemne doladené na konkrétnu úlohu alebo oblasť štúdia. Niektoré príklady zahŕňajú generovanie kódu, matematické operácie a biológiu.
Náklady - Náklady na token pri používaní a nasadení týchto modelov sú nižšie ako pri proprietárnych modeloch. Pri budovaní aplikácií Generative AI by sa mala zohľadniť výkonnosť v porovnaní s cenou pri práci s týmito modelmi na vašom konkrétnom prípade použitia.
Flexibilita - Práca s open modelmi umožňuje flexibilitu pri používaní rôznych modelov alebo ich kombinovaní. Príkladom je HuggingChat Assistants, kde si používateľ môže priamo v používateľskom rozhraní vybrať model, ktorý sa používa:
LLama2, vyvinutý spoločnosťou Meta, je open model optimalizovaný pre aplikácie založené na chatovaní. Je to vďaka metóde jemného doladenia, ktorá zahŕňala veľké množstvo dialógov a spätnú väzbu od ľudí. Táto metóda umožňuje modelu produkovať výsledky, ktoré sú viac v súlade s očakávaniami ľudí, čo poskytuje lepší používateľský zážitok.
Niektoré príklady jemne doladených verzií Llama zahŕňajú Japanese Llama, ktorý sa špecializuje na japončinu, a Llama Pro, čo je vylepšená verzia základného modelu.
Mistral je open model so silným zameraním na vysoký výkon a efektivitu. Používa prístup Mixture-of-Experts, ktorý kombinuje skupinu špecializovaných expertných modelov do jedného systému, kde sa v závislosti od vstupu vyberajú určité modely na použitie. To robí výpočty efektívnejšími, pretože modely sa zaoberajú iba vstupmi, na ktoré sú špecializované.
Niektoré príklady jemne doladených verzií Mistral zahŕňajú BioMistral, ktorý sa zameriava na medicínsku oblasť, a OpenMath Mistral, ktorý vykonáva matematické výpočty.
Falcon je LLM vytvorený Technology Innovation Institute (TII). Falcon-40B bol trénovaný na 40 miliardách parametrov, čo sa ukázalo ako lepšie ako GPT-3 s menším výpočtovým rozpočtom. Je to vďaka použitiu algoritmu FlashAttention a multiquery attention, ktoré umožňujú znížiť požiadavky na pamäť počas času inferencie. S týmto zníženým časom inferencie je Falcon-40B vhodný pre aplikácie na chatovanie.
Niektoré príklady jemne doladených verzií Falcon sú OpenAssistant, asistent postavený na open modeloch, a GPT4ALL, ktorý poskytuje vyšší výkon ako základný model.
Neexistuje jednoznačná odpoveď na otázku, ako si vybrať open model. Dobrým začiatkom je použitie funkcie filtrovania podľa úlohy v Azure AI Studio. To vám pomôže pochopiť, na aké typy úloh bol model trénovaný. Hugging Face tiež udržiava LLM Leaderboard, ktorý ukazuje najlepšie výkonné modely na základe určitých metrík.
Pri porovnávaní LLM naprieč rôznymi typmi je ďalším skvelým zdrojom Artificial Analysis:
Ak pracujete na konkrétnom prípade použitia, efektívne môže byť hľadanie jemne doladených verzií, ktoré sa zameriavajú na rovnakú oblasť. Ďalšou dobrou praxou je experimentovanie s viacerými open modelmi, aby ste zistili, ako sa správajú podľa vašich očakávaní a očakávaní vašich používateľov.
Najlepšia vec na open modeloch je, že s nimi môžete začať pracovať pomerne rýchlo. Pozrite si Azure AI Foundry Model Catalog, ktorý obsahuje špecifickú kolekciu Hugging Face s modelmi, o ktorých sme tu hovorili.
Po dokončení tejto lekcie si pozrite našu Generative AI Learning collection, aby ste si naďalej rozširovali svoje vedomosti o Generative AI!
Zrieknutie sa zodpovednosti:
Tento dokument bol preložený pomocou služby AI prekladu Co-op Translator. Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nenesieme zodpovednosť za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.



