Oma LLM-i täpsustamine

Suurte keelemodellide kasutamine generatiivsete tehisintellekti rakenduste loomiseks toob kaasa uusi väljakutseid. Üks peamisi küsimusi on tagada mudeli genereeritud sisu vastuste kvaliteet (täpsus ja asjakohasus) kasutaja konkreetse päringu kohta. Varasemates tundides käsitlesime tehnikaid nagu promptide konstrueerimine ja otsingu-lisatud genereerimine, mis püüavad probleemi lahendada muutes olemasolevasse mudelisse sisestatavat prompti.

Selles tänases tunnis arutleme kolmanda tehnika, täpsustamise üle, mis püüab lahendada väljakutset mudeli endi ümberõppega täiendavate andmete abil. Sukeldume detailidesse.

Õpieesmärgid

See tund tutvustab täpsustamise kontseptsiooni eelõpetatud keelemudelite puhul, uurib selle lähenemise eeliseid ja väljakutseid ning annab juhiseid, millal ja kuidas kasutada täpsustamist, et parandada oma generatiivsete tehisintellekti mudelite sooritust.

Tunni lõpus peaksid sa suutma vastata järgmistele küsimustele:

Mis on keelemudelite täpsustamine?
Millal ja miks on täpsustamine kasulik?
Kuidas ma saan eelõpetatud mudelit täpsustada?
Millised on täpsustamise piirangud?

Valmis? Alustame.

Illustreeritud juhend

Tahad saada ülevaate sellest, mida me käsitleme, enne kui süveneda? Vaata seda illustreeritud juhendit, mis kirjeldab õppimise teekonda selle tunni jaoks – alates põhikontseptsioonide ja täpsustamise motivatsiooni õppimisest kuni protsessi ja parimate tavade mõistmiseni täpsustamise ülesande sooritamiseks. See on põnev uurimisvaldkond, nii et ära unusta vaadata ressursside lehte, kust leiad lisalinke oma iseseisva õppe toetamiseks!

Mis on keelemudelite täpsustamine?

Määratluse järgi on suured keelemudelid eelõpetatud suurte tekstikogustega, mis pärinevad mitmesugustest allikatest, sealhulgas internetist. Nagu oleme varasemates tundides õppinud, vajame mudeli vastuste kvaliteedi parandamiseks kasutaja küsimustele ("promptidele") selliseid tehnikaid nagu promptide konstrueerimine ja otsingu-lisatud genereerimine.

Populaarne promptide konstrueerimise tehnika on anda mudelile rohkem juhiseid selle kohta, mida vastuses oodatakse, kas siis juhiste (selged juhised) või mõne näite (kaudsed juhised) kaudu. Seda nimetatakse väheste näideteõppeks, kuid sellel on kaks piirangut:

Mudeli tokenite limiidid võivad piirata näidete arvu, mida saab esitada, ja vähendada tõhusust.
Mudeli tokeni kulud võivad muuta iga prompti näidetega täitmise kalliks ja piirata paindlikkust.

Täpsustamine on masinõppes tavaline praktika, kus võtame eelõpetatud mudeli ja õpime seda uuesti uute andmetega, et parandada selle sooritust konkreetse ülesande puhul. Keelemudelite kontekstis saame eelõpetatud mudelit täpsustada valitud näidete komplektiga antud ülesande või rakendusvaldkonna jaoks ja luua kohandatud mudeli, mis võib olla selle spetsiifilise ülesande või valdkonna jaoks täpsem ja asjakohasem. Täpsustamise kõrvalnäht on see, et see võib vähendada väheste näidete vajadust – vähendades tokenite kasutust ja sellega seotud kulusid.

Millal ja miks peaksime malle täpsustama?

Selles kontekstis, kui räägime täpsustamisest, viitame me juhendatud täpsustamisele, kus ümberõpe toimub, lisades uusi andmeid, mis ei olnud osa esialgsest treeningandmestikust. See erineb juhendamata täpsustamisest, kus mudelit uuesti õpitakse originaalandmestikul, kuid teistsuguste hüperparameetritega.

Oluline on meeles pidada, et täpsustamine on edasijõudnud tehnika, mis nõuab teatud tasemel ekspertiisi soovitud tulemuste saavutamiseks. Kui seda tehakse valesti, ei pruugi see anda oodatud paranemist ning võib isegi mudeli jõudlust sihitud valdkonnas halvendada.

Seega, enne kui õpid "kuidas" keelemudeleid täpsustada, pead teadma "miks" valida see tee ja "millal" alustada täpsustamise protsessi. Alusta nende küsimuste esitamisest:

Kasutusjuhtum: Mis on sinu kasutusjuhtum täpsustamiseks? Millist aspekti praegusest eelõpetatud mudelist soovid parandada?
Alternatiivid: Kas oled proovinud teisi tehnikaid soovitud tulemuste saavutamiseks? Kasuta neid enda võrdlusalusena.
- Promptide konstrueerimine: Proovi tehnikaid nagu väheste näidete promptid asjakohaste vastustega. Hinda vastuste kvaliteeti.
- Otsingu-lisatud genereerimine: Proovi promptide täiendamist päringu tulemustega, mis leiti su andmetest. Hinda vastuste kvaliteeti.
Kulud: Kas oled määratlenud täpsustamise kulud?
- Kohandatavus – kas eelõpetatud mudel on täpsustamiseks saadaval?
- Pingutus – treeningandmete ettevalmistamine, mudeli hindamine ja täiendamine.
- Arvutusressursid – täpsustamise tööde käivitamine ja täpsustatud mudeli juurutamine.
- Andmed – piisava kvaliteediga näidete kättesaadavus täpsustamise mõjutamiseks.
Eelised: Kas oled kinnitanud täpsustamise eelised?
- Kvaliteet – kas täpsustatud mudel ületas baasmudelit?
- Kulu – kas see vähendab tokenite kasutust lihtsustades promptide koostamist?
- Laiendatavus – kas saad baasmudelit kasutada uutes valdkondades?

Vastates neile küsimustele, peaksid suutma otsustada, kas täpsustamine on sinu kasutusjuhtu jaoks õige lähenemine. Ideaalselt on see sobiv ainult siis, kui eelised kaaluvad üles kulud. Kui otsustad edasi minna, on aeg mõelda, kuidas sa saad eelõpetatud mudelit täpsustada.

Tahan rohkem aru otsimisprotsessist? Vaata Täpsustada või mitte täpsustada.

Kuidas saame eelõpetatud mudelit täpsustada?

Eelõpetatud mudeli täpsustamiseks vajad:

eelõpetatud mudelit täpsustamiseks
andmekogumit täpsustamise jaoks
treeningkeskkonda täpsustamise töö käivitamiseks
hostimiskeskkonda täpsustatud mudeli juurutamiseks

Täpsustamine praktikas

Järgnevad ressursid pakuvad samm-sammulisi õpetusi, mis juhendavad sind läbi reaalse näite valitud mudeli ja kureeritud andmekogumi kasutamisel. Neis juhendites töötamiseks vajad konkreetse teenusepakkuja kontot, samuti juurdepääsu vastavatele mudelitele ja andmekogudele.

Teenusepakkuja	Õpetus	Kirjeldus
OpenAI	Kuidas täpsustada vestlusmudeleid	Õpi, kuidas täpsustada mudelit `gpt-35-turbo` konkreetse valdkonna ("retsepti assistent") jaoks, valmistades ette treeningandmed, käivitades täpsustamise ülesande ja kasutades täpsustatud mudelit päringute vastamiseks.
Azure OpenAI	GPT 3.5 Turbo täpsustamise õpetus	Õpi, kuidas täpsustada mudelit `gpt-35-turbo-0613` Azure platvormil, luues ja üles laadides treeningandmeid, käivitades täpsustamise ülesande, ning siis juurutades ja kasutades uut mudelit.
Hugging Face	LLM-ide täpsustamine Hugging Face'iga	See blogipostitus juhendab avatud keelemudeli (näiteks `CodeLlama 7B`) täpsustamist, kasutades transformers raamatukogu ja Transformer Reinforcement Learning (TRL) ning avatud andmekogusid Hugging Face platvormil.

🤗 AutoTrain	LLM-ide täpsustamine AutoTrainiga	AutoTrain (või AutoTrain Advanced) on Hugging Face’i python'i teek, mis võimaldab täpsustada mitmesuguste ülesannete jaoks, sealhulgas LLM täpsustamine. AutoTrain on mitteskriptitav lahendus, mille abil saab täpsustamist teha oma pilves, Hugging Face'i töölaual või lokaalselt. Toetab veebipõhist GUI-d, käsurealiidest ja treeningut yaml-konfiguratsioonifailide kaudu.

🦥 Unsloth	LLM-ide täpsustamine Unslothiga	Unsloth on avatud lähtekoodiga raamistik, mis toetab LLM täpsustamist ja tugevdamisõpet (RL). Unsloth lihtsustab lokaalset treeningut, hindamist ja juurutamist, pakkudes valmis märkmeid. Toetab ka teksti kõneks (TTS), BERT ja multimodaalseid mudeleid. Alustamiseks loe nende samm-sammult Täpsustamise juhendit LLM'idele.

Kodune ülesanne

Vali üks ülaltoodud õpetustest ja käi see läbi. Võime replitseerida nende õpetuste versiooni Jupyter Notebookides selles hoidlas ainult viitamiseks. Palun kasuta versioonide saamiseks otse originaalallikaid.

Suurepärane töö! Jätka õppimist.

Pärast selle tunni lõpetamist vaata meie Generatiivse tehisintellekti õppimiskogu, et jätkata oma generatiivse AI teadmiste täiendamist!

Palju õnne!! Sa oled lõpetanud selle kursuse v2 seeria viimase tunni! Ära lõpeta õppimist ja loomist. **Vaata RESSURSSE lehte, kus on selle teema kohta lisasoovitused.

Meie v1 seeria tunde on samuti värskendatud rohkemate ülesannete ja mõistetega. Võta hetk oma teadmiste värskendamiseks – ja palun jaga oma küsimusi ja tagasisidet, et aidata meil neid tunde kogukonna jaoks parandada.

Vastutusest loobumine: See dokument on tõlgitud tehisintellekti tõlketeenuse Co-op Translator abil. Kuigi me püüame täpsust, palun arvestage, et automaatsed tõlked võivad sisaldada vigu või ebatäpsusi. Originaaldokument oma algkeeles tuleks pidada autoriteetseks allikaks. Olulise teabe puhul soovitatakse kasutada professionaalset inimtõlget. Me ei vastuta selle tõlke kasutamisest tulenevate arusaamatuste või valesti mõistmiste eest.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Oma LLM-i täpsustamine

Õpieesmärgid

Illustreeritud juhend

Mis on keelemudelite täpsustamine?

Millal ja miks peaksime malle täpsustama?

Kuidas saame eelõpetatud mudelit täpsustada?

Täpsustamine praktikas

Kodune ülesanne

Suurepärane töö! Jätka õppimist.

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Oma LLM-i täpsustamine

Õpieesmärgid

Illustreeritud juhend

Mis on keelemudelite täpsustamine?

Millal ja miks peaksime malle täpsustama?

Kuidas saame eelõpetatud mudelit täpsustada?

Täpsustamine praktikas

Kodune ülesanne

Suurepärane töö! Jätka õppimist.