பெரிய மொழி மாடல்களைப் பயன்படுத்தி உருவாக்கும் AI பயன்பாடுகளை உருவாக்குவது புதிய சவால்களுடன் வருகிறது. முக்கிய பிரச்சினை, ஒரு குறிப்பிட்ட பயனர் கோரிக்கைக்கான மாடல் உருவாக்கிய உள்ளடக்கத்தில் பதிலின் தரத்தை (துல்லியமும் தொடர்பும்) உறுதிப்படுத்துவது. முந்தைய பாடங்களில், மாடலின் உள்ளீட்டை மாற்றுவதன் மூலம் இந்த பிரச்சினையைத் தீர்க்க முயற்சிக்கும் ப்ராம்ட் இன்ஜினியரிங் மற்றும் ரிட்ரீவல்-ஆக்மென்டட் ஜெனரேஷன் போன்ற தொழில்நுட்பங்களைப் பற்றி விவாதித்தோம்.
இன்றைய பாடத்தில், நன்றாக அமைத்தல் என்ற மூன்றாவது தொழில்நுட்பத்தைப் பற்றி விவாதிக்கிறோம், இது கூடுதல் தரவுடன் மாடலை மீண்டும் பயிற்சி அளிப்பதன் மூலம் சவாலுக்கு மாடல் தானே பதிலளிக்க முயற்சிக்கிறது. விவரங்களில் ஆழமாக செல்வோம்.
இந்த பாடம் முன்பே பயிற்சி அளிக்கப்பட்ட மொழி மாடல்களுக்கு நன்றாக அமைத்தல் என்ற கருத்தை அறிமுகப்படுத்துகிறது, இந்த அணுகுமுறையின் நன்மைகள் மற்றும் சவால்களை ஆராய்கிறது, மேலும் உங்கள் உருவாக்கும் AI மாடல்களின் செயல்திறனை மேம்படுத்த நன்றாக அமைத்தலை எப்போது மற்றும் எப்படி பயன்படுத்துவது என்பதற்கான வழிகாட்டுதலையும் வழங்குகிறது.
இந்த பாடத்தின் முடிவில், நீங்கள் பின்வரும் கேள்விகளுக்கு பதிலளிக்க முடியும்:
- மொழி மாடல்களுக்கு நன்றாக அமைத்தல் என்றால் என்ன?
- எப்போது, ஏன், நன்றாக அமைத்தல் பயனுள்ளதாக இருக்கும்?
- முன்பே பயிற்சி அளிக்கப்பட்ட மாடலை நான் எப்படி நன்றாக அமைக்க முடியும்?
- நன்றாக அமைத்தலின் வரம்புகள் என்ன?
தயார்? தொடங்குவோம்.
நாம் விவாதிக்கப் போகும் விஷயங்களைப் பற்றி முழு படத்தைப் பார்க்க விரும்புகிறீர்களா? இந்த பாடத்திற்கான கற்றல் பயணத்தை விவரிக்கும் விளக்கப்பட வழிகாட்டியைப் பாருங்கள் - நன்றாக அமைத்தலுக்கான முக்கிய கருத்துகள் மற்றும் ஊக்கத்தைப் பற்றி கற்றல் தொடங்கி, செயல்முறை மற்றும் சிறந்த நடைமுறைகளைப் புரிந்துகொள்வது வரை. இது ஆராய்வதற்கான ஒரு சுவாரஸ்யமான தலைப்பாகும், எனவே உங்கள் சுய-வழிகாட்டப்பட்ட கற்றல் பயணத்தை ஆதரிக்க கூடுதல் இணைப்புகளுக்கான Resources பக்கத்தை மறக்காமல் பாருங்கள்!
வரையறைப்படி, பெரிய மொழி மாடல்கள் இணையம் உள்ளிட்ட பல்வேறு ஆதாரங்களில் இருந்து பெறப்பட்ட பெரிய அளவிலான உரை தரவுகளில் முன்பே பயிற்சி அளிக்கப்பட்டவை. முந்தைய பாடங்களில், பயனர் கேள்விகளுக்கு ("ப்ராம்ட்கள்") மாடலின் பதில்களின் தரத்தை மேம்படுத்த ப்ராம்ட் இன்ஜினியரிங் மற்றும் ரிட்ரீவல்-ஆக்மென்டட் ஜெனரேஷன் போன்ற தொழில்நுட்பங்கள் தேவைப்படும் என்பதை நாங்கள் கற்றுக்கொண்டோம்.
ப்ராம்ட் இன்ஜினியரிங் தொழில்நுட்பம் மாடலுக்கு பதிலில் என்ன எதிர்பார்க்கப்படுகிறது என்பதைப் பற்றி மேலும் வழிகாட்டுதல்களை வழங்குவதில் (உள்ளடக்க வழிகாட்டுதல்) அல்லது சில உதாரணங்களை வழங்குவதில் (மறைமுக வழிகாட்டுதல்) அடிப்படையாகக் கொண்டது. இது few-shot learning என்று குறிப்பிடப்படுகிறது, ஆனால் இதற்கு இரண்டு வரம்புகள் உள்ளன:
- மாடல் டோக்கன் வரம்புகள் நீங்கள் வழங்கக்கூடிய உதாரணங்களின் எண்ணிக்கையை கட்டுப்படுத்தலாம் மற்றும் செயல்திறனை குறைக்கலாம்.
- மாடல் டோக்கன் செலவுகள் ஒவ்வொரு ப்ராம்ட்டுக்கும் உதாரணங்களைச் சேர்ப்பதை விலையுயர்ந்ததாக மாற்றலாம் மற்றும் நெகிழ்வுத்தன்மையை கட்டுப்படுத்தலாம்.
நன்றாக அமைத்தல் என்பது இயந்திர கற்றல் அமைப்புகளில் பொதுவாகப் பயன்படுத்தப்படும் நடைமுறையாகும், இதில் ஒரு முன்பே பயிற்சி அளிக்கப்பட்ட மாடலை எடுத்து புதிய தரவுடன் மீண்டும் பயிற்சி அளித்து ஒரு குறிப்பிட்ட பணியில் அதன் செயல்திறனை மேம்படுத்துகிறோம். மொழி மாடல்களின் சூழலில், நன்றாக அமைத்தல் என்பது தனிப்பயன் மாடல் ஒன்றை உருவாக்க ஒரு குறிப்பிட்ட பணிக்கோளுக்கோ அல்லது பயன்பாட்டு துறைக்கோ தேவையான உதாரணங்களின் தொகுப்புடன் முன்பே பயிற்சி அளிக்கப்பட்ட மாடலை நன்றாக அமைத்தல் ஆகும். நன்றாக அமைத்தலின் ஒரு பக்க நன்மை என்னவென்றால், இது few-shot learning க்கான உதாரணங்களின் எண்ணிக்கையை குறைக்கவும் - டோக்கன் பயன்பாட்டை மற்றும் தொடர்புடைய செலவுகளை குறைக்கவும் உதவுகிறது.
இந்த சூழலில், நாங்கள் நன்றாக அமைத்தல் பற்றி பேசும்போது, சூப்பர்வைஸ்டு நன்றாக அமைத்தலைக் குறிப்பிடுகிறோம், இதில் புதிய தரவுகளைச் சேர்ப்பதன் மூலம் மீண்டும் பயிற்சி அளிக்கப்படுகிறது, இது அசல் பயிற்சி தரவுத்தொகுப்பின் ஒரு பகுதியாக இல்லை. இது மாடல் அசல் தரவுகளில் மீண்டும் பயிற்சி அளிக்கப்படும், ஆனால் வேறு ஹைப்பர்பாராமீட்டர்களுடன் இருக்கும் ஒரு அசூப்பர்வைஸ்டு நன்றாக அமைத்தல் அணுகுமுறையிலிருந்து வேறுபட்டது.
நன்றாக அமைத்தல் என்பது எதிர்பார்க்கப்பட்ட மேம்பாடுகளை வழங்காமல் இருக்கலாம் அல்லது உங்கள் இலக்கு துறைக்கான மாடலின் செயல்திறனை குறைக்கக்கூடும் என்பதால், இது ஒரு குறிப்பிட்ட அளவிலான நிபுணத்துவத்தைத் தேவைப்படும் ஒரு மேம்பட்ட தொழில்நுட்பம் என்பதை நினைவில் கொள்ள வேண்டும்.
எனவே, மொழி மாடல்களை "எப்படி" நன்றாக அமைக்க வேண்டும் என்பதை நீங்கள் கற்றுக்கொள்வதற்கு முன், நீங்கள் இந்த வழியை ஏன் எடுத்துக்கொள்ள வேண்டும், மற்றும் நன்றாக அமைத்தலை எப்போது தொடங்க வேண்டும் என்பதை "எதற்காக" தெரிந்துகொள்ள வேண்டும். இந்த கேள்விகளை முதலில் கேளுங்கள்:
- பயன்பாட்டு வழக்கு: நன்றாக அமைத்தலுக்கான உங்கள் பயன்பாட்டு வழக்கு என்ன? தற்போதைய முன்பே பயிற்சி அளிக்கப்பட்ட மாடலில் நீங்கள் மேம்படுத்த விரும்பும் அம்சம் என்ன?
- மாற்று வழிகள்: நீங்கள் விரும்பிய முடிவுகளை அடைய மற்ற தொழில்நுட்பங்களை முயற்சித்தீர்களா? ஒப்பீட்டுக்கான அடிப்படை அளவுகோலை உருவாக்க அவற்றைப் பயன்படுத்தவும்.
- ப்ராம்ட் இன்ஜினியரிங்: தொடர்புடைய ப்ராம்ட் பதில்களின் உதாரணங்களுடன் few-shot prompting போன்ற தொழில்நுட்பங்களை முயற்சிக்கவும். பதில்களின் தரத்தை மதிப்பீடு செய்யவும்.
- ரிட்ரீவல் ஆக்மென்டட் ஜெனரேஷன்: உங்கள் தரவைக் கண்டறிந்து தேடல் முடிவுகளைப் பயன்படுத்தி ப்ராம்ட்களை மேம்படுத்த முயற்சிக்கவும். பதில்களின் தரத்தை மதிப்பீடு செய்யவும்.
- செலவுகள்: நன்றாக அமைத்தலுக்கான செலவுகளை நீங்கள் அடையாளம் கண்டுள்ளீர்களா?
- டியூனபிலிட்டி - நன்றாக அமைத்தலுக்கு முன்பே பயிற்சி அளிக்கப்பட்ட மாடல் கிடைக்குமா?
- முயற்சி - பயிற்சி தரவுகளைத் தயாரிக்க, மாடலை மதிப்பீடு செய்ய & மேம்படுத்த.
- கணினி - நன்றாக அமைத்தல் வேலைகளை இயக்கவும், மற்றும் நன்றாக அமைக்கப்பட்ட மாடலை பிரசுரிக்கவும்.
- தரவு - நன்றாக அமைத்தலின் தாக்கத்திற்கான போதுமான தரமான உதாரணங்களை அணுகுதல்.
- நன்மைகள்: நன்றாக அமைத்தலுக்கான நன்மைகளை நீங்கள் உறுதிப்படுத்தியுள்ளீர்களா?
- தரம் - நன்றாக அமைக்கப்பட்ட மாடல் அடிப்படை அளவுகோலை விட சிறப்பாக செயல்பட்டதா?
- செலவு - இது ப்ராம்ட்களை எளிமைப்படுத்துவதன் மூலம் டோக்கன் பயன்பாட்டை குறைக்கிறதா?
- விரிவாக்கத்தன்மை - நீங்கள் அடிப்படை மாடலை புதிய துறைகளுக்கு மறுபயன்படுத்த முடியுமா?
இந்த கேள்விகளுக்கு பதிலளிப்பதன் மூலம், உங்கள் பயன்பாட்டு வழக்குக்கு நன்றாக அமைத்தல் சரியான அணுகுமுறைதானா என்பதை நீங்கள் முடிவு செய்ய முடியும். வழக்கமாக, நன்மைகள் செலவுகளை விட அதிகமாக இருந்தால் மட்டுமே இந்த அணுகுமுறை செல்லுபடியாகும். நீங்கள் தொடர முடிவு செய்ததும், முன்பே பயிற்சி அளிக்கப்பட்ட மாடலை எப்படி நன்றாக அமைக்க முடியும் என்று யோசிக்க நேரம்.
முடிவெடுக்கும் செயல்முறையைப் பற்றி மேலும் தகவல்களைப் பெற விரும்புகிறீர்களா? To fine-tune or not to fine-tune ஐப் பாருங்கள்.
முன்பே பயிற்சி அளிக்கப்பட்ட மாடலை நன்றாக அமைக்க, உங்களுக்கு தேவையானவை:
- நன்றாக அமைக்க ஒரு முன்பே பயிற்சி அளிக்கப்பட்ட மாடல்
- நன்றாக அமைத்தலுக்கு பயன்படுத்த ஒரு தரவுத்தொகுப்பு
- நன்றாக அமைத்தல் வேலைகளை இயக்க ஒரு பயிற்சி சூழல்
- நன்றாக அமைக்கப்பட்ட மாடலை பிரசுரிக்க ஒரு ஹோஸ்டிங் சூழல்
கீழே உள்ள வளங்கள் தேர்ந்தெடுக்கப்பட்ட மாடல் மற்றும் தொகுக்கப்பட்ட தரவுத்தொகுப்பைப் பயன்படுத்தி ஒரு உண்மையான உதாரணத்தை உலாவுவதற்கான படிப்படியாகக் கற்றல் வழிகாட்டுதல்களை வழங்குகின்றன. இந்த வழிகாட்டுதல்களைப் பின்பற்ற, குறிப்பிட்ட வழங்குநரின் கணக்கை வைத்திருக்க வேண்டும், மற்றும் தொடர்புடைய மாடல் மற்றும் தரவுத்தொகுப்புகளுக்கான அணுகலைப் பெற வேண்டும்.
| வழங்குநர் | வழிகாட்டுதல் | விளக்கம் |
|---|---|---|
| OpenAI | How to fine-tune chat models | gpt-35-turbo மாடலை ஒரு குறிப்பிட்ட துறைக்கான ("சமையல் உதவியாளர்") நன்றாக அமைத்தல், பயிற்சி தரவுகளைத் தயாரித்தல், நன்றாக அமைத்தல் வேலைகளை இயக்குதல் மற்றும் inference க்கான நன்றாக அமைக்கப்பட்ட மாடலைப் பயன்படுத்துதல். |
| Azure OpenAI | GPT 3.5 Turbo fine-tuning tutorial | gpt-35-turbo-0613 மாடலை Azure-ல் நன்றாக அமைத்தல், பயிற்சி தரவுகளை உருவாக்குதல் மற்றும் பதிவேற்றுதல், நன்றாக அமைத்தல் வேலைகளை இயக்குதல். புதிய மாடலை பிரசுரித்து பயன்படுத்துதல். |
| Hugging Face | Fine-tuning LLMs with Hugging Face | இந்த வலைப்பதிவு பதிவு transformers நூலகம் மற்றும் Transformer Reinforcement Learning (TRL) உடன் திறந்த datasets ஐ பயன்படுத்தி ஒரு திறந்த LLM (எ.கா: CodeLlama 7B) ஐ நன்றாக அமைத்தல் வழிகாட்டுகிறது. |
| 🤗 AutoTrain | Fine-tuning LLMs with AutoTrain | AutoTrain (அல்லது AutoTrain Advanced) என்பது Hugging Face மூலம் உருவாக்கப்பட்ட ஒரு பைதான் நூலகமாகும், இது LLM நன்றாக அமைத்தலையும் உள்ளடக்கிய பல்வேறு பணிகளுக்கு நன்றாக அமைத்தலை அனுமதிக்கிறது. AutoTrain என்பது ஒரு குறியீடு இல்லாத தீர்வாகும், மேலும் உங்கள் சொந்த கிளவுட், Hugging Face Spaces அல்லது உள்ளூர் இடத்தில் நன்றாக அமைத்தல் செய்யலாம். இது வலை அடிப்படையிலான GUI, CLI மற்றும் yaml கான்பிக் கோப்புகள் மூலம் பயிற்சியை ஆதரிக்கிறது. |
மேலே உள்ள வழிகாட்டுதல்களில் ஒன்றைத் தேர்ந்தெடுத்து அவற்றை உலாவுங்கள். இந்த கையேடுகளில் குறிப்பாக Jupyter Notebooks-ல் இந்த வழிகாட்டுதல்களின் ஒரு பதிப்பை நாங்கள் மீண்டும் உருவாக்கலாம். தயவுசெய்து, இந்த தலைப்புக்கான சமீபத்திய பதிப்புகளை நேரடியாக பெற அசல் மூலங்களைப் பயன்படுத்தவும்.
இந்த பாடத்தை முடித்த பிறகு, Generative AI Learning collection ஐப் பாருங்கள், உங்கள் Generative AI அறிவை மேம்படுத்த தொடர்ந்து கற்றல்!
வாழ்த்துக்கள்!! நீங்கள் இந்த பாடத்திற்கான v2 தொடர் இறுதி பாடத்தை முடித்துவிட்டீர்கள்! கற்றல் மற்றும் கட்டுவதில் நிறுத்தாதீர்கள். **இந்த தலைப்புக்கான கூடுதல் பரிந்துரைகளின் பட்டியலுக்கான RESOURCES பக்கத்தைப் பாருங்கள்.
எங்கள் v1 பாடங்களின் தொடர் கூட கூடுதல் பணிகள் மற்றும் கருத்துக்களுடன் புதுப்பிக்கப்பட்டுள்ளது. எனவே உங்கள் அறிவை புதுப்பிக்க ஒரு நிமிடம் எடுத்துக்கொள்ளுங்கள் - மேலும் இந்த பாடங்களை சமூகத்திற்காக மேம்படுத்த உதவ உங்கள் கேள்விகள் மற்றும் கருத்துகளைப் பகிரவும்.
குறிப்பு:
இந்த ஆவணம் AI மொழிபெயர்ப்பு சேவை Co-op Translator பயன்படுத்தி மொழிபெயர்க்கப்பட்டுள்ளது. நாங்கள் துல்லியத்திற்காக முயற்சிக்கின்றோம், ஆனால் தானியங்கி மொழிபெயர்ப்புகளில் பிழைகள் அல்லது தவறுகள் இருக்கக்கூடும் என்பதை கவனத்தில் கொள்ளவும். அதன் தாய்மொழியில் உள்ள மூல ஆவணம் அதிகாரப்பூர்வ ஆதாரமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிபெயர்ப்பு பரிந்துரைக்கப்படுகிறது. இந்த மொழிபெயர்ப்பைப் பயன்படுத்துவதால் ஏற்படும் எந்த தவறான புரிதல்கள் அல்லது தவறான விளக்கங்களுக்கு நாங்கள் பொறுப்பல்ல.

