Skip to content

Latest commit

 

History

History
111 lines (74 loc) · 30 KB

File metadata and controls

111 lines (74 loc) · 30 KB

திறந்த மூல மாடல்கள்

உங்கள் LLM-ஐ நன்றாக அமைத்தல்

பெரிய மொழி மாடல்களைப் பயன்படுத்தி உருவாக்கும் AI பயன்பாடுகளை உருவாக்குவது புதிய சவால்களுடன் வருகிறது. முக்கிய பிரச்சினை, ஒரு குறிப்பிட்ட பயனர் கோரிக்கைக்கான மாடல் உருவாக்கிய உள்ளடக்கத்தில் பதிலின் தரத்தை (துல்லியமும் தொடர்பும்) உறுதிப்படுத்துவது. முந்தைய பாடங்களில், மாடலின் உள்ளீட்டை மாற்றுவதன் மூலம் இந்த பிரச்சினையைத் தீர்க்க முயற்சிக்கும் ப்ராம்ட் இன்ஜினியரிங் மற்றும் ரிட்ரீவல்-ஆக்மென்டட் ஜெனரேஷன் போன்ற தொழில்நுட்பங்களைப் பற்றி விவாதித்தோம்.

இன்றைய பாடத்தில், நன்றாக அமைத்தல் என்ற மூன்றாவது தொழில்நுட்பத்தைப் பற்றி விவாதிக்கிறோம், இது கூடுதல் தரவுடன் மாடலை மீண்டும் பயிற்சி அளிப்பதன் மூலம் சவாலுக்கு மாடல் தானே பதிலளிக்க முயற்சிக்கிறது. விவரங்களில் ஆழமாக செல்வோம்.

கற்றல் நோக்கங்கள்

இந்த பாடம் முன்பே பயிற்சி அளிக்கப்பட்ட மொழி மாடல்களுக்கு நன்றாக அமைத்தல் என்ற கருத்தை அறிமுகப்படுத்துகிறது, இந்த அணுகுமுறையின் நன்மைகள் மற்றும் சவால்களை ஆராய்கிறது, மேலும் உங்கள் உருவாக்கும் AI மாடல்களின் செயல்திறனை மேம்படுத்த நன்றாக அமைத்தலை எப்போது மற்றும் எப்படி பயன்படுத்துவது என்பதற்கான வழிகாட்டுதலையும் வழங்குகிறது.

இந்த பாடத்தின் முடிவில், நீங்கள் பின்வரும் கேள்விகளுக்கு பதிலளிக்க முடியும்:

  • மொழி மாடல்களுக்கு நன்றாக அமைத்தல் என்றால் என்ன?
  • எப்போது, ஏன், நன்றாக அமைத்தல் பயனுள்ளதாக இருக்கும்?
  • முன்பே பயிற்சி அளிக்கப்பட்ட மாடலை நான் எப்படி நன்றாக அமைக்க முடியும்?
  • நன்றாக அமைத்தலின் வரம்புகள் என்ன?

தயார்? தொடங்குவோம்.

விளக்கப்படம் வழிகாட்டி

நாம் விவாதிக்கப் போகும் விஷயங்களைப் பற்றி முழு படத்தைப் பார்க்க விரும்புகிறீர்களா? இந்த பாடத்திற்கான கற்றல் பயணத்தை விவரிக்கும் விளக்கப்பட வழிகாட்டியைப் பாருங்கள் - நன்றாக அமைத்தலுக்கான முக்கிய கருத்துகள் மற்றும் ஊக்கத்தைப் பற்றி கற்றல் தொடங்கி, செயல்முறை மற்றும் சிறந்த நடைமுறைகளைப் புரிந்துகொள்வது வரை. இது ஆராய்வதற்கான ஒரு சுவாரஸ்யமான தலைப்பாகும், எனவே உங்கள் சுய-வழிகாட்டப்பட்ட கற்றல் பயணத்தை ஆதரிக்க கூடுதல் இணைப்புகளுக்கான Resources பக்கத்தை மறக்காமல் பாருங்கள்!

மொழி மாடல்களை நன்றாக அமைத்தல் பற்றிய விளக்கப்படம்

மொழி மாடல்களுக்கு நன்றாக அமைத்தல் என்றால் என்ன?

வரையறைப்படி, பெரிய மொழி மாடல்கள் இணையம் உள்ளிட்ட பல்வேறு ஆதாரங்களில் இருந்து பெறப்பட்ட பெரிய அளவிலான உரை தரவுகளில் முன்பே பயிற்சி அளிக்கப்பட்டவை. முந்தைய பாடங்களில், பயனர் கேள்விகளுக்கு ("ப்ராம்ட்கள்") மாடலின் பதில்களின் தரத்தை மேம்படுத்த ப்ராம்ட் இன்ஜினியரிங் மற்றும் ரிட்ரீவல்-ஆக்மென்டட் ஜெனரேஷன் போன்ற தொழில்நுட்பங்கள் தேவைப்படும் என்பதை நாங்கள் கற்றுக்கொண்டோம்.

ப்ராம்ட் இன்ஜினியரிங் தொழில்நுட்பம் மாடலுக்கு பதிலில் என்ன எதிர்பார்க்கப்படுகிறது என்பதைப் பற்றி மேலும் வழிகாட்டுதல்களை வழங்குவதில் (உள்ளடக்க வழிகாட்டுதல்) அல்லது சில உதாரணங்களை வழங்குவதில் (மறைமுக வழிகாட்டுதல்) அடிப்படையாகக் கொண்டது. இது few-shot learning என்று குறிப்பிடப்படுகிறது, ஆனால் இதற்கு இரண்டு வரம்புகள் உள்ளன:

  • மாடல் டோக்கன் வரம்புகள் நீங்கள் வழங்கக்கூடிய உதாரணங்களின் எண்ணிக்கையை கட்டுப்படுத்தலாம் மற்றும் செயல்திறனை குறைக்கலாம்.
  • மாடல் டோக்கன் செலவுகள் ஒவ்வொரு ப்ராம்ட்டுக்கும் உதாரணங்களைச் சேர்ப்பதை விலையுயர்ந்ததாக மாற்றலாம் மற்றும் நெகிழ்வுத்தன்மையை கட்டுப்படுத்தலாம்.

நன்றாக அமைத்தல் என்பது இயந்திர கற்றல் அமைப்புகளில் பொதுவாகப் பயன்படுத்தப்படும் நடைமுறையாகும், இதில் ஒரு முன்பே பயிற்சி அளிக்கப்பட்ட மாடலை எடுத்து புதிய தரவுடன் மீண்டும் பயிற்சி அளித்து ஒரு குறிப்பிட்ட பணியில் அதன் செயல்திறனை மேம்படுத்துகிறோம். மொழி மாடல்களின் சூழலில், நன்றாக அமைத்தல் என்பது தனிப்பயன் மாடல் ஒன்றை உருவாக்க ஒரு குறிப்பிட்ட பணிக்கோளுக்கோ அல்லது பயன்பாட்டு துறைக்கோ தேவையான உதாரணங்களின் தொகுப்புடன் முன்பே பயிற்சி அளிக்கப்பட்ட மாடலை நன்றாக அமைத்தல் ஆகும். நன்றாக அமைத்தலின் ஒரு பக்க நன்மை என்னவென்றால், இது few-shot learning க்கான உதாரணங்களின் எண்ணிக்கையை குறைக்கவும் - டோக்கன் பயன்பாட்டை மற்றும் தொடர்புடைய செலவுகளை குறைக்கவும் உதவுகிறது.

எப்போது மற்றும் ஏன் நாங்கள் மாடல்களை நன்றாக அமைக்க வேண்டும்?

இந்த சூழலில், நாங்கள் நன்றாக அமைத்தல் பற்றி பேசும்போது, சூப்பர்வைஸ்டு நன்றாக அமைத்தலைக் குறிப்பிடுகிறோம், இதில் புதிய தரவுகளைச் சேர்ப்பதன் மூலம் மீண்டும் பயிற்சி அளிக்கப்படுகிறது, இது அசல் பயிற்சி தரவுத்தொகுப்பின் ஒரு பகுதியாக இல்லை. இது மாடல் அசல் தரவுகளில் மீண்டும் பயிற்சி அளிக்கப்படும், ஆனால் வேறு ஹைப்பர்பாராமீட்டர்களுடன் இருக்கும் ஒரு அசூப்பர்வைஸ்டு நன்றாக அமைத்தல் அணுகுமுறையிலிருந்து வேறுபட்டது.

நன்றாக அமைத்தல் என்பது எதிர்பார்க்கப்பட்ட மேம்பாடுகளை வழங்காமல் இருக்கலாம் அல்லது உங்கள் இலக்கு துறைக்கான மாடலின் செயல்திறனை குறைக்கக்கூடும் என்பதால், இது ஒரு குறிப்பிட்ட அளவிலான நிபுணத்துவத்தைத் தேவைப்படும் ஒரு மேம்பட்ட தொழில்நுட்பம் என்பதை நினைவில் கொள்ள வேண்டும்.

எனவே, மொழி மாடல்களை "எப்படி" நன்றாக அமைக்க வேண்டும் என்பதை நீங்கள் கற்றுக்கொள்வதற்கு முன், நீங்கள் இந்த வழியை ஏன் எடுத்துக்கொள்ள வேண்டும், மற்றும் நன்றாக அமைத்தலை எப்போது தொடங்க வேண்டும் என்பதை "எதற்காக" தெரிந்துகொள்ள வேண்டும். இந்த கேள்விகளை முதலில் கேளுங்கள்:

  • பயன்பாட்டு வழக்கு: நன்றாக அமைத்தலுக்கான உங்கள் பயன்பாட்டு வழக்கு என்ன? தற்போதைய முன்பே பயிற்சி அளிக்கப்பட்ட மாடலில் நீங்கள் மேம்படுத்த விரும்பும் அம்சம் என்ன?
  • மாற்று வழிகள்: நீங்கள் விரும்பிய முடிவுகளை அடைய மற்ற தொழில்நுட்பங்களை முயற்சித்தீர்களா? ஒப்பீட்டுக்கான அடிப்படை அளவுகோலை உருவாக்க அவற்றைப் பயன்படுத்தவும்.
    • ப்ராம்ட் இன்ஜினியரிங்: தொடர்புடைய ப்ராம்ட் பதில்களின் உதாரணங்களுடன் few-shot prompting போன்ற தொழில்நுட்பங்களை முயற்சிக்கவும். பதில்களின் தரத்தை மதிப்பீடு செய்யவும்.
    • ரிட்ரீவல் ஆக்மென்டட் ஜெனரேஷன்: உங்கள் தரவைக் கண்டறிந்து தேடல் முடிவுகளைப் பயன்படுத்தி ப்ராம்ட்களை மேம்படுத்த முயற்சிக்கவும். பதில்களின் தரத்தை மதிப்பீடு செய்யவும்.
  • செலவுகள்: நன்றாக அமைத்தலுக்கான செலவுகளை நீங்கள் அடையாளம் கண்டுள்ளீர்களா?
    • டியூனபிலிட்டி - நன்றாக அமைத்தலுக்கு முன்பே பயிற்சி அளிக்கப்பட்ட மாடல் கிடைக்குமா?
    • முயற்சி - பயிற்சி தரவுகளைத் தயாரிக்க, மாடலை மதிப்பீடு செய்ய & மேம்படுத்த.
    • கணினி - நன்றாக அமைத்தல் வேலைகளை இயக்கவும், மற்றும் நன்றாக அமைக்கப்பட்ட மாடலை பிரசுரிக்கவும்.
    • தரவு - நன்றாக அமைத்தலின் தாக்கத்திற்கான போதுமான தரமான உதாரணங்களை அணுகுதல்.
  • நன்மைகள்: நன்றாக அமைத்தலுக்கான நன்மைகளை நீங்கள் உறுதிப்படுத்தியுள்ளீர்களா?
    • தரம் - நன்றாக அமைக்கப்பட்ட மாடல் அடிப்படை அளவுகோலை விட சிறப்பாக செயல்பட்டதா?
    • செலவு - இது ப்ராம்ட்களை எளிமைப்படுத்துவதன் மூலம் டோக்கன் பயன்பாட்டை குறைக்கிறதா?
    • விரிவாக்கத்தன்மை - நீங்கள் அடிப்படை மாடலை புதிய துறைகளுக்கு மறுபயன்படுத்த முடியுமா?

இந்த கேள்விகளுக்கு பதிலளிப்பதன் மூலம், உங்கள் பயன்பாட்டு வழக்குக்கு நன்றாக அமைத்தல் சரியான அணுகுமுறைதானா என்பதை நீங்கள் முடிவு செய்ய முடியும். வழக்கமாக, நன்மைகள் செலவுகளை விட அதிகமாக இருந்தால் மட்டுமே இந்த அணுகுமுறை செல்லுபடியாகும். நீங்கள் தொடர முடிவு செய்ததும், முன்பே பயிற்சி அளிக்கப்பட்ட மாடலை எப்படி நன்றாக அமைக்க முடியும் என்று யோசிக்க நேரம்.

முடிவெடுக்கும் செயல்முறையைப் பற்றி மேலும் தகவல்களைப் பெற விரும்புகிறீர்களா? To fine-tune or not to fine-tune ஐப் பாருங்கள்.

நன்றாக அமைத்தல் எப்படி செய்யலாம்?

முன்பே பயிற்சி அளிக்கப்பட்ட மாடலை நன்றாக அமைக்க, உங்களுக்கு தேவையானவை:

  • நன்றாக அமைக்க ஒரு முன்பே பயிற்சி அளிக்கப்பட்ட மாடல்
  • நன்றாக அமைத்தலுக்கு பயன்படுத்த ஒரு தரவுத்தொகுப்பு
  • நன்றாக அமைத்தல் வேலைகளை இயக்க ஒரு பயிற்சி சூழல்
  • நன்றாக அமைக்கப்பட்ட மாடலை பிரசுரிக்க ஒரு ஹோஸ்டிங் சூழல்

செயல்பாட்டில் நன்றாக அமைத்தல்

கீழே உள்ள வளங்கள் தேர்ந்தெடுக்கப்பட்ட மாடல் மற்றும் தொகுக்கப்பட்ட தரவுத்தொகுப்பைப் பயன்படுத்தி ஒரு உண்மையான உதாரணத்தை உலாவுவதற்கான படிப்படியாகக் கற்றல் வழிகாட்டுதல்களை வழங்குகின்றன. இந்த வழிகாட்டுதல்களைப் பின்பற்ற, குறிப்பிட்ட வழங்குநரின் கணக்கை வைத்திருக்க வேண்டும், மற்றும் தொடர்புடைய மாடல் மற்றும் தரவுத்தொகுப்புகளுக்கான அணுகலைப் பெற வேண்டும்.

வழங்குநர் வழிகாட்டுதல் விளக்கம்
OpenAI How to fine-tune chat models gpt-35-turbo மாடலை ஒரு குறிப்பிட்ட துறைக்கான ("சமையல் உதவியாளர்") நன்றாக அமைத்தல், பயிற்சி தரவுகளைத் தயாரித்தல், நன்றாக அமைத்தல் வேலைகளை இயக்குதல் மற்றும் inference க்கான நன்றாக அமைக்கப்பட்ட மாடலைப் பயன்படுத்துதல்.
Azure OpenAI GPT 3.5 Turbo fine-tuning tutorial gpt-35-turbo-0613 மாடலை Azure-ல் நன்றாக அமைத்தல், பயிற்சி தரவுகளை உருவாக்குதல் மற்றும் பதிவேற்றுதல், நன்றாக அமைத்தல் வேலைகளை இயக்குதல். புதிய மாடலை பிரசுரித்து பயன்படுத்துதல்.
Hugging Face Fine-tuning LLMs with Hugging Face இந்த வலைப்பதிவு பதிவு transformers நூலகம் மற்றும் Transformer Reinforcement Learning (TRL) உடன் திறந்த datasets ஐ பயன்படுத்தி ஒரு திறந்த LLM (எ.கா: CodeLlama 7B) ஐ நன்றாக அமைத்தல் வழிகாட்டுகிறது.
🤗 AutoTrain Fine-tuning LLMs with AutoTrain AutoTrain (அல்லது AutoTrain Advanced) என்பது Hugging Face மூலம் உருவாக்கப்பட்ட ஒரு பைதான் நூலகமாகும், இது LLM நன்றாக அமைத்தலையும் உள்ளடக்கிய பல்வேறு பணிகளுக்கு நன்றாக அமைத்தலை அனுமதிக்கிறது. AutoTrain என்பது ஒரு குறியீடு இல்லாத தீர்வாகும், மேலும் உங்கள் சொந்த கிளவுட், Hugging Face Spaces அல்லது உள்ளூர் இடத்தில் நன்றாக அமைத்தல் செய்யலாம். இது வலை அடிப்படையிலான GUI, CLI மற்றும் yaml கான்பிக் கோப்புகள் மூலம் பயிற்சியை ஆதரிக்கிறது.

பணிக்கான ஒதுக்கீடு

மேலே உள்ள வழிகாட்டுதல்களில் ஒன்றைத் தேர்ந்தெடுத்து அவற்றை உலாவுங்கள். இந்த கையேடுகளில் குறிப்பாக Jupyter Notebooks-ல் இந்த வழிகாட்டுதல்களின் ஒரு பதிப்பை நாங்கள் மீண்டும் உருவாக்கலாம். தயவுசெய்து, இந்த தலைப்புக்கான சமீபத்திய பதிப்புகளை நேரடியாக பெற அசல் மூலங்களைப் பயன்படுத்தவும்.

சிறந்த வேலை! உங்கள் கற்றலைத் தொடருங்கள்.

இந்த பாடத்தை முடித்த பிறகு, Generative AI Learning collection ஐப் பாருங்கள், உங்கள் Generative AI அறிவை மேம்படுத்த தொடர்ந்து கற்றல்!

வாழ்த்துக்கள்!! நீங்கள் இந்த பாடத்திற்கான v2 தொடர் இறுதி பாடத்தை முடித்துவிட்டீர்கள்! கற்றல் மற்றும் கட்டுவதில் நிறுத்தாதீர்கள். **இந்த தலைப்புக்கான கூடுதல் பரிந்துரைகளின் பட்டியலுக்கான RESOURCES பக்கத்தைப் பாருங்கள்.

எங்கள் v1 பாடங்களின் தொடர் கூட கூடுதல் பணிகள் மற்றும் கருத்துக்களுடன் புதுப்பிக்கப்பட்டுள்ளது. எனவே உங்கள் அறிவை புதுப்பிக்க ஒரு நிமிடம் எடுத்துக்கொள்ளுங்கள் - மேலும் இந்த பாடங்களை சமூகத்திற்காக மேம்படுத்த உதவ உங்கள் கேள்விகள் மற்றும் கருத்துகளைப் பகிரவும்.


குறிப்பு:
இந்த ஆவணம் AI மொழிபெயர்ப்பு சேவை Co-op Translator பயன்படுத்தி மொழிபெயர்க்கப்பட்டுள்ளது. நாங்கள் துல்லியத்திற்காக முயற்சிக்கின்றோம், ஆனால் தானியங்கி மொழிபெயர்ப்புகளில் பிழைகள் அல்லது தவறுகள் இருக்கக்கூடும் என்பதை கவனத்தில் கொள்ளவும். அதன் தாய்மொழியில் உள்ள மூல ஆவணம் அதிகாரப்பூர்வ ஆதாரமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிபெயர்ப்பு பரிந்துரைக்கப்படுகிறது. இந்த மொழிபெயர்ப்பைப் பயன்படுத்துவதால் ஏற்படும் எந்த தவறான புரிதல்கள் அல்லது தவறான விளக்கங்களுக்கு நாங்கள் பொறுப்பல்ல.