generative-ai-for-beginners/translations/ta/16-open-source-models/README.md at main · ossama-122/generative-ai-for-beginners

அறிமுகம்

திறந்த மூல LLM களின் உலகம் சுவாரஸ்யமானதும் தொடர்ந்து வளர்ச்சியடையும் துறையாகும். இந்த பாடம் திறந்த மூல மாதிரிகள் பற்றி ஆழமான பார்வையை வழங்கும் நோக்கத்துடன் உருவாக்கப்பட்டுள்ளது. சொந்த உரிமை கொண்ட மாதிரிகள் திறந்த மூல மாதிரிகளுடன் எப்படி ஒப்பிடப்படுகின்றன என்பது பற்றிய தகவல் தேடினால், "விதிவிலக்கான மற்றும் ஒப்பிடும் LLM களை ஆராய்தல்" பாடத்திற்கு செல்லவும். இந்த பாடம் சிறப்பாகத் திருத்துதல் (fine-tuning) பற்றியும் பேசும், ஆனால் அதற்கான விரிவான விளக்கம் "Fine-Tuning LLMs" பாடத்தில் காணலாம்.

கற்றல் இலக்குகள்

திறந்த மூல மாதிரிகள் பற்றி புரிதல் பெறுதல்
திறந்த மூல மாதிரிகளுடன் பணியாற்றுவதன் நன்மைகளை புரிந்துகொள்வது
Hugging Face மற்றும் Azure AI Studio இல் கிடைக்கும் திறந்த மாதிரிகளை ஆராய்தல்

திறந்த மூல மாதிரிகள் என்றால் என்ன?

திறந்த மூல மென்பொருள் பல துறைகளில் தொழில்நுட்ப வளர்ச்சியில் முக்கிய பங்கு வகித்துள்ளது. திறந்த மூல முன்முயற்சி (Open Source Initiative - OSI) திறந்த மூலமாக வகைப்படுத்துவதற்கான 10 நிபந்தனைகள் ஐ வரையறுத்துள்ளது. மூலக் குறியீடு OSI அங்கீகாரம் பெற்ற உரிமத்துடன் திறந்தவையாக பகிரப்பட வேண்டும்.

LLM களை உருவாக்கும் செயல்முறை மென்பொருள் உருவாக்கத்துடன் சில ஒத்துப்போக்குகளை கொண்டிருந்தாலும், அது முற்றிலும் ஒரே மாதிரியாக இல்லை. இதனால் LLM களின் திறந்த மூல வரையறை குறித்து சமூகத்தில் பல விவாதங்கள் எழுந்துள்ளன. ஒரு மாதிரி பாரம்பரிய திறந்த மூல வரையறைக்கு ஏற்ப இருக்க, பின்வரும் தகவல்கள் பொதுவாக கிடைக்க வேண்டும்:

மாதிரியை பயிற்றுவிக்க பயன்படுத்திய தரவுத்தொகுப்புகள்
பயிற்சியின் ஒரு பகுதியாக முழு மாதிரி எடைகள்
மதிப்பீட்டு குறியீடு
சிறப்பாகத் திருத்தும் குறியீடு
முழு மாதிரி எடைகள் மற்றும் பயிற்சி அளவுகோல்கள்

இப்போதைக்கு இந்த நிபந்தனைகளை பூர்த்தி செய்யும் மாதிரிகள் சில மட்டுமே உள்ளன. Allen Institute for Artificial Intelligence (AllenAI) உருவாக்கிய OLMo மாதிரி இதற்குள் வருகிறது.

இந்த பாடத்தில், எழுதும் நேரத்தில் மேலே கூறிய நிபந்தனைகளுக்கு முழுமையாக பொருந்தாமலிருந்தாலும், மாதிரிகளை "திறந்த மாதிரிகள்" என குறிப்பிடுவோம்.

திறந்த மாதிரிகளின் நன்மைகள்

மிகவும் தனிப்பயனாக்கக்கூடியவை - திறந்த மாதிரிகள் விரிவான பயிற்சி தகவல்களுடன் வெளியிடப்படுவதால், ஆராய்ச்சியாளர்கள் மற்றும் டெவலப்பர்கள் மாதிரியின் உள்ளகங்களை மாற்ற முடியும். இது குறிப்பிட்ட பணிக்கோ அல்லது ஆய்வுத் துறைக்கோ சிறப்பாகத் திருத்தப்பட்ட மாதிரிகளை உருவாக்க உதவுகிறது. உதாரணமாக, குறியீடு உருவாக்கல், கணித செயல்பாடுகள் மற்றும் உயிரியல் ஆகியவை.

செலவு - இந்த மாதிரிகளை பயன்படுத்துவதற்கும் செயல்படுத்துவதற்குமான டோக்கன் ஒன்றின் செலவு சொந்த உரிமை கொண்ட மாதிரிகளுக்கு விட குறைவாகும். ஜெனரேட்டிவ் AI பயன்பாடுகளை உருவாக்கும்போது, உங்கள் பயன்பாட்டிற்கு இந்த மாதிரிகளின் செயல்திறன் மற்றும் விலை விகிதாசாரத்தை கவனிக்க வேண்டும்.

மூலம்: Artificial Analysis

நெகிழ்வுத்தன்மை - திறந்த மாதிரிகளுடன் பணியாற்றுவது, வெவ்வேறு மாதிரிகளை பயன்படுத்துவதிலும் அல்லது அவற்றை இணைப்பதிலும் நெகிழ்வுத்தன்மையை வழங்குகிறது. உதாரணமாக, HuggingChat உதவியாளர்கள் இல் பயனர் நேரடியாக UI இல் பயன்படுத்தப்படும் மாதிரியை தேர்வு செய்ய முடியும்:

வெவ்வேறு திறந்த மாதிரிகளை ஆராய்தல்

Llama 2

LLama2, மெட்டா உருவாக்கிய திறந்த மாதிரி, உரையாடல் அடிப்படையிலான பயன்பாடுகளுக்கு சிறப்பாகத் திருத்தப்பட்டுள்ளது. இது பெரும் உரையாடல் மற்றும் மனித கருத்துக்களை உள்ளடக்கிய சிறப்பாகத் திருத்தும் முறையை கொண்டுள்ளது. இதன் மூலம், மாதிரி மனித எதிர்பார்ப்புக்கு ஏற்ப அதிகமான முடிவுகளை வழங்கி சிறந்த பயனர் அனுபவத்தை தருகிறது.

Llama இன் சிறப்பாகத் திருத்தப்பட்ட சில பதிப்புகள்: ஜப்பானிய Llama, இது ஜப்பானிய மொழியில் சிறப்பு பெற்றது மற்றும் Llama Pro, இது அடிப்படை மாதிரியின் மேம்பட்ட பதிப்பு.

Mistral

Mistral என்பது உயர் செயல்திறன் மற்றும் திறமையை முக்கியமாகக் கொண்ட திறந்த மாதிரி. இது Mixture-of-Experts முறையை பயன்படுத்துகிறது, இது பல சிறப்பு பெற்ற நிபுணர் மாதிரிகளை ஒருங்கிணைத்து, உள்ளீட்டின் அடிப்படையில் சில மாதிரிகள் தேர்ந்தெடுக்கப்படுகின்றன. இதனால் கணக்கீடு மிகச் சிறப்பாக நடைபெறுகிறது, ஏனெனில் மாதிரிகள் தங்களுக்கே உரிய உள்ளீடுகளை மட்டுமே கையாள்கின்றன.

Mistral இன் சிறப்பாகத் திருத்தப்பட்ட சில பதிப்புகள்: BioMistral, இது மருத்துவ துறையில் கவனம் செலுத்துகிறது மற்றும் OpenMath Mistral, இது கணிதக் கணக்கீடுகளை செய்கிறது.

Falcon

Falcon என்பது Technology Innovation Institute (TII) உருவாக்கிய LLM ஆகும். Falcon-40B 40 பில்லியன் அளவுகோல்களில் பயிற்றுவிக்கப்பட்டது, இது குறைந்த கணக்கீட்டு செலவில் GPT-3 ஐவிட சிறந்த செயல்திறன் காட்டியுள்ளது. இது FlashAttention ஆல்கொரிதம் மற்றும் multiquery கவனிப்பை பயன்படுத்துவதால், கணக்கீட்டு நேரத்தில் நினைவக தேவைகளை குறைக்க உதவுகிறது. குறைக்கப்பட்ட கணக்கீட்டு நேரத்தால் Falcon-40B உரையாடல் பயன்பாடுகளுக்கு ஏற்றது.

Falcon இன் சிறப்பாகத் திருத்தப்பட்ட சில பதிப்புகள்: திறந்த மாதிரிகளின் அடிப்படையில் உருவாக்கப்பட்ட OpenAssistant மற்றும் அடிப்படை மாதிரியைவிட மேம்பட்ட செயல்திறன் வழங்கும் GPT4ALL.

எப்படி தேர்வு செய்வது

திறந்த மாதிரியை தேர்வு செய்வதற்கு ஒரே பதில் இல்லை. தொடங்க சிறந்த இடம் Azure AI Studio இன் பணிக்கேற்ப வடிகட்டும் அம்சத்தை பயன்படுத்துவது. இது மாதிரி எந்த வகை பணிகளுக்கு பயிற்றுவிக்கப்பட்டது என்பதை புரிந்துகொள்ள உதவும். Hugging Face ஒரு LLM முன்னணி பட்டியலை பராமரிக்கிறது, இது சில அளவுகோல்களின் அடிப்படையில் சிறந்த செயல்திறன் கொண்ட மாதிரிகளை காட்டுகிறது.

விதிவிலக்கான LLM களை ஒப்பிடும் போது, Artificial Analysis மற்றொரு சிறந்த வளமாகும்:

மூலம்: Artificial Analysis

குறிப்பிட்ட பயன்பாட்டிற்கு வேலை செய்யும் போது, அதே துறையில் கவனம் செலுத்திய சிறப்பாகத் திருத்தப்பட்ட பதிப்புகளை தேடுவது பயனுள்ளதாக இருக்கும். பல திறந்த மாதிரிகளுடன் முயற்சி செய்து, உங்கள் மற்றும் உங்கள் பயனர்களின் எதிர்பார்ப்புகளுக்கு ஏற்ப அவை எப்படி செயல்படுகின்றன என்பதை பார்க்கும் பழக்கம் நல்லது.

அடுத்த படிகள்

திறந்த மாதிரிகளின் சிறந்த பகுதி, அவற்றுடன் விரைவாக பணியாற்றத் தொடங்க முடியும் என்பதே. இங்கே நாம் பேசிய மாதிரிகள் அடங்கிய குறிப்பிட்ட Hugging Face தொகுப்பை கொண்ட Azure AI Foundry Model Catalog ஐ பார்வையிடவும்.

கற்றல் இங்கே நிற்காது, பயணத்தை தொடருங்கள்

இந்த பாடத்தை முடித்த பிறகு, உங்கள் ஜெனரேட்டிவ் AI அறிவை மேம்படுத்த Generative AI Learning collection ஐ பார்வையிடவும்!

குறிப்பு:
இந்த ஆவணம் AI மொழிபெயர்ப்பு சேவை Co-op Translator மூலம் மொழிபெயர்க்கப்பட்டுள்ளது. நாங்கள் துல்லியத்திற்காக முயற்சித்தாலும், தானியங்கி மொழிபெயர்ப்புகளில் பிழைகள் அல்லது தவறுகள் இருக்கக்கூடும் என்பதை தயவுசெய்து கவனிக்கவும். அசல் ஆவணம் அதன் சொந்த மொழியில் அதிகாரப்பூர்வ மூலமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிபெயர்ப்பை பரிந்துரைக்கிறோம். இந்த மொழிபெயர்ப்பின் பயன்பாட்டால் ஏற்படும் எந்த தவறான புரிதல்கள் அல்லது தவறான விளக்கங்களுக்கும் நாங்கள் பொறுப்பேற்கமாட்டோம்.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

அறிமுகம்

கற்றல் இலக்குகள்

திறந்த மூல மாதிரிகள் என்றால் என்ன?

திறந்த மாதிரிகளின் நன்மைகள்

வெவ்வேறு திறந்த மாதிரிகளை ஆராய்தல்

Llama 2

Mistral

Falcon

எப்படி தேர்வு செய்வது

அடுத்த படிகள்

கற்றல் இங்கே நிற்காது, பயணத்தை தொடருங்கள்

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

அறிமுகம்

கற்றல் இலக்குகள்

திறந்த மூல மாதிரிகள் என்றால் என்ன?

திறந்த மாதிரிகளின் நன்மைகள்

வெவ்வேறு திறந்த மாதிரிகளை ஆராய்தல்

Llama 2

Mistral

Falcon

எப்படி தேர்வு செய்வது

அடுத்த படிகள்

கற்றல் இங்கே நிற்காது, பயணத்தை தொடருங்கள்