திறந்த மூல LLM களின் உலகம் சுவாரஸ்யமானதும் தொடர்ந்து வளர்ச்சியடையும் துறையாகும். இந்த பாடம் திறந்த மூல மாதிரிகள் பற்றி ஆழமான பார்வையை வழங்கும் நோக்கத்துடன் உருவாக்கப்பட்டுள்ளது. சொந்த உரிமை கொண்ட மாதிரிகள் திறந்த மூல மாதிரிகளுடன் எப்படி ஒப்பிடப்படுகின்றன என்பது பற்றிய தகவல் தேடினால், "விதிவிலக்கான மற்றும் ஒப்பிடும் LLM களை ஆராய்தல்" பாடத்திற்கு செல்லவும். இந்த பாடம் சிறப்பாகத் திருத்துதல் (fine-tuning) பற்றியும் பேசும், ஆனால் அதற்கான விரிவான விளக்கம் "Fine-Tuning LLMs" பாடத்தில் காணலாம்.
- திறந்த மூல மாதிரிகள் பற்றி புரிதல் பெறுதல்
- திறந்த மூல மாதிரிகளுடன் பணியாற்றுவதன் நன்மைகளை புரிந்துகொள்வது
- Hugging Face மற்றும் Azure AI Studio இல் கிடைக்கும் திறந்த மாதிரிகளை ஆராய்தல்
திறந்த மூல மென்பொருள் பல துறைகளில் தொழில்நுட்ப வளர்ச்சியில் முக்கிய பங்கு வகித்துள்ளது. திறந்த மூல முன்முயற்சி (Open Source Initiative - OSI) திறந்த மூலமாக வகைப்படுத்துவதற்கான 10 நிபந்தனைகள் ஐ வரையறுத்துள்ளது. மூலக் குறியீடு OSI அங்கீகாரம் பெற்ற உரிமத்துடன் திறந்தவையாக பகிரப்பட வேண்டும்.
LLM களை உருவாக்கும் செயல்முறை மென்பொருள் உருவாக்கத்துடன் சில ஒத்துப்போக்குகளை கொண்டிருந்தாலும், அது முற்றிலும் ஒரே மாதிரியாக இல்லை. இதனால் LLM களின் திறந்த மூல வரையறை குறித்து சமூகத்தில் பல விவாதங்கள் எழுந்துள்ளன. ஒரு மாதிரி பாரம்பரிய திறந்த மூல வரையறைக்கு ஏற்ப இருக்க, பின்வரும் தகவல்கள் பொதுவாக கிடைக்க வேண்டும்:
- மாதிரியை பயிற்றுவிக்க பயன்படுத்திய தரவுத்தொகுப்புகள்
- பயிற்சியின் ஒரு பகுதியாக முழு மாதிரி எடைகள்
- மதிப்பீட்டு குறியீடு
- சிறப்பாகத் திருத்தும் குறியீடு
- முழு மாதிரி எடைகள் மற்றும் பயிற்சி அளவுகோல்கள்
இப்போதைக்கு இந்த நிபந்தனைகளை பூர்த்தி செய்யும் மாதிரிகள் சில மட்டுமே உள்ளன. Allen Institute for Artificial Intelligence (AllenAI) உருவாக்கிய OLMo மாதிரி இதற்குள் வருகிறது.
இந்த பாடத்தில், எழுதும் நேரத்தில் மேலே கூறிய நிபந்தனைகளுக்கு முழுமையாக பொருந்தாமலிருந்தாலும், மாதிரிகளை "திறந்த மாதிரிகள்" என குறிப்பிடுவோம்.
மிகவும் தனிப்பயனாக்கக்கூடியவை - திறந்த மாதிரிகள் விரிவான பயிற்சி தகவல்களுடன் வெளியிடப்படுவதால், ஆராய்ச்சியாளர்கள் மற்றும் டெவலப்பர்கள் மாதிரியின் உள்ளகங்களை மாற்ற முடியும். இது குறிப்பிட்ட பணிக்கோ அல்லது ஆய்வுத் துறைக்கோ சிறப்பாகத் திருத்தப்பட்ட மாதிரிகளை உருவாக்க உதவுகிறது. உதாரணமாக, குறியீடு உருவாக்கல், கணித செயல்பாடுகள் மற்றும் உயிரியல் ஆகியவை.
செலவு - இந்த மாதிரிகளை பயன்படுத்துவதற்கும் செயல்படுத்துவதற்குமான டோக்கன் ஒன்றின் செலவு சொந்த உரிமை கொண்ட மாதிரிகளுக்கு விட குறைவாகும். ஜெனரேட்டிவ் AI பயன்பாடுகளை உருவாக்கும்போது, உங்கள் பயன்பாட்டிற்கு இந்த மாதிரிகளின் செயல்திறன் மற்றும் விலை விகிதாசாரத்தை கவனிக்க வேண்டும்.
நெகிழ்வுத்தன்மை - திறந்த மாதிரிகளுடன் பணியாற்றுவது, வெவ்வேறு மாதிரிகளை பயன்படுத்துவதிலும் அல்லது அவற்றை இணைப்பதிலும் நெகிழ்வுத்தன்மையை வழங்குகிறது. உதாரணமாக, HuggingChat உதவியாளர்கள் இல் பயனர் நேரடியாக UI இல் பயன்படுத்தப்படும் மாதிரியை தேர்வு செய்ய முடியும்:
LLama2, மெட்டா உருவாக்கிய திறந்த மாதிரி, உரையாடல் அடிப்படையிலான பயன்பாடுகளுக்கு சிறப்பாகத் திருத்தப்பட்டுள்ளது. இது பெரும் உரையாடல் மற்றும் மனித கருத்துக்களை உள்ளடக்கிய சிறப்பாகத் திருத்தும் முறையை கொண்டுள்ளது. இதன் மூலம், மாதிரி மனித எதிர்பார்ப்புக்கு ஏற்ப அதிகமான முடிவுகளை வழங்கி சிறந்த பயனர் அனுபவத்தை தருகிறது.
Llama இன் சிறப்பாகத் திருத்தப்பட்ட சில பதிப்புகள்: ஜப்பானிய Llama, இது ஜப்பானிய மொழியில் சிறப்பு பெற்றது மற்றும் Llama Pro, இது அடிப்படை மாதிரியின் மேம்பட்ட பதிப்பு.
Mistral என்பது உயர் செயல்திறன் மற்றும் திறமையை முக்கியமாகக் கொண்ட திறந்த மாதிரி. இது Mixture-of-Experts முறையை பயன்படுத்துகிறது, இது பல சிறப்பு பெற்ற நிபுணர் மாதிரிகளை ஒருங்கிணைத்து, உள்ளீட்டின் அடிப்படையில் சில மாதிரிகள் தேர்ந்தெடுக்கப்படுகின்றன. இதனால் கணக்கீடு மிகச் சிறப்பாக நடைபெறுகிறது, ஏனெனில் மாதிரிகள் தங்களுக்கே உரிய உள்ளீடுகளை மட்டுமே கையாள்கின்றன.
Mistral இன் சிறப்பாகத் திருத்தப்பட்ட சில பதிப்புகள்: BioMistral, இது மருத்துவ துறையில் கவனம் செலுத்துகிறது மற்றும் OpenMath Mistral, இது கணிதக் கணக்கீடுகளை செய்கிறது.
Falcon என்பது Technology Innovation Institute (TII) உருவாக்கிய LLM ஆகும். Falcon-40B 40 பில்லியன் அளவுகோல்களில் பயிற்றுவிக்கப்பட்டது, இது குறைந்த கணக்கீட்டு செலவில் GPT-3 ஐவிட சிறந்த செயல்திறன் காட்டியுள்ளது. இது FlashAttention ஆல்கொரிதம் மற்றும் multiquery கவனிப்பை பயன்படுத்துவதால், கணக்கீட்டு நேரத்தில் நினைவக தேவைகளை குறைக்க உதவுகிறது. குறைக்கப்பட்ட கணக்கீட்டு நேரத்தால் Falcon-40B உரையாடல் பயன்பாடுகளுக்கு ஏற்றது.
Falcon இன் சிறப்பாகத் திருத்தப்பட்ட சில பதிப்புகள்: திறந்த மாதிரிகளின் அடிப்படையில் உருவாக்கப்பட்ட OpenAssistant மற்றும் அடிப்படை மாதிரியைவிட மேம்பட்ட செயல்திறன் வழங்கும் GPT4ALL.
திறந்த மாதிரியை தேர்வு செய்வதற்கு ஒரே பதில் இல்லை. தொடங்க சிறந்த இடம் Azure AI Studio இன் பணிக்கேற்ப வடிகட்டும் அம்சத்தை பயன்படுத்துவது. இது மாதிரி எந்த வகை பணிகளுக்கு பயிற்றுவிக்கப்பட்டது என்பதை புரிந்துகொள்ள உதவும். Hugging Face ஒரு LLM முன்னணி பட்டியலை பராமரிக்கிறது, இது சில அளவுகோல்களின் அடிப்படையில் சிறந்த செயல்திறன் கொண்ட மாதிரிகளை காட்டுகிறது.
விதிவிலக்கான LLM களை ஒப்பிடும் போது, Artificial Analysis மற்றொரு சிறந்த வளமாகும்:
குறிப்பிட்ட பயன்பாட்டிற்கு வேலை செய்யும் போது, அதே துறையில் கவனம் செலுத்திய சிறப்பாகத் திருத்தப்பட்ட பதிப்புகளை தேடுவது பயனுள்ளதாக இருக்கும். பல திறந்த மாதிரிகளுடன் முயற்சி செய்து, உங்கள் மற்றும் உங்கள் பயனர்களின் எதிர்பார்ப்புகளுக்கு ஏற்ப அவை எப்படி செயல்படுகின்றன என்பதை பார்க்கும் பழக்கம் நல்லது.
திறந்த மாதிரிகளின் சிறந்த பகுதி, அவற்றுடன் விரைவாக பணியாற்றத் தொடங்க முடியும் என்பதே. இங்கே நாம் பேசிய மாதிரிகள் அடங்கிய குறிப்பிட்ட Hugging Face தொகுப்பை கொண்ட Azure AI Foundry Model Catalog ஐ பார்வையிடவும்.
இந்த பாடத்தை முடித்த பிறகு, உங்கள் ஜெனரேட்டிவ் AI அறிவை மேம்படுத்த Generative AI Learning collection ஐ பார்வையிடவும்!
குறிப்பு:
இந்த ஆவணம் AI மொழிபெயர்ப்பு சேவை Co-op Translator மூலம் மொழிபெயர்க்கப்பட்டுள்ளது. நாங்கள் துல்லியத்திற்காக முயற்சித்தாலும், தானியங்கி மொழிபெயர்ப்புகளில் பிழைகள் அல்லது தவறுகள் இருக்கக்கூடும் என்பதை தயவுசெய்து கவனிக்கவும். அசல் ஆவணம் அதன் சொந்த மொழியில் அதிகாரப்பூர்வ மூலமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிபெயர்ப்பை பரிந்துரைக்கிறோம். இந்த மொழிபெயர்ப்பின் பயன்பாட்டால் ஏற்படும் எந்த தவறான புரிதல்கள் அல்லது தவறான விளக்கங்களுக்கும் நாங்கள் பொறுப்பேற்கமாட்டோம்.



