ओपन-सोर्स LLMs चा जग रोमांचक आणि सतत विकसित होत आहे. हा धडा ओपन सोर्स मॉडेल्सवर सखोल नजर देण्याचा उद्देश ठेवतो. जर तुम्हाला माहिती हवी असेल की मालकीच्या मॉडेल्सची तुलना ओपन सोर्स मॉडेल्सशी कशी होते, तर "Exploring and Comparing Different LLMs" धडा पहा. हा धडा फाइन-ट्यूनिंग या विषयावर देखील माहिती देईल, पण अधिक सविस्तर स्पष्टीकरण "Fine-Tuning LLMs" धडा मध्ये मिळेल.
- ओपन सोर्स मॉडेल्सची समज प्राप्त करणे
- ओपन सोर्स मॉडेल्ससह काम करण्याचे फायदे समजून घेणे
- Hugging Face आणि Azure AI Studio वर उपलब्ध असलेल्या ओपन मॉडेल्सचा शोध घेणे
ओपन सोर्स सॉफ्टवेअरने विविध क्षेत्रांमध्ये तंत्रज्ञानाच्या वाढीस महत्त्वपूर्ण भूमिका बजावली आहे. Open Source Initiative (OSI) ने सॉफ्टवेअरसाठी १० निकष निश्चित केले आहेत ज्यामुळे ते ओपन सोर्स म्हणून वर्गीकृत होऊ शकते. स्रोत कोड OSI द्वारे मान्यताप्राप्त परवान्याखाली खुलेपणाने सामायिक केला पाहिजे.
LLMs च्या विकासात सॉफ्टवेअर विकासासारखे घटक असले तरी, प्रक्रिया अगदी तशीच नाही. यामुळे LLMs च्या संदर्भात ओपन सोर्सची व्याख्या काय असावी यावर समुदायात बरेच चर्चे झाले आहेत. पारंपरिक ओपन सोर्स व्याख्येनुसार एखाद्या मॉडेलसाठी खालील माहिती सार्वजनिकपणे उपलब्ध असणे आवश्यक आहे:
- मॉडेल प्रशिक्षणासाठी वापरलेली डेटासेट्स.
- प्रशिक्षणाचा भाग म्हणून पूर्ण मॉडेल वेट्स.
- मूल्यांकन कोड.
- फाइन-ट्यूनिंग कोड.
- पूर्ण मॉडेल वेट्स आणि प्रशिक्षण मेट्रिक्स.
सध्या फक्त काही मॉडेल्सच या निकषांशी जुळतात. Allen Institute for Artificial Intelligence (AllenAI) कडून तयार केलेले OLMo मॉडेल या वर्गात येते.
या धड्यासाठी, आपण पुढे "ओपन मॉडेल्स" असा उल्लेख करू कारण लेखनाच्या वेळी ते वरील निकषांशी जुळत नसतील.
अत्यंत सानुकूलनीय - ओपन मॉडेल्स तपशीलवार प्रशिक्षण माहिती सह प्रकाशित केल्यामुळे संशोधक आणि विकसक मॉडेलच्या अंतर्गत भागांमध्ये बदल करू शकतात. यामुळे विशिष्ट कार्य किंवा अभ्यास क्षेत्रासाठी फाइन-ट्यून केलेले अत्यंत विशेषीकृत मॉडेल्स तयार करता येतात. याचे काही उदाहरण म्हणजे कोड जनरेशन, गणितीय क्रिया आणि जीवशास्त्र.
खर्च - या मॉडेल्सचा वापर आणि तैनातीसाठी प्रति टोकन खर्च मालकीच्या मॉडेल्सच्या तुलनेत कमी असतो. जनरेटिव्ह AI अनुप्रयोग तयार करताना, तुमच्या वापराच्या बाबतीत या मॉडेल्ससह काम करताना कामगिरी विरुद्ध किंमत याचा विचार करणे आवश्यक आहे.
लवचिकता - ओपन मॉडेल्ससह काम केल्याने तुम्हाला वेगवेगळ्या मॉडेल्स वापरणे किंवा त्यांना एकत्रित करणे शक्य होते. याचे उदाहरण म्हणजे HuggingChat सहाय्यक जिथे वापरकर्ता थेट वापरकर्ता इंटरफेसमध्ये वापरल्या जाणाऱ्या मॉडेलची निवड करू शकतो:
LLama2, मेटा कडून विकसित केलेले, हे एक ओपन मॉडेल आहे जे चॅट आधारित अनुप्रयोगांसाठी ऑप्टिमाइझ केलेले आहे. हे त्याच्या फाइन-ट्यूनिंग पद्धतीमुळे आहे, ज्यात मोठ्या प्रमाणात संवाद आणि मानवी अभिप्राय समाविष्ट होता. या पद्धतीने, मॉडेल मानवी अपेक्षांशी अधिक सुसंगत परिणाम देते ज्यामुळे वापरकर्त्याचा अनुभव सुधारतो.
Llama चे काही फाइन-ट्यून केलेले आवृत्त्या म्हणजे Japanese Llama, जे जपानी भाषेत विशेष आहे आणि Llama Pro, जे बेस मॉडेलचे सुधारित आवृत्ती आहे.
Mistral हा एक ओपन मॉडेल आहे ज्याचा मुख्य लक्ष उच्च कार्यक्षमता आणि कार्यक्षमतेवर आहे. तो Mixture-of-Experts पद्धत वापरतो ज्यात तज्ञ मॉडेल्सचा समूह एकत्र करून एक प्रणाली तयार केली जाते जिथे इनपुटनुसार विशिष्ट मॉडेल्स निवडले जातात. यामुळे गणना अधिक प्रभावी होते कारण मॉडेल्स फक्त त्यांच्या तज्ञतेच्या इनपुटवर काम करतात.
Mistral चे काही फाइन-ट्यून केलेले आवृत्त्या म्हणजे BioMistral, जे वैद्यकीय क्षेत्रावर लक्ष केंद्रित करते आणि OpenMath Mistral, जे गणितीय गणना करते.
Falcon हा Technology Innovation Institute (TII) कडून तयार केलेला LLM आहे. Falcon-40B ला 40 अब्ज पॅरामीटर्सवर प्रशिक्षित केले गेले आहे ज्याने कमी संगणकीय बजेटमध्ये GPT-3 पेक्षा चांगली कामगिरी दाखवली आहे. हे FlashAttention अल्गोरिदम आणि मल्टीक्वेरी अटेंशन वापरल्यामुळे शक्य झाले आहे ज्यामुळे इन्फरन्स वेळेत मेमरीची गरज कमी होते. कमी इन्फरन्स वेळेमुळे Falcon-40B चॅट अनुप्रयोगांसाठी योग्य आहे.
Falcon चे काही फाइन-ट्यून केलेले आवृत्त्या म्हणजे OpenAssistant, जे ओपन मॉडेल्सवर आधारित सहाय्यक आहे आणि GPT4ALL, जे बेस मॉडेलच्या तुलनेत उच्च कार्यक्षमता देते.
ओपन मॉडेल निवडण्यासाठी एकच उत्तर नाही. सुरुवात करण्यासाठी Azure AI Studio च्या टास्कनुसार फिल्टर वापरणे चांगले ठरेल. यामुळे तुम्हाला समजेल की मॉडेल कोणत्या प्रकारच्या कार्यांसाठी प्रशिक्षित आहे. Hugging Face देखील LLM लीडरबोर्ड राखते जी काही मेट्रिक्सवर आधारित सर्वोत्तम कामगिरी करणारे मॉडेल्स दाखवते.
वेगवेगळ्या प्रकारांतील LLMs ची तुलना करताना, Artificial Analysis हा आणखी एक उत्कृष्ट स्रोत आहे:
जर विशिष्ट वापर प्रकरणावर काम करत असाल, तर त्याच क्षेत्रावर लक्ष केंद्रित केलेल्या फाइन-ट्यून केलेल्या आवृत्त्यांचा शोध घेणे प्रभावी ठरू शकते. अनेक ओपन मॉडेल्ससह प्रयोग करून पाहणे की ते तुमच्या आणि तुमच्या वापरकर्त्यांच्या अपेक्षांनुसार कसे काम करतात, ही देखील चांगली पद्धत आहे.
ओपन मॉडेल्सबाबत सर्वोत्तम गोष्ट म्हणजे तुम्ही त्यांच्यासह काम करायला लवकरच सुरुवात करू शकता. Azure AI Foundry Model Catalog पहा, ज्यात या धड्यात चर्चा केलेल्या मॉडेल्ससह एक विशिष्ट Hugging Face संग्रह आहे.
हा धडा पूर्ण केल्यानंतर, आमचा Generative AI Learning collection तपासा आणि तुमचे जनरेटिव्ह AI ज्ञान अधिक वाढवा!
अस्वीकरण: हा दस्तऐवज AI अनुवाद सेवा Co-op Translator वापरून अनुवादित केला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित अनुवादांमध्ये चुका किंवा अचूकतेची कमतरता असू शकते. मूळ दस्तऐवज त्याच्या स्थानिक भाषेत अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी अनुवाद शिफारसीय आहे. या अनुवादाच्या वापरामुळे उद्भवलेल्या कोणत्याही गैरसमजुती किंवा चुकीच्या अर्थलागी आम्ही जबाबदार नाही.



