Skip to content

Latest commit

 

History

History
86 lines (49 loc) · 15 KB

File metadata and controls

86 lines (49 loc) · 15 KB

Open Source Models

परिचय

ओपन-सोर्स LLMs चा जग रोमांचक आणि सतत विकसित होत आहे. हा धडा ओपन सोर्स मॉडेल्सवर सखोल नजर देण्याचा उद्देश ठेवतो. जर तुम्हाला माहिती हवी असेल की मालकीच्या मॉडेल्सची तुलना ओपन सोर्स मॉडेल्सशी कशी होते, तर "Exploring and Comparing Different LLMs" धडा पहा. हा धडा फाइन-ट्यूनिंग या विषयावर देखील माहिती देईल, पण अधिक सविस्तर स्पष्टीकरण "Fine-Tuning LLMs" धडा मध्ये मिळेल.

शिकण्याचे उद्दिष्टे

  • ओपन सोर्स मॉडेल्सची समज प्राप्त करणे
  • ओपन सोर्स मॉडेल्ससह काम करण्याचे फायदे समजून घेणे
  • Hugging Face आणि Azure AI Studio वर उपलब्ध असलेल्या ओपन मॉडेल्सचा शोध घेणे

ओपन सोर्स मॉडेल्स म्हणजे काय?

ओपन सोर्स सॉफ्टवेअरने विविध क्षेत्रांमध्ये तंत्रज्ञानाच्या वाढीस महत्त्वपूर्ण भूमिका बजावली आहे. Open Source Initiative (OSI) ने सॉफ्टवेअरसाठी १० निकष निश्चित केले आहेत ज्यामुळे ते ओपन सोर्स म्हणून वर्गीकृत होऊ शकते. स्रोत कोड OSI द्वारे मान्यताप्राप्त परवान्याखाली खुलेपणाने सामायिक केला पाहिजे.

LLMs च्या विकासात सॉफ्टवेअर विकासासारखे घटक असले तरी, प्रक्रिया अगदी तशीच नाही. यामुळे LLMs च्या संदर्भात ओपन सोर्सची व्याख्या काय असावी यावर समुदायात बरेच चर्चे झाले आहेत. पारंपरिक ओपन सोर्स व्याख्येनुसार एखाद्या मॉडेलसाठी खालील माहिती सार्वजनिकपणे उपलब्ध असणे आवश्यक आहे:

  • मॉडेल प्रशिक्षणासाठी वापरलेली डेटासेट्स.
  • प्रशिक्षणाचा भाग म्हणून पूर्ण मॉडेल वेट्स.
  • मूल्यांकन कोड.
  • फाइन-ट्यूनिंग कोड.
  • पूर्ण मॉडेल वेट्स आणि प्रशिक्षण मेट्रिक्स.

सध्या फक्त काही मॉडेल्सच या निकषांशी जुळतात. Allen Institute for Artificial Intelligence (AllenAI) कडून तयार केलेले OLMo मॉडेल या वर्गात येते.

या धड्यासाठी, आपण पुढे "ओपन मॉडेल्स" असा उल्लेख करू कारण लेखनाच्या वेळी ते वरील निकषांशी जुळत नसतील.

ओपन मॉडेल्सचे फायदे

अत्यंत सानुकूलनीय - ओपन मॉडेल्स तपशीलवार प्रशिक्षण माहिती सह प्रकाशित केल्यामुळे संशोधक आणि विकसक मॉडेलच्या अंतर्गत भागांमध्ये बदल करू शकतात. यामुळे विशिष्ट कार्य किंवा अभ्यास क्षेत्रासाठी फाइन-ट्यून केलेले अत्यंत विशेषीकृत मॉडेल्स तयार करता येतात. याचे काही उदाहरण म्हणजे कोड जनरेशन, गणितीय क्रिया आणि जीवशास्त्र.

खर्च - या मॉडेल्सचा वापर आणि तैनातीसाठी प्रति टोकन खर्च मालकीच्या मॉडेल्सच्या तुलनेत कमी असतो. जनरेटिव्ह AI अनुप्रयोग तयार करताना, तुमच्या वापराच्या बाबतीत या मॉडेल्ससह काम करताना कामगिरी विरुद्ध किंमत याचा विचार करणे आवश्यक आहे.

Model Cost स्रोत: Artificial Analysis

लवचिकता - ओपन मॉडेल्ससह काम केल्याने तुम्हाला वेगवेगळ्या मॉडेल्स वापरणे किंवा त्यांना एकत्रित करणे शक्य होते. याचे उदाहरण म्हणजे HuggingChat सहाय्यक जिथे वापरकर्ता थेट वापरकर्ता इंटरफेसमध्ये वापरल्या जाणाऱ्या मॉडेलची निवड करू शकतो:

Choose Model

वेगवेगळ्या ओपन मॉडेल्सचा शोध

Llama 2

LLama2, मेटा कडून विकसित केलेले, हे एक ओपन मॉडेल आहे जे चॅट आधारित अनुप्रयोगांसाठी ऑप्टिमाइझ केलेले आहे. हे त्याच्या फाइन-ट्यूनिंग पद्धतीमुळे आहे, ज्यात मोठ्या प्रमाणात संवाद आणि मानवी अभिप्राय समाविष्ट होता. या पद्धतीने, मॉडेल मानवी अपेक्षांशी अधिक सुसंगत परिणाम देते ज्यामुळे वापरकर्त्याचा अनुभव सुधारतो.

Llama चे काही फाइन-ट्यून केलेले आवृत्त्या म्हणजे Japanese Llama, जे जपानी भाषेत विशेष आहे आणि Llama Pro, जे बेस मॉडेलचे सुधारित आवृत्ती आहे.

Mistral

Mistral हा एक ओपन मॉडेल आहे ज्याचा मुख्य लक्ष उच्च कार्यक्षमता आणि कार्यक्षमतेवर आहे. तो Mixture-of-Experts पद्धत वापरतो ज्यात तज्ञ मॉडेल्सचा समूह एकत्र करून एक प्रणाली तयार केली जाते जिथे इनपुटनुसार विशिष्ट मॉडेल्स निवडले जातात. यामुळे गणना अधिक प्रभावी होते कारण मॉडेल्स फक्त त्यांच्या तज्ञतेच्या इनपुटवर काम करतात.

Mistral चे काही फाइन-ट्यून केलेले आवृत्त्या म्हणजे BioMistral, जे वैद्यकीय क्षेत्रावर लक्ष केंद्रित करते आणि OpenMath Mistral, जे गणितीय गणना करते.

Falcon

Falcon हा Technology Innovation Institute (TII) कडून तयार केलेला LLM आहे. Falcon-40B ला 40 अब्ज पॅरामीटर्सवर प्रशिक्षित केले गेले आहे ज्याने कमी संगणकीय बजेटमध्ये GPT-3 पेक्षा चांगली कामगिरी दाखवली आहे. हे FlashAttention अल्गोरिदम आणि मल्टीक्वेरी अटेंशन वापरल्यामुळे शक्य झाले आहे ज्यामुळे इन्फरन्स वेळेत मेमरीची गरज कमी होते. कमी इन्फरन्स वेळेमुळे Falcon-40B चॅट अनुप्रयोगांसाठी योग्य आहे.

Falcon चे काही फाइन-ट्यून केलेले आवृत्त्या म्हणजे OpenAssistant, जे ओपन मॉडेल्सवर आधारित सहाय्यक आहे आणि GPT4ALL, जे बेस मॉडेलच्या तुलनेत उच्च कार्यक्षमता देते.

कसे निवडावे

ओपन मॉडेल निवडण्यासाठी एकच उत्तर नाही. सुरुवात करण्यासाठी Azure AI Studio च्या टास्कनुसार फिल्टर वापरणे चांगले ठरेल. यामुळे तुम्हाला समजेल की मॉडेल कोणत्या प्रकारच्या कार्यांसाठी प्रशिक्षित आहे. Hugging Face देखील LLM लीडरबोर्ड राखते जी काही मेट्रिक्सवर आधारित सर्वोत्तम कामगिरी करणारे मॉडेल्स दाखवते.

वेगवेगळ्या प्रकारांतील LLMs ची तुलना करताना, Artificial Analysis हा आणखी एक उत्कृष्ट स्रोत आहे:

Model Quality स्रोत: Artificial Analysis

जर विशिष्ट वापर प्रकरणावर काम करत असाल, तर त्याच क्षेत्रावर लक्ष केंद्रित केलेल्या फाइन-ट्यून केलेल्या आवृत्त्यांचा शोध घेणे प्रभावी ठरू शकते. अनेक ओपन मॉडेल्ससह प्रयोग करून पाहणे की ते तुमच्या आणि तुमच्या वापरकर्त्यांच्या अपेक्षांनुसार कसे काम करतात, ही देखील चांगली पद्धत आहे.

पुढील पावले

ओपन मॉडेल्सबाबत सर्वोत्तम गोष्ट म्हणजे तुम्ही त्यांच्यासह काम करायला लवकरच सुरुवात करू शकता. Azure AI Foundry Model Catalog पहा, ज्यात या धड्यात चर्चा केलेल्या मॉडेल्ससह एक विशिष्ट Hugging Face संग्रह आहे.

शिक्षण येथे थांबत नाही, प्रवास सुरू ठेवा

हा धडा पूर्ण केल्यानंतर, आमचा Generative AI Learning collection तपासा आणि तुमचे जनरेटिव्ह AI ज्ञान अधिक वाढवा!


अस्वीकरण: हा दस्तऐवज AI अनुवाद सेवा Co-op Translator वापरून अनुवादित केला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित अनुवादांमध्ये चुका किंवा अचूकतेची कमतरता असू शकते. मूळ दस्तऐवज त्याच्या स्थानिक भाषेत अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी अनुवाद शिफारसीय आहे. या अनुवादाच्या वापरामुळे उद्भवलेल्या कोणत्याही गैरसमजुती किंवा चुकीच्या अर्थलागी आम्ही जबाबदार नाही.