Skip to content

Latest commit

 

History

History
105 lines (69 loc) · 26.7 KB

File metadata and controls

105 lines (69 loc) · 26.7 KB

Open Source Models

तुमचा LLM फाईन-ट्यून करा

मोठे भाषा मॉडेल्स वापरून जनरेटिव्ह AI अनुप्रयोग तयार करताना नवीन आव्हाने येतात. मुख्य समस्या म्हणजे दिलेल्या वापरकर्ता विनंतीसाठी मॉडेलद्वारे तयार केलेल्या सामग्रीत प्रतिसादाची गुणवत्ता (अचूकता आणि सादृश्यता) सुनिश्चित करणे. मागील धड्यांमध्ये, आपण प्रॉम्प्ट इंजिनिअरिंग आणि रिट्रीव्हल-ऑगमेंटेड जनरेशन सारख्या तंत्रज्ञानावर चर्चा केली जी समस्या मॉडेलच्या आधीच्याच प्रॉम्प्ट इनपुटमध्ये बदल करून सोडवण्याचा प्रयत्न करतात.

आजच्या धड्यात, आपण तिसरे तंत्रज्ञान, फाईन-ट्यूनिंग, यावर चर्चा करणार आहोत, जे मॉडेल स्वतःला अतिरिक्त डेटासह पुन्हा प्रशिक्षण देऊन आव्हान दूर करण्याचा प्रयत्न करते. चला तपशीलात पाहूया.

शिक्षण उद्दिष्टे

हा धडा पूर्वप्रशिक्षित भाषा मॉडेल्ससाठी फाईन-ट्यूनिंग या संकल्पनेची ओळख करतो, या पद्धतीच्या फायदे आणि आव्हाने तपासतो, आणि तुमच्या जनरेटिव्ह AI मॉडेल्सच्या कार्यक्षमतेत सुधारणा करण्यासाठी फाईन-ट्यूनिंग केव्हा आणि कसे करावे यासाठी मार्गदर्शन देतो.

या धड्याच्या शेवटी, तुम्ही खालील प्रश्नांची उत्तरे देऊ शकाल:

  • भाषा मॉडेल्ससाठी फाईन-ट्यूनिंग म्हणजे काय?
  • फाईन-ट्यूनिंग केव्हा आणि का उपयुक्त आहे?
  • मी पूर्वप्रशिक्षित मॉडेल कसे फाईन-ट्यून करू शकतो?
  • फाईन-ट्यूनिंगच्या मर्यादा काय आहेत?

तयार? चला सुरू करूया.

चित्रांसह मार्गदर्शक

आपण सुरुवातीस आकडेवारीच्या एकूण चित्रावर पाहू इच्छित असल्यास, हा चित्रांसह मार्गदर्शक तपासा जो फाईन-ट्यूनिंगसाठी कोर संकल्पना आणि प्रेरणा शिकण्यापासून ते पुन्हा प्रशिक्षण प्रक्रियेपर्यंत आणि उत्तम सरावांसाठी शिकवतो. ही एक आकर्षक विषय आहे, म्हणून तुमच्या स्व-मार्गदर्शित शिक्षण यात्रेसाठी साधनांसाठी पृष्ठ जरूर तपासा!

Illustrated Guide to Fine Tuning Language Models

भाषा मॉडेल्ससाठी फाईन-ट्यूनिंग म्हणजे काय?

परिभाषेनुसार, मोठे भाषा मॉडेल्स हे इंटरनेटसारख्या विविध स्रोतांकडून मोठ्या प्रमाणात मजकूरावर पूर्वप्रशिक्षित केलेले असतात. आपण मागील धड्यांमध्ये शिकले आहे की, वापरकर्त्याच्या प्रश्नांना ("प्रॉम्प्ट्स") अधिक चांगले उत्तर मिळवण्यासाठी प्रॉम्प्ट इंजिनिअरिंग आणि रिट्रीव्हल-ऑगमेंटेड जनरेशन सारख्या तंत्रज्ञानांची आवश्यकता आहे.

एक लोकप्रिय प्रॉम्प्ट-इंजिनिअरिंग तंत्र म्हणजे मॉडेलला अपेक्षित प्रतिसादाबद्दल अधिक मार्गदर्शन देणे, ते पाठविलेले सूचना (स्पष्ट मार्गदर्शन) किंवा काही उदाहरणे देणे (अप्रत्यक्ष मार्गदर्शन) याद्वारे. याला फ्यू-शॉट लर्निंग म्हणतात, पण याला दोन मर्यादा आहेत:

  • मॉडेलच्या टोकन मर्यादांमुळे तुम्ही दिलेले उदाहरणांची संख्या मर्यादित होते, ज्यामुळे परिणामकारकता कमी होते.
  • मॉडेलच्या टोकन खर्चामुळे प्रत्येक प्रॉम्प्टमध्ये उदाहरणे घालणे महागडे पडू शकते, ज्यामुळे लवचिकता कमी होते.

फाईन-ट्यूनिंग ही मशीन लर्निंग सिस्टम्समध्ये एक सामान्य पद्धत आहे जिथे आपण पूर्वप्रशिक्षित मॉडेल घेऊन नवीन डेटाने पुनःप्रशिक्षित करतो ज्यामुळे एखाद्या विशिष्ट कार्यावर त्याचा कार्यप्रदर्शन सुधारेल. भाषा मॉडेल्सच्या संदर्भात, आपण पूर्वप्रशिक्षित मॉडेलला विशिष्ट कार्य किंवा अनुप्रयोग क्षेत्रासाठी एका क्युरेट केलेल्या उदाहरण संचासह फाईन-ट्यून करू शकतो आणि अशाप्रकारे प्रत्येक क्षेत्रासाठी अधिक अचूक आणि सुसंगत सानुकूल मॉडेल तयार करू शकतो. फाईन-ट्यूनिंगचा एक साइड-बेनिफिट म्हणजे फ्यू-शॉट लर्निंगसाठी आवश्यक उदाहरणांची संख्या देखील कमी होऊ शकते - ज्यामुळे टोकन वापर आणि संबंधित खर्चांमध्ये बचत होते.

आपण कधी आणि का फाईन-ट्यून करावी?

या संदर्भात, जेव्हा आपण फाईन-ट्यूनिंगबद्दल बोलतो, तेव्हा आपण सुपरवाइज्ड फाईन-ट्यूनिंगबद्दल बोलत आहोत जिथे पुनःप्रशिक्षणासाठी मूळ प्रशिक्षण डेटासेटमधील नव्हते असे नवीन डेटा जोडले जातो. हे अनसुपरवाइज्ड फाईन-ट्यूनिंगच्या पद्धतीपेक्षा वेगळे आहे जिथे मॉडेल मूळ डेटा वापरून पण वेगळ्या हायपरपॅरामीटर्ससह पुनःप्रशिक्षित केले जाते.

महत्वाची गोष्ट म्हणजे फाईन-ट्यूनिंग ही एक प्रगत तंत्र आहे ज्यासाठी अपेक्षित परिणाम मिळविण्यासाठी विशिष्ट कौशल्य आवश्यक असते. जर चुकीच्या पद्धतीने केली, तर अपेक्षित सुधारणा मिळणार नाहीत आणि तुमच्या लक्षित क्षेत्रासाठी मॉडेलचा कार्यप्रदर्शन नाश होऊ शकतो.

म्हणून "कसे" फाईन-ट्यून करावे हे शिकण्याआधी, तुम्हाला माहित असणे आवश्यक आहे की "का" तुम्हाला फाईन-ट्यूनिंगचा मार्ग स्वीकारायचा आहे आणि "कधी" फाईन-ट्यूनिंग प्रक्रिया सुरू करायची आहे. स्वतःला हे प्रश्न विचारा:

  • वापर प्रकरण: तुमचा फाईन-ट्यूनिंगसाठी वापर प्रकरण काय आहे? सध्याच्या पूर्वप्रशिक्षित मॉडेलमधील कोणते पैलू तुम्हाला सुधारायचे आहेत?
  • पर्याय: तुम्ही अपेक्षित परिणाम साध्य करण्यासाठी इतर तंत्र वापरले आहेत का? त्यांच्याशी तुलना करण्यासाठी त्यांचा उपयोग करा.
    • प्रॉम्प्ट इंजिनिअरिंग: संबंधित प्रॉम्प्ट उत्तरांच्या उदाहरणांसह फ्यू-शॉट प्रॉम्प्टिंग वापरून प्रयत्न करा. प्रतिसादांची गुणवत्ता तपासा.
    • रिट्रीव्हल ऑगमेंटेड जनरेशन: तुमच्या डेटावर शोध घेऊन प्रश्न उत्तर बढ़वून पहा. प्रतिसादांची गुणवत्ता तपासा.
  • खर्च: फाईन-ट्यूनिंगसाठी खर्चांची माहिती आहे का?
    • ट्युनिबिलिटी - पूर्वप्रशिक्षित मॉडेल फाईन-ट्यूनिंगसाठी उपलब्ध आहे का?
    • प्रयत्न - प्रशिक्षण डेटाच्या तयारीसाठी, मॉडेलचे मूल्यांकन आणि सुधारणा करण्यासाठी
    • संगणकीय साधन - फाईन-ट्यूनिंग जॉब चालवण्यासाठी आणि फाईन-ट्यून केलेले मॉडेल तैनात करण्यासाठी
    • डेटा - फाईन-ट्यूनिंगसाठी पुरेशी दर्जेदार उदाहरणे उपलब्ध आहेत का?
  • फायदे: फाईन-ट्यूनिंगचे फायदे पुष्टी केले आहेत का?
    • गुणवत्ता - फाईन-ट्यून केलेले मॉडेल मूळातल्या मॉडेलपेक्षा चांगले आहे का?
    • खर्च - प्रॉम्प्ट सोप्या करून टोकन वापर कमी करतो का?
    • विस्तारणीयता - तुम्ही मूळ मॉडेल नवीन क्षेत्रांसाठी पुन्हा वापरू शकता का?

या प्रश्नांची उत्तरे देऊन, तुम्ही ठरवू शकता की फाईन-ट्यूनिंग तुमच्या वापर प्रकरणासाठी योग्य आहे का. आदर्शपणे, तो मार्ग फक्त तेव्हाच योग्य आहे जेव्हा फायदे खर्चांपेक्षा जास्त असतात. एकदा तुम्ही पुढे जाण्याचा निर्णय घेतल्यास, तुम्हाला फाईन-ट्यूनिंग कसे करायचे हे विचारायला पाहिजे.

निर्णय प्रक्रियेबद्दल अधिक माहिती हवी का? पाहा To fine-tune or not to fine-tune

आपण पूर्वप्रशिक्षित मॉडेल कसे फाईन-ट्यून करू शकतो?

पूर्वप्रशिक्षित मॉडेल फाईन-ट्यून करण्यासाठी, तुमच्याकडे असणे आवश्यक आहे:

  • फाईन-ट्यून करण्यासाठी पूर्वप्रशिक्षित मॉडेल
  • फाईन-ट्यूनसाठी वापरण्यासाठी डेटासेट
  • फाईन-ट्यूनिंग जॉब चालविण्याचा प्रशिक्षिण वातावरण
  • फाईन-ट्यून केलेले मॉडेल तैनात करण्यासाठी होस्टिंग वातावरण

फाईन-ट्यूनिंग क्रियाशील

खालील संसाधने निवडलेल्या मॉडेलशी आणि क्युरेट केलेल्या डेटासेटसह एक वास्तविक उदाहरण दाखवून स्टेप-बाय-स्टेप ट्यूटोरियल देतात. या ट्यूटोरियल्सवर काम करण्यासाठी, तुम्हाला संबंधित प्रदात्याचे खाते आणि संबंधित मॉडेल व डेटासेटसाठी प्रवेश आवश्यक आहे.

प्रदाता ट्यूटोरियल वर्णन
OpenAI How to fine-tune chat models gpt-35-turbo ला एका विशिष्ट क्षेत्रासाठी ("recipe assistant") कसे फाईन-ट्यून करायचे ते शिकून घ्या; त्यासाठी प्रशिक्षण डेटा तयार करणे, फाईन-ट्यूनिंग जॉब चालवणे, आणि फाईन-ट्यून केलेले मॉडेल वापरून इन्फरन्स करणे.
Azure OpenAI GPT 3.5 Turbo fine-tuning tutorial Azure वर gpt-35-turbo-0613 मॉडेल कसे फाईन-ट्यून करायचे ते शिका; प्रशिक्षण डेटा तयार करणे व अपलोड करणे, फाईन-ट्यूनिंग जॉब चालविणे, नवीन मॉडेल तैनात करणे आणि उपयोग करणे.
Hugging Face Fine-tuning LLMs with Hugging Face या ब्लॉग पोस्टमध्ये तुम्हाला _open LLM_ (उदा. CodeLlama 7B) कसे फाईन-ट्यून करायचे ते शिकवले आहे, ज्यासाठी transformers लायब्ररी आणि Transformer Reinforcement Learning (TRL) वापरली जाते, तसेच Hugging Face वर उपलब्ध खुल्या datasets सोबत.
🤗 AutoTrain Fine-tuning LLMs with AutoTrain AutoTrain (किंवा AutoTrain Advanced) ही Hugging Face द्वारे विकसित पायथन लायब्ररी आहे जी अनेक वेगवेगळ्या कामांसाठी, त्यात LLM फाईन-ट्यूनिंगसाठी, सोपी फाईन-ट्यूनिंगची सुविधा देते. AutoTrain हे नो-कोड समाधान आहे आणि तुम्ही ते तुमच्या स्वतःच्या क्लाऊडमध्ये, Hugging Face Spaces मध्ये किंवा स्थानिकरित्या वापरू शकता. या मध्ये वेब-GUI, CLI आणि yaml कॉन्फिग फाइल्सद्वारे प्रशिक्षण यांचा समावेश आहे.
🦥 Unsloth Fine-tuning LLMs with Unsloth Unsloth हे एक खुल्या स्त्रोत फ्रेमवर्क आहे जे LLM फाईन-ट्यूनिंग आणि रिइन्फोर्समेंट लर्निंग (RL) ला समर्थन देते. Unsloth स्थानिक प्रशिक्षण, मूल्यांकन आणि तैनाती सहजतेने करण्यासाठी तयार नोटबुक्स प्रदान करते. हे टेक्स्ट-टू-स्पीच (TTS), BERT आणि मल्टीमोडल मॉडेल्सना देखील समर्थन देते. सुरुवात करण्यासाठी त्यांचा तपशीलवार Fine-tuning LLMs Guide वाचा.

असाइनमेंट

वरील ट्यूटोरियलपैकी एक निवडा आणि त्याचा अभ्यास करा. आम्ही कदाचित या ट्यूटोरियलमधील एक आवृत्ती Jupyter Notebooks मध्ये रेफरन्ससाठी येथे ठेवू शकू, तरीही कृपया तुमच्या स्वतःच्या अभिप्रायासाठी मूळ स्त्रोत थेट वापरा.

उत्कृष्ट काम! तुमचे शिक्षण सुरू ठेवा.

हा धडा पूर्ण केल्यानंतर, आमच्या Generative AI Learning collection पाहा आणि तुमचे जनरेटिव्ह AI ज्ञान अधिक वाढवा!

अभिनंदन!! तुम्ही या कोर्सच्या v2 मालिकेतील अंतिम धडा पूर्ण केला आहे! शिक्षण आणि निर्मिती यांना थांबवू नका. **फक्त या विषयासाठी अतिरिक्त सूचना पाहण्यासाठी RESOURCES पृष्ठ तपासा.

आमच्या v1 मालिकेतील धडे देखील अधिक असाइनमेंट्स आणि संकल्पनांसह अद्ययावत झाले आहेत. त्यामुळे एक मिनिट काढून तुमचे ज्ञान ताजे करा - आणि कृपया तुमचे प्रश्न व अभिप्राय शेअर करा ज्यामुळे आम्हाला समुदायासाठी हे धडे सुधारण्यात मदत होईल.


स्पष्टीकरण: हा दस्तऐवज AI अनुवाद सेवा Co-op Translator वापरून अनुवादित केला आहे. आम्ही अचूकतेसाठी प्रयत्न करतो, परंतु कृपया लक्षात घ्या की स्वयंचलित अनुवादांमध्ये चुका किंवा अचूकतेच्या त्रुटी असू शकतात. मूळ दस्तऐवज त्याच्या स्थानिक भाषेत अधिकृत स्रोत मानला जावा. महत्त्वाची माहिती साठी व्यावसायिक मानवी अनुवादाची शिफारस केली जाते. या अनुवाद वापरामुळे उद्भवणाऱ्या कोणत्याही गैरसमजुतीसाठी किंवा चुकीच्या अर्थसंकल्पांसाठी आम्ही जबाबदार नाही.