Skip to content

Latest commit

 

History

History
105 lines (69 loc) · 26.4 KB

File metadata and controls

105 lines (69 loc) · 26.4 KB

Open Source Models

तुमच्या LLM चे फाईन-ट्यूनिंग

मोठ्या भाषा मॉडेल्सचा वापर करून जनरेटिव्ह AI अनुप्रयोग तयार करणे नवीन आव्हाने घेऊन येते. एक मुख्य समस्या म्हणजे मॉडेलद्वारे दिलेल्या वापरकर्ता विनंतीसाठी तयार केलेल्या कंटेंटमधील प्रतिसादाची गुणवत्ता (अचूकता आणि सुसंगतता) सुनिश्चित करणे. मागील धड्यांमध्ये, आम्ही प्रॉम्प्ट इंजिनीअरिंग आणि रिट्रीव्हल-अगमेंटेड जनरेशनसारख्या तंत्रांवर चर्चा केली आहे ज्या विद्यमान मॉडेलला प्रॉम्प्ट इनपुटमध्ये बदल करून समस्या सोडवण्याचा प्रयत्न करतात.

आजच्या धड्यात, आपण तिसऱ्या तंत्रावर चर्चा करतो, फाईन-ट्यूनिंग, जे मॉडेल स्वतःला अतिरिक्त डेटासह पुनःप्रशिक्षित करून आव्हानावर मात करण्याचा प्रयत्न करते. चला तपशीलात पाहूया.

अध्ययन उद्दिष्टे

हा धडा पूर्व-प्रशिक्षित भाषा मॉडेल्ससाठी फाईन-ट्यूनिंग या संकल्पनेची ओळख करून देतो, या पद्धतीचे फायदे आणि आव्हाने तपासतो, आणि तुमच्या जनरेटिव्ह AI मॉडेल्सच्या कामगिरी सुधारण्यासाठी फाईन-ट्यूनिंग कधी आणि कसे करायचे यावर मार्गदर्शन पुरवतो.

या धड्याच्या शेवटी, तुम्ही खालील प्रश्नांची उत्तरे देण्यास सक्षम असाल:

  • भाषा मॉडेल्ससाठी फाईन-ट्यूनिंग म्हणजे काय?
  • फाईन-ट्यूनिंग कधी आणि का उपयुक्त आहे?
  • पूर्व-प्रशिक्षित मॉडेल मला कसे फाईन-ट्यून करता येईल?
  • फाईन-ट्यूनिंगच्या मर्यादा काय आहेत?

तयार आहात? चला सुरू करूया.

चित्रित मार्गदर्शक

आपण आतापर्यंत काय शिकणार आहोत याचा एक मोठा आराखडा पाहू इच्छिता का? हा चित्रित मार्गदर्शक पाहा जो या धड्याच्या अध्ययन प्रवासाचे वर्णन करतो - फाईन-ट्यूनिंगसाठी मूलभूत संकल्पना आणि प्रेरणा शिकण्यापासून ते फाईन-ट्यूनिंग कार्यवाही कशी करावी आणि चांगल्या पद्धती काय आहेत याचे समजणे पर्यंत. हा विषय अत्यंत मनोरंजक आहे, म्हणून तुमच्या स्व-मार्गदर्शित शिक्षण प्रवासासाठी अधिक दुव्यांसाठी Resources पान विसरू नका!

Illustrated Guide to Fine Tuning Language Models

भाषा मॉडेल्ससाठी फाईन-ट्यूनिंग म्हणजे काय?

व्याख्येनुसार, मोठ्या भाषा मॉडेल्स पूर्व-प्रशिक्षित असतात विविध स्रोतांमधील मोठ्या प्रमाणात मजकुरावर, ज्यामध्ये इंटरनेट समाविष्ट आहे. मागील धड्यांमध्ये शिकल्याप्रमाणे, वापरकर्त्यांच्या प्रश्नांसाठी ("प्रॉम्प्टसाठी") मॉडेलच्या प्रतिसादाचा दर्जा सुधारण्यासाठी आपल्याला प्रॉम्प्ट इंजिनीअरिंग आणि रिट्रीव्हल-अगमेंटेड जनरेशन सारख्या तंत्रांची गरज असते.

एक लोकप्रिय प्रॉम्प्ट-इंजिनीअरिंग तंत्र म्हणजे मॉडेलला प्रतिसादात काय अपेक्षित आहे याबद्दल अधिक मार्गदर्शन देणे - सूचना (स्पष्ट मार्गदर्शन) देऊन किंवा काही उदाहरणे (अस्पष्ट मार्गदर्शन) देऊन. याला फ्यू-शॉट शिक्षण म्हणतात परंतु याला दोन मर्यादा आहेत:

  • मॉडेल टोकन मर्यादांमुळे द्यालेल्या उदाहरणांची संख्या मर्यादित होते आणि प्रभावीपणा मर्यादित होतो.
  • टोकन खर्चामुळे प्रत्येक प्रॉम्प्टमध्ये उदाहरणे जोडणे महाग पडते आणि लवचीकता कमी होते.

फाईन-ट्यूनिंग हा मशीन लर्निंग सिस्टीममध्ये सामान्य पद्धत आहे जिथे आपण पूर्व-प्रशिक्षित मॉडेल घेऊन नवीन डेटासह पुनःप्रशिक्षित करतो जेणेकरून विशिष्ट कार्यावर त्याची कामगिरी सुधारू शकते. भाषा मॉडेलच्या संदर्भात, आपण एका विशिष्ट कार्य किंवा अनुप्रयोग क्षेत्रासाठी निवडक उदाहरणांच्या सेटसह पूर्व-प्रशिक्षित मॉडेल फाईन-ट्यून करू शकतो आणि सानुकूल मॉडेल तयार करू शकतो जे त्या कार्यासाठी अधिक अचूक आणि सुसंगत असू शकते. फाईन-ट्यूनिंगचा एक अतिरिक्त फायदा म्हणजे फ्यू-शॉट शिक्षणासाठी आवश्यक उदाहरणांची संख्या कमी होऊ शकते - ज्यामुळे टोकन वापर आणि संबंधित खर्च कमी होतात.

कधी आणि का मॉडेल फाईन-ट्यून करावे?

या संदर्भात, जेव्हा आपण फाईन-ट्यूनिंग बद्दल बोलतो, तेव्हा आम्ही सुपरवाइज्ड फाईन-ट्यूनिंग संदर्भित करतो जिथे पुनःप्रशिक्षण मूळ प्रशिक्षण डेटासेटचा भाग नसलेला नवीन डेटा जोडून केले जाते. हे अनसुपरवाइज्ड फाईन-ट्यूनिंगला वेगळे आहे जिथे मॉडेल मूळ डेटावर वेगळ्या हायपरपॅरामीटर्ससह पुनःप्रशिक्षित केला जातो.

महत्त्वाचे लक्षात ठेवण्यासारखे आहे की फाईन-ट्यूनिंग ही एक प्रगत तंत्र आहे ज्यासाठी अपेक्षित निकाल मिळवण्याकरिता काही तज्ञतेची आवश्यकता असते. चुकीच्या पद्धतीने केली तर अपेक्षित सुधारणांचा अभाव होऊ शकतो आणि तुमच्या लक्ष्यित क्षेत्रासाठी मॉडेलची कामगिरी खराबही होऊ शकते.

म्हणून, "कसे" फाईन-ट्यून करायचे शिकण्यापूर्वी, "का" हा मार्ग घ्यावा आणि "कधी" फाईन-ट्यूनिंग प्रक्रिया सुरू करावी हे जाणून घेणे आवश्यक आहे. स्वतःला खालील प्रश्न विचारा:

  • उपयोग प्रकरण: फाईन-ट्यूनिंगसाठी तुमचा उपयोग प्रकरण काय आहे? सध्याच्या पूर्व-प्रशिक्षित मॉडेलमध्ये कोणता पैलू तुम्हाला सुधारायचा आहे?
  • पर्याय: अपेक्षित निकाल साध्य करण्यासाठी तुम्ही इतर तंत्रे वापरली आहेत का? त्यांचा वापर करून तुलना साठी एक मूलभूत स्तर तयार करा.
    • प्रॉम्प्ट इंजिनीअरिंग: संबंधित प्रॉम्प्ट प्रतिसादांच्या उदाहरणांसह फ्यू-शॉट प्रॉम्प्टिंग सारखी तंत्रे वापरून पाहा. प्रतिसादांची गुणवत्ता मूल्यांकन करा.
    • रिट्रीव्हल अगमेंटेड जनरेशन: तुमच्या डेटा मधील क्वेरी निकालांसह प्रॉम्प्ट वाढवून पाहा. प्रतिसादांची गुणवत्ता मूल्यांकन करा.
  • खर्च: फाईन-ट्यूनिंगसाठी खर्च ओळखले आहेत का?
    • ट्यूनिबिलिटी - पूर्व-प्रशिक्षित मॉडेल फाईन-ट्यूनिंगसाठी उपलब्ध आहे का?
    • प्रयत्न - प्रशिक्षण डेटा तयार करणे, मॉडेलचे मूल्यांकन आणि सुधारणा करण्यासाठी.
    • संगणन - फाईन-ट्यूनिंग प्रक्रिया चालवण्यासाठी आणि फाईन-ट्यून मॉडेल तैनात करण्यासाठी.
    • डेटा - पुरेशी गुणवत्ता असलेली उदाहरणे फाईन-ट्यूनिंगसाठी उपलब्ध आहेत का?
  • फायदे: फाईन-ट्यूनिंगचे फायदे पुष्टी केले आहेत का?
    • गुणवत्ता - फाईन-ट्यून केलेले मॉडेल मूलभूत स्तरापेक्षा चांगले आहे का?
    • खर्च - हे प्रॉम्प्ट सोप्या करून टोकन वापर कमी करते का?
    • विस्तारक्षमता - तुम्ही मूळ मॉडेल नवीन क्षेत्रांसाठी पुनरुपयोग करू शकता का?

या प्रश्नांची उत्तरे देऊ शकल्यावर, तुम्हाला ठरवता येईल की तुमच्या वापर प्रकरणासाठी फाईन-ट्यूनिंग योग्य आहे का. आदर्शपणे, हा मार्ग फक्त तेव्हा योग्य आहे जेव्हा फायदे खर्चापेक्षा जास्त असतात. जेव्हा तुम्ही सुरू करण्याचा निर्णय घेतला, तेव्हा फाईन-ट्यूनिंगची पद्धत कशी असावी यावर विचार करा.

निर्णय प्रक्रियेबद्दल अधिक माहिती हवी आहे का? पाहा To fine-tune or not to fine-tune

पूर्व-प्रशिक्षित मॉडेल कसे फाईन-ट्यून करू?

पूर्व-प्रशिक्षित मॉडेल फाईन-ट्यून करण्यासाठी, तुम्हाला गरज आहे:

  • फाईन-ट्यून करण्यासाठी पूर्व-प्रशिक्षित मॉडेल
  • फाईन-ट्यूनिंगसाठी वापरण्यासाठी डेटासेट
  • फाईन-ट्यूनिंग जॉब चालविण्याचे प्रशिक्षण वातावरण
  • फाईन-ट्यून मॉडेल होस्ट करण्याचे वातावरण

फाईन-ट्यूनिंग कृतीत

खालील संसाधने निवडलेल्या मॉडेलसह आणि निवडक डेटासेटसह एक वास्तविक उदाहरण चरण-दर-चरण ट्यूटोरियल प्रदान करतात. या ट्यूटोरियल्ससाठी, तुम्हाला विशिष्ट प्रदात्याचे खाते, संबंधित मॉडेल आणि डेटासेट्समध्ये प्रवेश हवा.

प्रदाता ट्यूटोरियल वर्णन
OpenAI How to fine-tune chat models एका विशिष्ट क्षेत्रासाठी ("रेसिपी सहाय्यक") gpt-35-turbo फाईन-ट्यून करणे शिकाः प्रशिक्षण डेटा तयार करणे, फाईन-ट्यूनिंग जॉब चालविणे आणि फाईन-ट्यून मॉडेल वापरून इन्फरन्स करणे.
Azure OpenAI GPT 3.5 Turbo fine-tuning tutorial Azure वर gpt-35-turbo-0613 मॉडेल फाईन-ट्यून करण्याचे शिक्षण - प्रशिक्षण डेटा तयार करणे आणि अपलोड करणे, फाईन-ट्यूनिंग जॉब चालविणे, नवीन मॉडेल तैनात करणे आणि वापरणे.
Hugging Face Fine-tuning LLMs with Hugging Face हा ब्लॉग पोस्ट तुम्हाला एका ओपन LLM (उदा: CodeLlama 7B) च्या फाईन-ट्यूनिंगसाठी transformers लायब्ररी आणि Transformer Reinforcement Learning (TRL) चा वापर करताना मार्गदर्शन करतो; तसेच Hugging Face वरील खुल्या डेटासेट्स चा वापर.
🤗 AutoTrain Fine-tuning LLMs with AutoTrain AutoTrain (किंवा AutoTrain Advanced) हे Hugging Face च्या विकसित केलेले पायथन लायब्ररी आहे जे अनेक वेगवेगळ्या कार्यांसाठी, समावेशक LLM फाईन-ट्यूनिंगसाठी सोपे करतो. AutoTrain हा नो-कोड सोल्यूशन आहे आणि फाईन-ट्यूनिंग तुमच्या स्वतःच्या क्लाऊड, Hugging Face Spaces किंवा लोकल मशीनवर करता येऊ शकते. यात वेब-आधारित GUI, CLI आणि yaml कॉन्फिग फाइल्सद्वारे प्रशिक्षण करण्याची सोय आहे.
🦥 Unsloth Fine-tuning LLMs with Unsloth Unsloth हा एक मुक्त स्रोत फ्रेमवर्क आहे जो LLM फाईन-ट्यूनिंग आणि reinforcement learning (RL) ला समर्थन देतो. Unsloth लोकल प्रशिक्षण, मूल्यांकन, आणि तैनाती प्रक्रिया सुव्यवस्थित करतो व रेडी टू यज notebooks प्रदान करतो. तसेच तो टेक्स्ट-टू-स्पीच (TTS), BERT आणि मल्टिमॉडल मॉडेल्सना समर्थन करतो. सुरुवात करण्यासाठी, त्यांचा स्टेप-बाय-स्टेप Fine-tuning LLMs Guide वाचा.

असाइनमेंट

वरील ट्यूटोरियलपैकी एक निवडा आणि त्यातून पुढे जा. आम्ही या रेपॉमध्ये Jupyter Notebooks मध्ये या ट्यूटोरियल्सचा एक आवृत्ती संदर्भासाठी तयार करू शकतो. कृपया नेहमी मूळ स्रोत वापरून नवीनतम आवृत्त्या मिळवा.

छान काम! तुमचे शिक्षण सुरू ठेवा.

हा धडा पूर्ण केल्यानंतर, आमच्या Generative AI Learning collection पाहा आणि तुमचे जनरेटिव्ह AI ज्ञान पुढे वाढवा!

अभिनंदन!! तुम्ही या कोर्सच्या v2 सिरीजमधील अंतिम धडा पूर्ण केला आहे! शिकणे आणि तयार करणे थांबवू नका. **या विषयासाठी अतिरिक्त सूचना असलेल्या RESOURCES पानावर जरूर पहा.

आमच्या v1 सिरीजचे धडे देखील अधिक असाइनमेंट्स आणि संकल्पनांसह अद्ययावत केले गेले आहेत. त्यामुळे तुमचे ज्ञान ताजे करण्यासाठी एक मिनिट घाला - आणि कृपया तुमचे प्रश्न आणि अभिप्राय शेअर करा म्हणजे आम्ही समुदायासाठी हे धडे सुधारू शकू.


सूचना: हा दस्तऐवज AI अनुवाद सेवा Co-op Translator चा वापर करून अनुवादित केला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित अनुवादांमध्ये चुका किंवा अचूकतेत तफावत असू शकते. मूळ दस्तऐवज त्याच्या मूळ भाषेत अधिकृत स्रोत मानला जावा. महत्त्वपूर्ण माहितीसाठी व्यावसायिक मानवी अनुवाद करण्याचा सल्ला दिला जातो. या अनुवादाच्या वापरामुळे उद्भवलेल्या कोणत्याही गैरसमजुती किंवा चुकीच्या अर्थलागीसाठी आम्ही जबाबदार नाही.