तपाईंको LLM लाई फाइन-ट्यूनिङ

ठूला भाषा मोडेलहरूलाई जेनेरेटिभ AI अनुप्रयोगहरू बनाउन प्रयोग गर्दा नयाँ चुनौतीहरू सामना गर्नुपर्छ। मुख्य समस्या भनेको मोडेलले कुनै प्रयोगकर्ता अनुरोधका लागि उत्पन्न गर्ने सामग्रीमा जवाफको गुणस्तर (सटीकता र सान्दर्भिकता) सुनिश्चित गर्नु हो। पहिलेका पाठहरूमा, हामीले प्रॉम्प्ट इन्जिनियरिङ्ग र पुनःप्राप्ति-समृद्ध सृजनशीलता जस्ता प्रविधिहरूको चर्चा गरेका थियौं, जसले अस्तित्वमा रहेका मोडेलमा प्रॉम्प्ट इनपुटलाई परिमार्जन गरेर समस्या समाधान गर्ने प्रयास गर्छन्।

आजको पाठमा, हामी तेस्रो प्रविधि, फाइन-ट्यूनिङ मा छलफल गर्नेछौं, जसले थप डाटा प्रयोग गरेर मोडेललाई आफैंलाई पुन:प्रशिक्षण गरेर चुनौती समाधान गर्ने प्रयास गर्छ। विवरणमा जाने गरौं।

सिकाइका उद्देश्यहरू

यो पाठले पूर्व-प्रशिक्षित भाषा मोडेलहरूका लागि फाइन-ट्यूनिङको अवधारणा प्रस्तुत गर्दछ, यस दृष्टिकोणका लाभ र चुनौतीहरू अन्वेषण गर्दछ, र तपाईंका जेनेरेटिभ AI मोडेलहरूको कार्यक्षमता सुधार गर्न फाइन-ट्यूनिङ कहिले र कसरी प्रयोग गर्ने भन्ने बारे मार्गनिर्देशन प्रदान गर्दछ।

यो पाठ सकिएपछि, तपाईंले तलका प्रश्नहरूको उत्तर दिन सक्षम हुनु पर्नेछ:

भाषा मोडेलहरूका लागि फाइन-ट्यूनिङ के हो?
फाइन-ट्यूनिङ कहिले र किन उपयोगी हुन्छ?
म पूर्व-प्रशिक्षित मोडेललाई कसरी फाइन-ट्यून गर्न सक्छु?
फाइन-ट्यूनिङका के-के सीमाहरू छन्?

तयार हुनु भयो? सुरु गरौं।

चित्रण गरिएको मार्गदर्शन

अघिल्लो डुबुल्की मार्नु अघि हामीले समेट्ने विषयहरूको ठूला चित्रहरू पहिल्याउन चाहनुहुन्छ? यस चित्रण गरिएको मार्गदर्शनलाई हेरौँ जसले फाइन-ट्यूनिङको मूल अवधारणा र प्रेरणादेखि प्रक्रिया र उत्तम अभ्यासहरू बुझ्नमा मद्दत गर्छ। यो खोजको लागि मनमोहक विषय हो, त्यसैले आफ्नो स्व-निर्देशित सिकाइ यात्राका लागि थप लिंकहरू पाउन Sources पृष्ठ हेर्न नबिर्सनुहोस्!

भाषा मोडेलहरूको लागि फाइन-ट्यूनिङ के हो?

परिभाषाअनुसार, ठूलो भाषा मोडेलहरू इन्टरनेट लगायत विभिन्न स्रोतहरूबाट ठूलो मात्रामा पाठमा पूर्व-प्रशिक्षित हुन्छन्। पूर्वका पाठहरूमा हामीले सिक्यौं कि मोडेलको प्रयोगकर्ताको प्रश्नहरू ("प्रॉम्प्टहरू") प्रति जवाफको गुणस्तर सुधार्न प्रॉम्प्ट इन्जिनियरिङ्ग र पुनःप्राप्ति-समृद्ध सृजनशीलता जस्ता प्रविधिहरू आवश्यक हुन्छन्।

एक लोकप्रिय प्रॉम्प्ट-इन्जिनियरिङ्ग प्रविधि भनेको मोडेललाई थप निर्देशनहरू दिएर जवाफका लागि के अपेक्षा गरिएको छ भन्ने स्पष्ट पार्नु हो, वा केही उदाहरणहरू (अप्रत्यक्ष निर्देशन) दिनु हो। यसलाई थोरै-शट सिकाइ भनिन्छ तर यसका दुई सीमाहरू छन्:

मोडेल टोकन सिमाहरूले तपाईंले दिन सक्ने उदाहरणहरूको संख्या सीमित गर्न सक्छ, जसले प्रभावकारितामा असर गर्छ।
मोडेल टोकन लागतले प्रत्येक प्रॉम्प्टमा उदाहरण थप्नु महँगो बनाउन सक्छ र लचिलोपन सीमित गर्न सक्छ।

फाइन-ट्यूनिङ भनेको मेसिन लर्निङ सिस्टमहरूमा सामान्य अभ्यास हो जहाँ हामी पूर्व-प्रशिक्षित मोडेल लिएर नयाँ डाटाले पुन:प्रशिक्षण गर्छौं ताकि विशिष्ट कार्यमा यसको प्रदर्शन सुधार होस्। भाषा मोडेलको सन्दर्भमा, हामी पूर्व-प्रशिक्षित मोडेललाई विशेष कार्य वा अनुप्रयोग डोमेनका लागि छनोट गरिएका उदाहरणहरूको सेटसँग फाइन-ट्यून्ग गरेर अनुकूलित मोडेल बनाउन सक्छौं जुन त्यो कार्य वा डोमेनका लागि अधिक सटीक र सान्दर्भिक हुन सक्छ। फाइन-ट्यूनिङको एक पक्षीय लाभ भनेको यसले थोरै-शट सिकाइमा आवश्यक उदाहरणहरूको संख्या पनि घटाउन सक्छ - जसले टोकन प्रयोग र लागत कम गर्छ।

मोडेलहरू कहिले र किन फाइन-ट्यून गर्ने?

यस सन्दर्भमा, फाइन-ट्यूनिङ भन्नाले हामी निगरानी गरिएको फाइन-ट्यूनिङलाई जनाउँदैछौं जहाँ पुन:प्रशिक्षण नयाँ डाटा थपेर गरिन्छ जुन मूल प्रशिक्षण डाटासेटको भाग थिएन। यो मूल डाटामा भिन्न हाइपरप्यारामिटरहरू प्रयोग गरेर मोडेललाई पुन:प्रशिक्षण गर्ने निगरानीरहित फाइन-ट्यूनिङबाट भिन्न छ।

महत्वपूर्ण कुरा के हो भने, फाइन-ट्यूनिङ उन्नत प्रविधि हो जसका लागि इच्छित परिणामहरू प्राप्त गर्न निश्चित स्तरको विशेषज्ञता आवश्यक पर्छ। यदि गलत तरिकाले गरियो भने, अपेक्षित सुधार नआउन सक्छ र तपाईंको लक्षित डोमेनको लागि मोडेलको प्रदर्शनमा पनि गिरावट आउन सक्छ।

त्यसैले, "कसरी" फाइन-ट्यून गर्ने सिक्नु अघि, तपाईंले जान्नुपर्छ "किन" यो मार्ग लिनुपर्छ र "कहिले" फाइन-ट्यूनिङ प्रक्रिया सुरू गर्नुपर्छ। आफूलाई यी प्रश्नहरू सोध्नुहोस्:

प्रयोग केस: तपाईंको फाइन-ट्यूनिङको प्रयोग केस के हो? वर्तमान पूर्व-प्रशिक्षित मोडेलको कुन पक्षमा सुधार गर्न चाहनुहुन्छ?
वैकल्पिकहरू: के तपाईंले पहिला नै इच्छित परिणामका लागि अन्य प्रविधिहरू प्रयास गर्नुभएको छ? यी प्रयोग गरेर तुलना गर्न आधार तयार गर्नुहोस्।
- प्रॉम्प्ट इन्जिनियरिङ्ग: सम्बन्धित प्रॉम्प्ट जवाफका उदाहरणसहित थोरै-शट प्रॉम्प्टिङ प्रयास गर्नुहोस्। जवाफको गुणस्तर मूल्यांकन गर्नुहोस्।
- पुनःप्राप्ति समृद्ध सृजनशीलता: तपाईंको डाटाबाट प्राप्त क्वेरी परिणामसहित प्रॉम्प्टहरूमा वृद्धि गर्नुहोस्। जवाफको गुणस्तर मूल्यांकन गर्नुहोस्।
लागतहरू: के तपाईंले फाइन-ट्यूनिङका लागतहरूको पहिचान गर्नुभएको छ?
- ट्यून गर्ने योग्यता - के पूर्व-प्रशिक्षित मोडेल फाइन-ट्यूनिङका लागि उपलब्ध छ?
- प्रयास - प्रशिक्षण डेटा तयार पार्ने, मोडेल मूल्यांकन र सुधार गर्ने
- कम्प्युट - फाइन-ट्यूनिङ जॉबहरू चलाउने र फाइन-ट्यून गरिएको मोडेल तैनाथ गर्ने
- डाटा - फाइन-ट्यूनिङ प्रभावका लागि पर्याप्त गुणस्तरीय उदाहरणहरूको पहुँच
लाभहरू: के तपाईंले फाइन-ट्यूनिङका लाभहरू पुष्टि गर्नुभएको छ?
- गुणस्तर - के फाइन-ट्यून गरिएको मोडेलले आधारभूत मोडेललाई पार गर्‍यो?
- लागत - के यसले प्रॉम्प्टलाई सरल बनाउँदै टोकन प्रयोग घटाउँछ?
- विस्तारयोग्यता - के तपाईं आधारभूत मोडेललाई नयाँ डोमेन्समा पुन: प्रयोग गर्न सक्नुहुन्छ?

यी प्रश्नहरूको उत्तर दिएर, तपाईं आफ्नो प्रयोग केसका लागि फाइन-ट्यूनिङ सही विधि हो कि होइन निर्णय गर्न सक्नुहुनेछ। आदर्श रूपमा, यो विधि तब मात्र मान्य हुन्छ जब लाभहरूले लागतभन्दा बढी हुन्छन्। निर्णय गरेपछि, अब सोच्ने भाषा मोडेललाई कसरी फाइन-ट्यून गर्ने भन्ने कुरा हो।

निर्णय प्रक्रियामा थप बुझाइ चाहनुहुन्छ? To fine-tune or not to fine-tune हेर्नुहोस्

हामी कसरी पूर्व-प्रशिक्षित मोडेल फाइन-ट्यून गर्न सक्छौं?

पूर्व-प्रशिक्षित मोडेल फाइन-ट्यून गर्न, तपाईंलाई चाहिन्छ:

फाइन-ट्यून गर्न पूर्व-प्रशिक्षित मोडेल
फाइन-ट्यूनिङका लागि डाटासेट
फाइन-ट्यूनिङ जॉब चलाउन प्रशिक्षण वातावरण
फाइन-ट्यून गरिएको मोडेल तैनाथ गर्न होस्टिङ वातावरण

कार्यमा फाइन-ट्यूनिङ

तलका स्रोतहरूले एउटा चयनित मोडेल र छनोट गरिएका डाटासेट प्रयोग गरेर वास्तविक उदाहरणमा चरण-दर-चरण ट्युटोरियल प्रदान गर्छन्। यी ट्युटोरियलहरूमा काम गर्न, तपाईंलाई त्यस्तो प्रदायकमा खाता र सम्बद्ध मोडेल तथा डाटासेटहरूको पहुँच आवश्यक छ।

प्रदायक	ट्युटोरियल	व्याख्या
OpenAI	च्याट मोडेलहरू कसरी फाइन-ट्यून गर्ने	एक विशेष डोमेन ("रेसिपी सहायक") का लागि `gpt-35-turbo` लाई फाइन-ट्यून गर्ने तरिका सिक्नुहोस् जसमा प्रशिक्षण डेटा तयार पार्ने, फाइन-ट्यूनिङ जॉब चलाउने, र फाइन-ट्यून गरिएको मोडेललाई पूर्वानुमानका लागि प्रयोग गर्ने समावेश छ।
Azure OpenAI	GPT 3.5 Turbo फाइन-ट्यूनिङ ट्युटोरियल	Azure मा `gpt-35-turbo-0613` मोडेललाई फाइन-ट्यून गर्ने तरिका सिक्नुहोस् जसमा प्रशिक्षण डेटा सिर्जना र अपलोड गर्ने कदमहरू, फाइन-ट्यूनिङ जॉब चलाउने, नयाँ मोडेल तैनाथ गर्ने र प्रयोग गर्ने मौका पाउनुहुन्छ।
Hugging Face	Hugging Face सँग LLMs फाइन-ट्यूनिङ	यो ब्लग पोष्टले खुला LLM (जस्तै `CodeLlama 7B`) लाई transformers पुस्तकालय र Transformer Reinforcement Learning (TRL) प्रयोग गरेर Hugging Face मा खुला datasets सँग कसरी फाइन-ट्यून गर्ने देखाउँछ।

🤗 AutoTrain	AutoTrain सँग LLMs फाइन-ट्यूनिङ	AutoTrain (वा AutoTrain Advanced) Hugging Face द्वारा विकास गरिएको एक python पुस्तकालय हो जसले धेरै कार्यहरूको लागि, त्यसमा LLM फाइन-ट्यूनिङ पनि, अनुमति दिन्छ। AutoTrain नो-कोड समाधान हो र फाइन-ट्यूनिङ तपाईंको आफ्नै क्लाउड, Hugging Face Spaces, वा स्थानीय रूपमा गर्न सकिन्छ। यसले वेब-आधारित GUI, CLI र yaml कन्फिग फाइलहरू मार्फत प्रशिक्षण समर्थन गर्छ।

🦥 Unsloth	Unsloth सँग LLMs फाइन-ट्यूनिङ	Unsloth खुला स्रोत संरचना हो जसले LLM फाइन-ट्यूनिङ र सुदृढीकरण सिकाइ (RL) समर्थन गर्दछ। Unsloth ले स्थानीय प्रशिक्षण, मूल्यांकन र तैनाथीकरणलाई सजिलो बनाउँछ, प्रयोग गर्न सहज notebooks सहित। यसले पाठ-देखि-स्वर (TTS), BERT र बहुमाध्यम मोडेलहरूलाई पनि समर्थन गर्दछ। सुरु गर्नको लागि, उनीहरूको चरण-दर-चरण Fine-tuning LLMs Guide पढ्नुहोस्।

कार्य

माथि दिइएका ट्युटोरियलहरू मध्ये एउटा छान्नुहोस् र त्यसलाई पालना गर्नुहोस्। हामी यी ट्युटोरियलहरूका संस्करणहरू Jupyter Notebooks मा रेफरेन्सका लागि दोहोर्‍याउन सक्छौं। कृपया सबैभन्दा नयाँ संस्करणहरूका लागि मूल स्रोतहरू सिधै प्रयोग गर्नुहोस्।

उत्कृष्ट कार्य! तपाईंको सिकाइ जारी राख्नुहोस्।

यो पाठ सकिसकेपछि, हाम्रो जेनेरेटिभ AI सिकाइ सङ्ग्रह हेर्नुहोस् र आफ्नो जेनेरेटिभ AI ज्ञानलाई उचाइमा पुर्‍याउनुहोस्!

बधाई छ!! तपाईंले यस कोर्सको v2 श्रृंखलाको अन्तिम पाठ पूरा गर्नुभयो! सिक्न र निर्माण गर्न रोक्नु हुँदैन। **RESOURCES पृष्ठमा यो विषयका लागि अतिरिक्त सुझावहरूको सूची हेर्नुहोस्।

हाम्रो v1 श्रृंखलाका पाठहरू पनि थप कार्य र अवधारणाहरू सहित अपडेट गरिएका छन्। त्यसैले एक मिनेट लिएर आफ्नो ज्ञान ताजा गर्नुहोस् - र कृपया तपाईंका प्रश्नहरू र प्रतिक्रिया साझा गर्नुहोस् जसले समुदायका लागि यी पाठहरू सुधार गर्न मद्दत पुर्याउँछ।

अस्वीकरण: यो दस्तावेज AI अनुवाद सेवा Co-op Translator प्रयोग गरी अनुवाद गरिएको हो। हामी शुद्धताको प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादमा त्रुटि वा अशुद्धता हुन सक्छ। मूल भाषामा रहेको दस्तावेजलाई आधिकारिक स्रोतको रूपमा मानिनु पर्दछ। महत्वपूर्ण जानकारीका लागि पेशेवर मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादनको प्रयोगबाट हुने कुनै पनि गलतफहमी वा गलत व्याख्याका लागि हामी जिम्मेवार हुने छैनौं।

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

तपाईंको LLM लाई फाइन-ट्यूनिङ

सिकाइका उद्देश्यहरू

चित्रण गरिएको मार्गदर्शन

भाषा मोडेलहरूको लागि फाइन-ट्यूनिङ के हो?

मोडेलहरू कहिले र किन फाइन-ट्यून गर्ने?

हामी कसरी पूर्व-प्रशिक्षित मोडेल फाइन-ट्यून गर्न सक्छौं?

कार्यमा फाइन-ट्यूनिङ

कार्य

उत्कृष्ट कार्य! तपाईंको सिकाइ जारी राख्नुहोस्।

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

तपाईंको LLM लाई फाइन-ट्यूनिङ

सिकाइका उद्देश्यहरू

चित्रण गरिएको मार्गदर्शन

भाषा मोडेलहरूको लागि फाइन-ट्यूनिङ के हो?

मोडेलहरू कहिले र किन फाइन-ट्यून गर्ने?

हामी कसरी पूर्व-प्रशिक्षित मोडेल फाइन-ट्यून गर्न सक्छौं?

कार्यमा फाइन-ट्यूनिङ

कार्य

उत्कृष्ट कार्य! तपाईंको सिकाइ जारी राख्नुहोस्।