(यस पाठको भिडियो हेर्न माथिको तस्बिरमा क्लिक गर्नुहोस्)
जनरेटिव एआई एक कृत्रिम बुद्धिमत्ता हो जसले पाठ, चित्र र अन्य प्रकारका सामग्रीहरू उत्पन्न गर्न सक्छ। यसलाई एक अद्भुत प्रविधि बनाउने कुरा यो हो कि यसले एआईलाई लोकतान्त्रिक बनाउँछ, जसले गर्दा जो कोहीले पनि केवल एक पाठ संकेतको माध्यमबाट यसलाई प्रयोग गर्न सक्छ, प्राकृतिक भाषामा लेखिएको एउटा वाक्य। तपाईंलाई जाभा वा SQL जस्ता भाषा सिक्न आवश्यक छैन, तपाईंले केवल आफ्नो भाषाको प्रयोग गर्नुपर्नेछ, तपाईं के चाहनुहुन्छ भनेर भन्नुहोस् र एआई मोडेलबाट एउटा सुझाव आउँछ। यसका लागि अनुप्रयोगहरू र प्रभावहरू विशाल छन्, तपाईं रिपोर्टहरू लेख्न वा बुझ्न, अनुप्रयोगहरू लेख्न र धेरै कुरा सेकेन्डमा गर्न सक्नुहुन्छ।
यस पाठ्यक्रममा, हामी हाम्रो स्टार्टअपले शिक्षा क्षेत्रमा नयाँ परिदृश्यहरू अनलक गर्न जनरेटिव एआईलाई कसरी प्रयोग गर्छ भन्ने कुरा अन्वेषण गर्नेछौं र यसको अनुप्रयोगको सामाजिक प्रभाव र प्रविधिको सीमाहरू सम्बन्धी अनिवार्य चुनौतीहरूको सामना कसरी गर्छौं भन्ने कुरा हेर्नेछौं।
यस पाठमा समावेश हुनेछ:
- व्यवसायिक परिदृश्यको परिचय: हाम्रो स्टार्टअपको विचार र मिशन।
- जनरेटिव एआई र हामी कसरी हालको प्रविधि परिदृश्यमा आइपुगेका छौं।
- ठूला भाषा मोडेलको आन्तरिक कार्यप्रणाली।
- ठूला भाषा मोडेलहरूको मुख्य क्षमताहरू र व्यावहारिक प्रयोगका केसहरू।
यो पाठ पूरा गरेपछि, तपाईं बुझ्नुहुनेछ:
- जनरेटिव एआई के हो र ठूला भाषा मोडेलहरू कसरी काम गर्छन्।
- कसरी तपाईं ठूला भाषा मोडेलहरूलाई विभिन्न प्रयोगका केसहरूमा प्रयोग गर्न सक्नुहुन्छ, शिक्षा परिदृश्यमा केन्द्रित।
जनरेटिव कृत्रिम बुद्धिमत्ता (एआई) एआई प्रविधिको शिखर प्रतिनिधित्व गर्दछ, जुन पहिले असम्भव मानिएको सीमाहरूलाई धकेल्दै। जनरेटिव एआई मोडेलहरूमा धेरै क्षमताहरू र अनुप्रयोगहरू छन्, तर यस पाठ्यक्रमका लागि हामी यसले शिक्षा क्षेत्रमा कसरी क्रान्तिकारी परिवर्तन ल्याइरहेको छ भन्ने कुरा एक काल्पनिक स्टार्टअपको माध्यमबाट अन्वेषण गर्नेछौं। हामी यस स्टार्टअपलाई हाम्रो स्टार्टअप भनेर उल्लेख गर्नेछौं। हाम्रो स्टार्टअप शिक्षा क्षेत्रमा काम गर्छ, र यसको महत्वाकांक्षी मिशन वक्तव्य हो:
शिक्षामा पहुँचलाई विश्वव्यापी रूपमा सुधार गर्ने, शिक्षामा समान पहुँच सुनिश्चित गर्ने र प्रत्येक शिक्षार्थीलाई उनीहरूको आवश्यकताअनुसार व्यक्तिगत शिक्षण अनुभव प्रदान गर्ने।
हाम्रो स्टार्टअप टोलीलाई थाहा छ कि हामी यो लक्ष्य हासिल गर्न सक्षम हुने छैनौं, जबसम्म हामी आधुनिक समयको सबैभन्दा शक्तिशाली उपकरणहरू मध्ये एक – ठूला भाषा मोडेलहरू (LLMs) – लाई प्रयोग गर्दैनौं।
जनरेटिव एआईले आजको सिकाइ र शिक्षणको तरिका क्रान्तिकारी रूपमा परिवर्तन गर्ने अपेक्षा गरिएको छ, विद्यार्थीहरूले २४ घण्टा उपलब्ध हुने भर्चुअल शिक्षकहरूलाई ठूलो मात्रामा जानकारी र उदाहरणहरू प्रदान गर्ने र शिक्षकहरूले आफ्ना विद्यार्थीहरूको मूल्यांकन गर्न र प्रतिक्रिया दिन नवीन उपकरणहरू प्रयोग गर्न सक्षम हुनेछन्।
सुरु गर्न, हामीले पाठ्यक्रमभर प्रयोग गर्ने केही आधारभूत अवधारणाहरू र शब्दावलीहरू परिभाषित गरौं।
हालै जनरेटिव एआई मोडेलहरूको घोषणा द्वारा सिर्जना गरिएको असाधारण उत्साह को बाबजुद, यो प्रविधि दशकौंसम्म निर्माण भइरहेको छ, जसको पहिलो अनुसन्धान प्रयासहरू ६० को दशकमा सुरु भएका थिए। हामी अहिले एआईसँग मानव संज्ञानात्मक क्षमताहरू भएको बिन्दुमा छौं, जस्तै कुराकानी, जस्तै OpenAI ChatGPT वा Bing Chat ले देखाउँछ, जसले वेब खोज Bing कुराकानीको लागि GPT मोडेल पनि प्रयोग गर्दछ।
थोरै पछाडि फर्किएर हेर्दा, एआईका पहिलो प्रोटोटाइपहरू टाइप गरिएको च्याटबोटहरू थिए, विशेषज्ञहरूको समूहबाट निकालेको ज्ञान आधारमा निर्भर गर्दै र कम्प्युटरमा प्रतिनिधित्व गरिएको। ज्ञान आधारमा रहेका उत्तरहरू इनपुट पाठमा देखा पर्ने कुञ्जी शब्दहरूद्वारा ट्रिगर गरिन्थे। तर, चाँडै नै यस्तो दृष्टिकोण, टाइप गरिएको च्याटबोटहरू प्रयोग गर्दै, राम्रोसँग विस्तार गर्न नसक्ने स्पष्ट भयो।
९० को दशकमा पाठ विश्लेषणमा सांख्यिकीय दृष्टिकोणको प्रयोगले एक मोड ल्यायो। यसले नयाँ एल्गोरिदमहरूको विकासलाई उत्प्रेरित गर्यो – जसलाई मेशिन लर्निङ भनेर चिनिन्छ – जसले बिना स्पष्ट रूपमा प्रोग्राम गरिएको डाटा बाट ढाँचा सिक्न सक्षम बनायो। यस दृष्टिकोणले मेसिनहरूलाई मानव भाषा बुझाइको नक्कल गर्न अनुमति दिन्छ: पाठ-लेबल जोडीहरूमा एक सांख्यिकीय मोडेल तालिम प्राप्त गरिन्छ, जसले मोडेललाई सन्देशको उद्देश्यको प्रतिनिधित्व गर्ने पूर्वनिर्धारित लेबलको साथ अज्ञात इनपुट पाठ वर्गीकृत गर्न सक्षम बनाउँछ।
हालका वर्षहरूमा, ठूलो परिमाणको डाटा र जटिल गणनाहरू सम्हाल्न सक्षम हार्डवेयरको प्रविधिक विकासले एआईमा अनुसन्धानलाई प्रोत्साहित गर्यो, जसले न्यूरल नेटवर्क वा गहिरो शिक्षण एल्गोरिदम भनिने उन्नत मेशिन लर्निङ एल्गोरिदमहरूको विकासलाई जन्म दियो।
न्यूरल नेटवर्कहरूले (विशेष गरी पुनरावर्ती न्यूरल नेटवर्कहरू – RNNs) प्राकृतिक भाषा प्रशोधनलाई उल्लेखनीय रूपमा बढायो, पाठको अर्थलाई अझ बढी अर्थपूर्ण तरिकामा प्रतिनिधित्व गर्न सक्षम बनायो, वाक्यमा शब्दको सन्दर्भको मूल्यांकन गर्दै।
यो नयाँ शताब्दीको पहिलो दशकमा जन्मेका भर्चुअल सहायकहरूलाई शक्ति दिने प्रविधि हो, मानव भाषालाई व्याख्या गर्न, आवश्यकतालाई पहिचान गर्न र यसलाई पूरा गर्न कार्य गर्न – जस्तै पूर्वनिर्धारित स्क्रिप्टको साथ उत्तर दिन वा तेस्रो पक्ष सेवाको उपभोग गर्न सक्षम।
त्यसैले हामी आजको जनरेटिव एआईमा आइपुगेका छौं, जसलाई गहिरो शिक्षणको उपसमूहको रूपमा देख्न सकिन्छ।
एआई क्षेत्रमा दशकौंको अनुसन्धान पछि, नयाँ मोडेल वास्तुकला – ट्रान्सफर्मर भनिने – ले RNNs को सीमाहरूलाई पार गर्यो, इनपुटको रूपमा धेरै लामो पाठ अनुक्रमहरू प्राप्त गर्न सक्षम। ट्रान्सफर्मरहरू ध्यान संयन्त्रमा आधारित छन्, जसले मोडेललाई प्राप्त गरेको इनपुटहरूमा फरक तौल दिन सक्षम बनाउँछ, 'अधिक ध्यान दिने' जहाँ सबैभन्दा प्रासंगिक जानकारी केन्द्रित हुन्छ, पाठ अनुक्रममा उनीहरूको क्रमको परवाह नगरी।
हालका धेरै जनरेटिव एआई मोडेलहरू – जसलाई ठूला भाषा मोडेलहरू (LLMs) पनि भनिन्छ, किनभने तिनीहरू पाठ्य इनपुट र आउटपुटसँग काम गर्छन् – वास्तवमा यस वास्तुकलामा आधारित छन्। यी मोडेलहरूको बारेमा चाखलाग्दो कुरा – किताबहरू, लेखहरू र वेबसाइटहरू जस्ता विविध स्रोतहरूबाट ठूलो मात्रामा लेबल नभएको डाटामा तालिम प्राप्त – तिनीहरूलाई फरक फरक कार्यहरूमा अनुकूलित गर्न सकिन्छ र सिर्जनात्मकता जस्तो देखिने व्याकरणिक रूपमा सही पाठ उत्पन्न गर्न सक्षम छन्। त्यसैले, तिनीहरूले मेसिनको 'बुझ्न' इनपुट पाठको क्षमता उल्लेखनीय रूपमा बढाए मात्र होइन, तर तिनीहरूले मानव भाषामा मौलिक उत्तर उत्पन्न गर्ने क्षमता सक्षम गरे।
अर्को अध्यायमा हामी विभिन्न प्रकारका जनरेटिव एआई मोडेलहरू अन्वेषण गर्नेछौं, तर अहिलेको लागि, हामी ठूला भाषा मोडेलहरू कसरी काम गर्छन् भन्ने कुरा हेरौं, OpenAI GPT (जनरेटिव प्रि-ट्रेन गरिएको ट्रान्सफर्मर) मोडेलहरूमा केन्द्रित।
-
टोकनाइजर, पाठलाई सङ्ख्यामा रूपान्तरण: ठूला भाषा मोडेलहरूले इनपुटको रूपमा पाठ प्राप्त गर्छन् र आउटपुटको रूपमा पाठ उत्पन्न गर्छन्। तर, सांख्यिकीय मोडेलहरू भएकाले, तिनीहरू पाठ अनुक्रमहरू भन्दा सङ्ख्याहरूमा धेरै राम्रोसँग काम गर्छन्। त्यसैले मोडेलको कोर प्रयोग गर्नु अघि हरेक इनपुटलाई टोकनाइजरद्वारा प्रशोधन गरिन्छ। टोकन पाठको एउटा टुक्रा हो – जो भिन्न सङ्ख्याका अक्षरहरू मिलेर बनेको हुन्छ, त्यसैले टोकनाइजरको मुख्य काम इनपुटलाई टोकनहरूको एरेमा विभाजन गर्नु हो। त्यसपछि, प्रत्येक टोकनलाई टोकन सूचकांकसँग नक्सा गरिन्छ, जुन मूल पाठ टुक्राको पूर्णाङ्क कोडिङ हो।
-
आउटपुट टोकनहरूको भविष्यवाणी: n टोकनहरू इनपुटको रूपमा दिइएपछि (अधिकतम n मोडेलअनुसार फरक हुन्छ), मोडेलले एक टोकनलाई आउटपुटको रूपमा भविष्यवाणी गर्न सक्षम हुन्छ। यो टोकन त्यसपछि अर्को पुनरावृत्तिको इनपुटमा समाहित हुन्छ, एक विस्तारशील विन्डो ढाँचामा, उत्तरको रूपमा एक (वा धेरै) वाक्य प्राप्त गर्ने राम्रो प्रयोगकर्ता अनुभव सक्षम बनाउँदै। यसले किन, यदि तपाईंले कहिल्यै ChatGPT संग खेलेको हुनुहुन्छ भने, कहिलेकाहीं यो वाक्यको बीचमा रोकिएको जस्तो देखिन्छ भन्ने कुरा स्पष्ट गर्दछ।
-
चयन प्रक्रिया, सम्भाव्यता वितरण: आउटपुट टोकन मोडेलद्वारा वर्तमान पाठ अनुक्रम पछि हुने सम्भावनाको आधारमा चयन गरिन्छ। यसको कारण यो हो कि मोडेलले सबै सम्भावित 'अर्को टोकन'हरूमा आधारित सम्भाव्यता वितरणको भविष्यवाणी गर्छ, यसको तालिममा आधारित। तर, सधैं सबैभन्दा उच्च सम्भावना भएको टोकन चयन गरिँदैन। यस छनोटमा अनियमितताको डिग्री थपिएको छ, जसरी मोडेलले गैर-निर्धारणात्मक तरिकामा कार्य गर्छ - हामीलाई उही इनपुटको लागि उही आउटपुट प्राप्त हुँदैन। यो अनियमितताको डिग्री सिर्जनात्मक सोचको प्रक्रियालाई अनुकरण गर्न थपिएको छ र यसलाई तापमान भनिने मोडेल प्यारामिटरको प्रयोग गरेर ट्युन गर्न सकिन्छ।
अब हामीसँग ठूला भाषा मोडेलको आन्तरिक कार्यप्रणालीको राम्रो बुझाइ भएको छ, हामीले तिनीहरूले प्रदर्शन गर्न सक्ने सबैभन्दा सामान्य कार्यहरूको केही व्यावहारिक उदाहरणहरू हेर्नेछौं, हाम्रो व्यवसायिक परिदृश्यमा ध्यान दिँदै। हामीले भनेका थियौं कि ठूला भाषा मोडेलको मुख्य क्षमता प्राकृतिक भाषामा लेखिएको पाठ्य इनपुटबाट सुरु गरेर पाठ उत्पन्न गर्ने हो।
तर कस्तो प्रकारको पाठ्य इनपुट र आउटपुट? ठूला भाषा मोडेलको इनपुटलाई संकेतको रूपमा चिनिन्छ, जबकि आउटपुटलाई पूरा भन्नुहुन्छ, जुन मोडेलले वर्तमान इनपुट पूरा गर्न अर्को टोकन उत्पन्न गर्ने तंत्रलाई जनाउँछ। हामी संकेत के हो र हाम्रो मोडेलबाट अधिकतम लाभ कसरी लिन डिजाइन गर्ने कुरा गहिराइमा जाँदैछौं। तर अहिलेको लागि, एक संकेतले समावेश गर्न सक्छ:
-
मोडेलबाट अपेक्षित आउटपुटको प्रकार निर्दिष्ट गर्ने निर्देशन। यस निर्देशनले कहिलेकाहीं केही उदाहरणहरू वा केही थप डेटा समावेश गर्न सक्छ।
-
लेख, पुस्तक, उत्पादन समीक्षाहरू र थपको संक्षेपण, साथै असंरचित डाटाबाट अन्तर्दृष्टिहरूको निष्कर्षण।
-
लेख, निबन्ध, असाइनमेन्ट वा थपको सिर्जनात्मक विचार र डिजाइन।
-
-
एजेन्टसँगको कुराकानीको रूपमा सोधिएको प्रश्न।
-
पूरा गर्नको लागि पाठको टुक्रा, जुन अप्रत्यक्ष रूपमा लेखन सहयोगको लागि अनुरोध हो।
-
विशिष्ट कार्य प्रदर्शन गर्ने कोडको टुक्रा उत्पन्न गर्न सोधिएको कोडको टुक्रा वा टिप्पणी।
माथिका उदाहरणहरू निकै साधारण छन् र ठूला भाषा मोडेलहरूको क्षमताहरूको व्यापक प्रदर्शनको उद्देश्य राखिएको छैन। तिनीहरू विशेष गरी तर सीमित नभई शैक्षिक सन्दर्भहरूमा जनरेटिव एआईको प्रयोगको सम्भावना देखाउनका लागि उद्देश्य राखिएका हुन्।
यसबाहेक, जनरेटिव एआई मोडेलको आउटपुट पूर्ण हुँदैन र कहिलेकाहीं मोडेलको सिर्जनात्मकता यसको विरुद्धमा काम गर्न सक्छ, जसको परिणामस्वरूप मानव प्रयोगकर्ताले वास्तविकताको विकृतिका रूपमा व्याख्या गर्न सक्ने शब्दहरूको संयोजनको रूपमा आउन सक्छ, वा यो अपमानजनक हुन सक्छ। जनरेटिव एआई बुद्धिमान छैन - कम्तिमा बुद्धिमत्ताको व्यापक परिभाषामा, जसमा आलोचनात्मक र सिर्जनात्मक तर्क वा भावनात्मक बुद्धिमत्ता समावेश छ; यो निर्धारणात्मक छैन, र यो विश्वसनीय छैन, किनकि गलत सन्दर्भहरू, सामग्री, र वक्तव्यहरू सही जानकारीसँग संयोजन गरिएका हुन सक्छन्, र विश्वासयोग्य र आत्मविश्वासपूर्ण तरिकामा प्रस्तुत गरिएका हुन सक्छन्। आगामी पाठहरूमा, हामी यी सबै सीमाहरूको सामना गर्नेछौं र तिनीहरूलाई कम गर्न हामी के गर्न सक्छौं भन्ने कुरा देख्नेछौं।
तपाईंको असाइनमेन्ट जनरेटिव एआई को बारेमा थप पढ्नुहोस् र आजको दिनमा जनरेटिव एआई थप्न सकिने कुनै क्षेत्र पहिचान गर्ने प्रयास गर्नुहोस् जुन यससँग छैन। यसलाई 'पुरानो तरिकामा' गर्नेभन्दा प्रभाव कसरी फरक हुनेछ, के तपाईंले पहिले गर्न नसकेको केही गर्न सक्नुहुन्छ, वा के तपाईं छिटो हुनुहुन्छ? तपाईंको सपना एआई स्टार्टअप कस्तो देखिन्छ भन्ने बारेमा ३०० शब्दको सारांश लेख्नुहोस् र यसमा "समस्या", "म एआई कसरी प्रयोग गर्ने थिएँ", "प्रभाव" र वैकल्पिक रूपमा व्यापार योजना जस्ता शीर्षकहरू समावेश गर्नुहोस्।
यदि तपाईंले यो कार्य गर्नुभयो भने, तपाईं Microsoft को इनक्युबेटरमा आवेदन दिन तयार हुन सक्नुहुन्छ, Microsoft for Startups Founders Hub हामी Azure, OpenAI, परामर्श र धेरै कुराको लागि क्रेडिटहरू प्रस्ताव गर्दछौं, जाँच गर्नुहोस्!
ठूला भाषा मोडेलहरूको बारेमा के सत्य हो?
- तपाईंलाई हरेक पटक उस्तै प्रतिक्रिया प्राप्त हुन्छ।
- यसले सबै कुरा पूर्ण रूपमा गर्छ, संख्याहरू थप्न, काम गर्ने कोड उत्पादन गर्न आदि मा उत्कृष्ट छ।
- प्रतिक्रिया उस्तै संकेत प्रयोग गर्दा पनि फरक हुन सक्छ। यो तपाईंलाई केहीको पहिलो मसौदा दिनेमा पनि उत्कृष्ट छ, चाहे त्यो पाठ होस् वा कोड। तर तपाईंले नतिजाहरू सुधार गर्नु आवश्यक छ।
A: 3, एक LLM गैर-निर्धारणात्मक हो, प्रतिक्रिया फरक हुन्छ, यद्यपि, तपाईं यसको भिन्नतालाई तापमान सेटिङ मार्फत नियन्त्रण गर्न सक्नुहुन्छ। तपाईंले यसलाई पूर्ण रूपमा काम गर्ने अपेक्षा गर्नु हुँदैन, यो तपाईंको लागि भारी काम गर्ने यहाँ छ जसको अर्थ तपाईंले केहि गर्ने राम्रो पहिलो प्रयास प्राप्त गर्नुहुन्छ जसलाई तपाईंले क्रमशः सुधार गर्नु आवश्यक छ।
यो पाठ पूरा गरेपछि, हाम्रो जनरेटिव एआई लर्निङ संग्रह हेर्नुहोस् ताकि तपाईं आफ्नो जनरेटिव एआई ज्ञानलाई अझ अगाडि बढाउन सक्नुहुनेछ!
पाठ २ मा जानुहोस् जहाँ हामी विभिन्न LLM प्रकारहरूको अन्वेषण र तुलना गर्ने कुरा हेर्नेछौं!
अस्वीकरण:
यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator को प्रयोग गरी अनुवाद गरिएको हो। हामी शुद्धताका लागि प्रयासरत छौं, तर कृपया जानकार रहनुहोस् कि स्वचालित अनुवादमा त्रुटिहरू वा अशुद्धताहरू हुन सक्छन्। यसको मूल भाषामा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोतको रूपमा मान्नुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न कुनै पनि गलतफहमी वा गलत व्याख्याका लागि हामी जिम्मेवार हुने छैनौं।