(Bonyeza picha hapo juu kutazama video ya somo hili)
AI Inayozalisha ni akili ya bandia inayoweza kuzalisha maandishi, picha na aina nyingine za maudhui. Kinachofanya teknolojia hii kuwa ya kuvutia ni kwamba inapatikana kwa kila mtu, yeyote anaweza kuitumia kwa kidokezo cha maandishi tu, sentensi iliyoandikwa kwa lugha ya asili. Huna haja ya kujifunza lugha kama Java au SQL ili kufanikisha kitu cha thamani, unachohitaji ni kutumia lugha yako, sema unachotaka na unapata pendekezo kutoka kwa mfano wa AI. Matumizi na athari za hili ni kubwa, unaweza kuandika au kuelewa ripoti, kuandika programu na mengine mengi, yote kwa sekunde.
Katika mtaala huu, tutachunguza jinsi kampuni yetu ya kuanzisha inavyotumia AI inayozalisha kufungua matukio mapya katika ulimwengu wa elimu na jinsi tunavyoshughulikia changamoto zisizoweza kuepukika zinazohusiana na athari za kijamii za matumizi yake na vikwazo vya teknolojia.
Somo hili litashughulikia:
- Utangulizi wa hali ya biashara: wazo letu la kuanzisha na dhamira.
- AI Inayozalisha na jinsi tulivyofikia mandhari ya teknolojia ya sasa.
- Utendaji wa ndani wa muundo mkubwa wa lugha.
- Uwezo kuu na matumizi ya vitendo ya Miundo Mikubwa ya Lugha.
Baada ya kukamilisha somo hili, utaelewa:
- AI inayozalisha ni nini na jinsi Miundo Mikubwa ya Lugha inavyofanya kazi.
- Jinsi unavyoweza kutumia miundo mikubwa ya lugha kwa matumizi tofauti, kwa kuzingatia matukio ya elimu.
Akili ya bandia inayozalisha (AI) inawakilisha kilele cha teknolojia ya AI, ikivuka mipaka ya kile kilichokuwa kikiwekwa haiwezekani. Miundo ya AI inayozalisha ina uwezo na matumizi kadhaa, lakini kwa mtaala huu tutachunguza jinsi inavyobadilisha elimu kupitia kampuni ya kubuni. Tutarejelea kampuni hii kama kampuni yetu. Kampuni yetu inafanya kazi katika uwanja wa elimu na kauli ya dhamira yenye nia ya
kuboresha upatikanaji katika kujifunza, kwa kiwango cha kimataifa, kuhakikisha upatikanaji sawa wa elimu na kutoa uzoefu wa kujifunza uliozalishwa kwa kila mwanafunzi, kulingana na mahitaji yao.
Timu yetu ya kampuni inajua hatutaweza kufikia lengo hili bila kutumia mojawapo ya zana zenye nguvu zaidi za nyakati za kisasa – Miundo Mikubwa ya Lugha (LLMs).
AI inayozalisha inatarajiwa kubadilisha jinsi tunavyosoma na kufundisha leo, na wanafunzi kuwa na walimu wa kawaida 24/7 wanaotoa kiasi kikubwa cha habari na mifano, na walimu wakiwa na uwezo wa kutumia zana za ubunifu kutathmini wanafunzi wao na kutoa maoni.
Ili kuanza, hebu tufafanue baadhi ya dhana za msingi na istilahi tutakazotumia katika mtaala.
Licha ya hype ya ajabu iliyoundwa hivi karibuni na tangazo la miundo ya AI inayozalisha, teknolojia hii imekuwa ikitengenezwa kwa miongo kadhaa, na juhudi za kwanza za utafiti zikirudi miaka ya 60. Sasa tuko katika hatua ambapo AI ina uwezo wa utambuzi wa kibinadamu, kama mazungumzo yanavyoonyeshwa kwa mfano na OpenAI ChatGPT au Bing Chat, ambayo pia hutumia mfano wa GPT kwa mazungumzo ya utafutaji wa wavuti Bing.
Tukirudi nyuma kidogo, prototypes za kwanza za AI zilikuwa na chatbots za maandishi, zikitegemea msingi wa maarifa uliotolewa kutoka kwa kikundi cha wataalamu na kuwakilishwa kwenye kompyuta. Majibu katika msingi wa maarifa yalichochewa na maneno muhimu yanayoonekana katika maandishi ya pembejeo. Hata hivyo, ilionekana wazi kwamba njia kama hiyo, kwa kutumia chatbots za maandishi, haikupimika vizuri.
Mabadiliko makubwa yalifika katika miaka ya 90, na matumizi ya njia ya takwimu kwa uchambuzi wa maandishi. Hii ilisababisha maendeleo ya algorithms mpya – inayojulikana kama kujifunza kwa mashine – yenye uwezo wa kujifunza mifumo kutoka kwa data bila kuandaliwa waziwazi. Njia hii inaruhusu mashine kuiga uelewa wa lugha ya kibinadamu: mfano wa takwimu unafundishwa juu ya maandishi na lebo za pairing, kuwezesha mfano kuainisha maandishi ya pembejeo yasiyojulikana na lebo iliyowekwa tayari inayowakilisha nia ya ujumbe.
Katika miaka ya hivi karibuni, maendeleo ya kiteknolojia ya vifaa, vyenye uwezo wa kushughulikia kiasi kikubwa cha data na hesabu ngumu zaidi, yalihimiza utafiti katika AI, ikiongoza maendeleo ya algorithms za kujifunza kwa mashine zinazoitwa mitandao ya neural au algorithms za kujifunza kwa kina.
Mitandao ya neural (na hasa Mitandao ya Neural Inayorudiwa – RNNs) iliboresha sana usindikaji wa lugha asilia, ikiwezesha uwakilishi wa maana ya maandishi kwa njia ya maana zaidi, ikithamini muktadha wa neno katika sentensi.
Hii ndiyo teknolojia iliyowezesha wasaidizi wa virtual waliozaliwa katika muongo wa kwanza wa karne mpya, wenye ustadi mkubwa katika kutafsiri lugha ya kibinadamu, kutambua hitaji, na kufanya kitendo cha kukidhi – kama kujibu kwa script iliyowekwa tayari au kutumia huduma ya 3rd party.
Hivyo ndivyo tulivyofika kwenye AI Inayozalisha leo, ambayo inaweza kuonekana kama subset ya kujifunza kwa kina.
Baada ya miongo ya utafiti katika uwanja wa AI, usanifu mpya wa mfano – unaoitwa Transformer – ulivuka mipaka ya RNNs, ukiwa na uwezo wa kupata mlolongo mrefu wa maandishi kama pembejeo. Transformers zinategemea utaratibu wa umakini, kuwezesha mfano kutoa uzito tofauti kwa pembejeo inazopokea, ‘kutilia maanani zaidi’ ambapo habari muhimu zaidi imejikita, bila kujali mpangilio wake katika mlolongo wa maandishi.
Miundo mingi ya AI inayozalisha ya hivi karibuni – inayojulikana pia kama Miundo Mikubwa ya Lugha (LLMs), kwani inafanya kazi na pembejeo na matokeo ya maandishi – kwa kweli inategemea usanifu huu. Kinachovutia kuhusu miundo hii – iliyofundishwa juu ya kiasi kikubwa cha data isiyo na lebo kutoka vyanzo mbalimbali kama vitabu, makala na tovuti – ni kwamba inaweza kubadilishwa kwa kazi mbalimbali na kuzalisha maandishi sahihi ya kisarufi na mfanano wa ubunifu. Hivyo, sio tu kwamba iliboresha sana uwezo wa mashine ‘kuelewa’ maandishi ya pembejeo, lakini iliwezesha uwezo wake wa kuzalisha jibu la asili katika lugha ya kibinadamu.
Katika sura inayofuata tutachunguza aina tofauti za miundo ya AI inayozalisha, lakini kwa sasa hebu tuangalie jinsi miundo mikubwa ya lugha inavyofanya kazi, kwa kuzingatia miundo ya OpenAI GPT (Transformer iliyofunzwa kabla ya kuzalisha).
-
Kibandiko, maandishi hadi nambari: Miundo Mikubwa ya Lugha inapokea maandishi kama pembejeo na kuzalisha maandishi kama matokeo. Hata hivyo, ikiwa ni miundo ya takwimu, inafanya kazi vizuri zaidi na nambari kuliko mlolongo wa maandishi. Ndiyo maana kila pembejeo kwa mfano inachakatwa na kibandiko, kabla ya kutumiwa na mfano wa msingi. Kibandiko ni kipande cha maandishi – kinachojumuisha idadi tofauti ya herufi, hivyo kazi kuu ya kibandiko ni kugawanya pembejeo kuwa safu ya vibandiko. Kisha, kila kibandiko kinafananishwa na kiashiria cha kibandiko, ambacho ni encoding ya integer ya kipande cha maandishi cha asili.
-
Kutabiri vibandiko vya matokeo: Ukipewa vibandiko n kama pembejeo (na n max inayotofautiana kutoka kwa mfano mmoja hadi mwingine), mfano una uwezo wa kutabiri kibandiko kimoja kama matokeo. Kibandiko hiki kisha kinajumuishwa katika pembejeo ya marudio ya pili, katika muundo wa dirisha linalopanuka, kuwezesha uzoefu bora wa mtumiaji wa kupata sentensi moja (au kadhaa) kama jibu. Hii inaelezea kwa nini, ikiwa umewahi kucheza na ChatGPT, unaweza kuwa umenotice kwamba wakati mwingine inaonekana kama inasimama katikati ya sentensi.
-
Mchakato wa uteuzi, usambazaji wa uwezekano: Kibandiko cha matokeo kinachaguliwa na mfano kulingana na uwezekano wake wa kutokea baada ya mlolongo wa maandishi ya sasa. Hii ni kwa sababu mfano unatoa utabiri wa usambazaji wa uwezekano juu ya ‘vibandiko vya pili’ vinavyowezekana, vilivyohesabiwa kulingana na mafunzo yake. Hata hivyo, si mara zote kibandiko chenye uwezekano wa juu zaidi kinachaguliwa kutoka kwa usambazaji unaotokana. Kiwango cha kutokadirika kinaongezwa kwenye chaguo hili, kwa njia ambayo mfano unafanya kazi kwa mtindo usio wa kimaamuzi - hatupati matokeo sawa kabisa kwa pembejeo sawa. Kiwango hiki cha kutokadirika kinaongezwa ili kuiga mchakato wa kufikiria kwa ubunifu na kinaweza kubadilishwa kwa kutumia parameta ya mfano inayoitwa joto.
Sasa tunayoelewa vizuri utendaji wa ndani wa mfano mkubwa wa lugha, hebu tuone mifano ya vitendo ya kazi za kawaida ambazo zinaweza kufanya vizuri sana, kwa kuzingatia hali yetu ya biashara. Tulisema kwamba uwezo mkuu wa Mfano Mkubwa wa Lugha ni kuzalisha maandishi kutoka mwanzo, kuanzia na pembejeo ya maandishi, iliyoandikwa kwa lugha ya asili.
Lakini ni aina gani ya pembejeo na matokeo ya maandishi? Pembejeo ya mfano mkubwa wa lugha inajulikana kama kidokezo, wakati matokeo yanajulikana kama kukamilika, neno ambalo linarejelea utaratibu wa mfano wa kuzalisha kibandiko cha pili kukamilisha pembejeo ya sasa. Tutaingia ndani zaidi juu ya nini ni kidokezo na jinsi ya kukibuni kwa njia ya kupata zaidi kutoka kwa mfano wetu. Lakini kwa sasa, hebu tuseme tu kwamba kidokezo kinaweza kujumuisha:
-
Maelekezo yanayobainisha aina ya matokeo tunayotegemea kutoka kwa mfano. Maelekezo haya wakati mwingine yanaweza kujumuisha mifano au data ya ziada.
-
Muhtasari wa makala, kitabu, maoni ya bidhaa na zaidi, pamoja na uchimbaji wa maarifa kutoka kwa data isiyo na muundo.
-
Ubunifu wa ubunifu na muundo wa makala, insha, kazi au zaidi.
-
-
Swali, lililoulizwa kwa namna ya mazungumzo na wakala.
-
Kipande cha maandishi ya kukamilisha, ambacho kimya kimya ni ombi la msaada wa kuandika.
-
Kipande cha kodi pamoja na ombi la kuelezea na kuandika, au maoni yanayoomba kuzalisha kipande cha kodi kinachofanya kazi maalum.
Mifano hapo juu ni rahisi na haikusudiwi kuwa maonyesho ya kina ya uwezo wa Miundo Mikubwa ya Lugha. Zinalenga kuonyesha uwezo wa kutumia AI inayozalisha, hasa lakini sio tu katika muktadha wa elimu.
Pia, matokeo ya mfano wa AI inayozalisha si kamilifu na wakati mwingine ubunifu wa mfano unaweza kufanya kazi dhidi yake, na kusababisha matokeo ambayo ni mchanganyiko wa maneno ambayo mtumiaji wa kibinadamu anaweza kufasiri kama upotoshaji wa ukweli, au inaweza kuwa ya kukera. AI inayozalisha si akili - angalau katika ufafanuzi wa kina zaidi wa akili, ikiwa ni pamoja na uamuzi wa ubunifu na wa kukosoa au akili ya kihisia; si ya kimaamuzi, na si ya kuaminika, kwani uundaji, kama marejeleo ya kimakosa, maudhui, na taarifa, inaweza kuunganishwa na habari sahihi, na kuwasilishwa kwa njia ya ushawishi na ya kujiamini. Katika masomo yanayofuata, tutashughulikia vikwazo vyote hivi na tutaona nini tunaweza kufanya ili kuvipunguza.
Kazi yako ni kusoma zaidi kuhusu AI inayozalisha na kujaribu kutambua eneo ambalo ungeongeza AI inayozalisha leo ambalo halina. Je, athari itakuwa tofauti kutoka kufanya kwa njia "ya zamani", unaweza kufanya kitu ambacho hukuweza kufanya awali, au ni haraka zaidi? Andika muhtasari wa maneno 300 juu ya jinsi kampuni yako ya AI ya ndoto ingekuwa na vichwa kama "Tatizo", "Jinsi ningetumia AI", "Athari" na kwa hiari mpango wa biashara.
Ikiwa ulifanya kazi hii, unaweza hata kuwa tayari kuomba kwa incubator ya Microsoft, Microsoft kwa Startups Founders Hub tunatoa mikopo kwa Azure, OpenAI, ushauri na mengi zaidi, angalia!
Ni nini sahihi kuhusu miundo mikubwa ya lugha?
- Unapata jibu sawa kila wakati.
- Inafanya mambo kwa ukamilifu, nzuri katika kuongeza nambari, kuzalisha kodi inayofanya kazi nk.
- Jibu linaweza kutofautiana licha ya kutumia kidokezo sawa. Pia ni nzuri katika kukupa rasimu ya kwanza ya kitu, iwe maandishi au kodi. Lakini unahitaji kuboresha matokeo.
A: 3, LLM si ya kimaamuzi, jibu linatofautiana, hata hivyo, unaweza kudhibiti utofauti wake kupitia mpangilio wa joto. Pia haipaswi kutarajia kufanya mambo kwa ukamilifu, iko hapa kufanya kazi nzito kwako ambayo mara nyingi inamaanisha unapata jaribio la kwanza nzuri la kitu ambacho unahitaji kuboresha hatua kwa hatua.
Baada ya kukamilisha somo hili, angalia mkusanyiko wetu wa Kujifunza AI Inayozalisha ili kuendelea kuboresha maarifa yako ya AI Inayozalisha!
Nenda kwenye Somo la 2 ambapo tutatazama jinsi ya kuchunguza na kulinganisha aina tofauti za LLM!
Kanusho:
Hati hii imetafsiriwa kwa kutumia huduma ya tafsiri ya AI Co-op Translator. Tunajitahidi kwa usahihi, tafadhali fahamu kuwa tafsiri za kiotomatiki zinaweza kuwa na makosa au kutokuwa sahihi. Hati asili katika lugha yake ya asili inapaswa kuzingatiwa kuwa chanzo chenye mamlaka. Kwa habari muhimu, tafsiri ya kitaalamu ya kibinadamu inapendekezwa. Hatutawajibika kwa kutoelewana au tafsiri zisizo sahihi zinazotokana na matumizi ya tafsiri hii.