အထက်ပါပုံကိုနှိပ်ပြီး ဒီသင်ခန်းစာရဲ့ ဗီဒီယိုကို ကြည့်ပါ
ယခင်သင်ခန်းစာတွင် Generative AI သည် နည်းပညာလောကကို ဘယ်လိုပြောင်းလဲနေသည်၊ Large Language Models (LLMs) များသည် ဘယ်လိုအလုပ်လုပ်သည်၊ နှင့် ကျွန်ုပ်တို့၏ စတင်လုပ်ငန်းကဲ့သို့သော လုပ်ငန်းတစ်ခုသည် ၎င်းတို့ကို မည်သို့အသုံးချနိုင်ပြီး တိုးတက်မှုရရှိနိုင်သည်ကို ကြည့်ရှုခဲ့ပါသည်။ ဒီအခန်းမှာတော့ LLMs အမျိုးအစားများကို နှိုင်းယှဉ်ပြီး ၎င်းတို့၏ အားသာချက်များနှင့် အားနည်းချက်များကို နားလည်ရန် ကြည့်ရှုမည်ဖြစ်သည်။
ကျွန်ုပ်တို့၏ စတင်လုပ်ငန်း၏ နောက်ထပ်အဆင့်မှာ LLMs များ၏ လက်ရှိအခြေအနေကို လေ့လာပြီး ကျွန်ုပ်တို့၏ အသုံးချမှုအတွက် သင့်လျော်သော LLM ကို နားလည်ခြင်းဖြစ်သည်။
ဒီသင်ခန်းစာမှာ အောက်ပါအကြောင်းအရာများကို လေ့လာမည်ဖြစ်သည်-
- လက်ရှိ LLMs အမျိုးအစားများ
- Azure တွင် သင့်အသုံးချမှုအတွက် မော်ဒယ်များကို စမ်းသပ်ခြင်း၊ ပြန်လည်တည်းဖြတ်ခြင်းနှင့် နှိုင်းယှဉ်ခြင်း
- LLM ကို မည်သို့ deploy လုပ်မည်
ဒီသင်ခန်းစာကို ပြီးမြောက်ပြီးနောက်တွင်-
- သင့်အသုံးချမှုအတွက် သင့်တော်သော မော်ဒယ်ကို ရွေးချယ်နိုင်မည်။
- မော်ဒယ်၏ စွမ်းဆောင်ရည်ကို စမ်းသပ်ခြင်း၊ ပြန်လည်တည်းဖြတ်ခြင်းနှင့် တိုးတက်အောင်လုပ်ခြင်းကို နားလည်နိုင်မည်။
- လုပ်ငန်းများသည် မော်ဒယ်များကို deploy လုပ်ပုံကို သိရှိနိုင်မည်။
LLMs များကို ၎င်းတို့၏ အဆောက်အအုံ၊ လေ့ကျင့်သည့် ဒေတာနှင့် အသုံးချမှုအပေါ် မူတည်၍ အမျိုးအစားများစွာဖြင့် ခွဲခြားနိုင်သည်။ ဒီကွာခြားချက်များကို နားလည်ခြင်းသည် ကျွန်ုပ်တို့၏ စတင်လုပ်ငန်းအတွက် သင့်တော်သော မော်ဒယ်ကို ရွေးချယ်ရန်အတွက် အထောက်အကူဖြစ်စေပြီး စွမ်းဆောင်ရည်ကို စမ်းသပ်ခြင်း၊ ပြန်လည်တည်းဖြတ်ခြင်းနှင့် တိုးတက်အောင်လုပ်ခြင်းကို နားလည်စေပါမည်။
LLM မော်ဒယ်အမျိုးအစားများစွာရှိပြီး သင့်ရည်မှန်းချက်၊ သင့်ဒေတာ၊ သင့်ရဲ့ကုန်ကျစရိတ်နှင့် အခြားအရာများပေါ်မူတည်ပြီး မော်ဒယ်ကို ရွေးချယ်ရမည်ဖြစ်သည်။
မော်ဒယ်များကို စာသား၊ အသံ၊ ဗီဒီယို၊ ပုံထုတ်လုပ်ခြင်းစသည်ဖြင့် အသုံးပြုရန် ရည်ရွယ်ပါက မော်ဒယ်အမျိုးအစားကွဲပြားမှုရှိနိုင်သည်။
-
အသံနှင့် စကားပြောကို မှတ်မိခြင်း။ ဒီရည်ရွယ်ချက်အတွက် Whisper အမျိုးအစား မော်ဒယ်များသည် စကားပြောမှတ်မိမှုအတွက် အထူးသင့်လျော်သော ရွေးချယ်မှုကောင်းတစ်ခုဖြစ်သည်။ ၎င်းသည် အသံအမျိုးမျိုးကို လေ့ကျင့်ထားပြီး ဘာသာစကားများစွာကို မှတ်မိနိုင်သည်။ Whisper အမျိုးအစား မော်ဒယ်များအကြောင်းကို ဒီမှာပိုမိုလေ့လာပါ။
-
ပုံထုတ်လုပ်ခြင်း။ ပုံထုတ်လုပ်မှုအတွက် DALL-E နှင့် Midjourney သည် နာမည်ကြီးသော ရွေးချယ်မှုနှစ်ခုဖြစ်သည်။ DALL-E ကို Azure OpenAI မှ ပေးထားသည်။ DALL-E အကြောင်းကို ဒီမှာပိုမိုဖတ်ရှုပါ နှင့် ဒီသင်ခန်းစာ၏ အခန်း ၉ တွင်လည်း ဖတ်ရှုနိုင်ပါသည်။
-
စာသားထုတ်လုပ်ခြင်း။ မော်ဒယ်များအများစုသည် စာသားထုတ်လုပ်မှုအတွက် လေ့ကျင့်ထားပြီး GPT-3.5 မှ GPT-4 အထိ ရွေးချယ်မှုများစွာရှိသည်။ ၎င်းတို့သည် ကုန်ကျစရိတ်များကွာခြားပြီး GPT-4 သည် အများဆုံးကုန်ကျစရိတ်ရှိသည်။ Azure OpenAI playground ကို သင့်ရဲ့ လိုအပ်ချက်နှင့် ကုန်ကျစရိတ်အပေါ် မော်ဒယ်များကို အကဲဖြတ်ရန် ကြည့်ရှုရန် တန်ဖိုးရှိသည်။
-
Multi-modality။ သင်သည် input နှင့် output အတွက် ဒေတာအမျိုးအစားများစွာကို ကိုင်တွယ်ရန် ရည်ရွယ်ပါက gpt-4 turbo with vision or gpt-4o ကဲ့သို့သော မော်ဒယ်များကို လေ့လာရန်လိုအပ်နိုင်သည်။ ၎င်းသည် OpenAI မော်ဒယ်များ၏ နောက်ဆုံးထုတ်ကုန်များဖြစ်ပြီး သဘာဝဘာသာစကားကို အမြင်နားလည်မှုနှင့် ပေါင်းစပ်နိုင်ပြီး multi-modal interface များမှတဆင့် အပြန်အလှန်ဆက်သွယ်မှုများကို အကောင်းဆုံးလုပ်ဆောင်နိုင်သည်။
မော်ဒယ်ကို ရွေးချယ်ခြင်းသည် အခြေခံစွမ်းရည်များကို ရရှိစေသော်လည်း ၎င်းသည် အလုံအလောက်မဖြစ်နိုင်ပါ။ အများအားဖြင့် သင့်လုပ်ငန်းအတွက် အထူးသတ်မှတ်ထားသော ဒေတာများကို LLM ကို မည်သို့ အသိပေးရမည်ဆိုသည်ကို နားလည်ရန်လိုအပ်သည်။ ၎င်းကို လုပ်ဆောင်ရန် နည်းလမ်းအမျိုးမျိုးရှိပြီး နောက်ပိုင်းအပိုင်းများတွင် ပိုမိုလေ့လာနိုင်ပါမည်။
Foundation Model ဆိုသော စကားလုံးကို Stanford သုတေသနသူများ မှ တီထွင်ခဲ့ပြီး အောက်ပါအချက်များအတိုင်း အဓိကထားသော AI မော်ဒယ်အဖြစ် သတ်မှတ်ခဲ့သည်-
- Unsupervised learning သို့မဟုတ် self-supervised learning ကို အသုံးပြု၍ လေ့ကျင့်ထားသည်။ ၎င်းသည် unlabeled multi-modal data ကို အသုံးပြု၍ လေ့ကျင့်ထားပြီး လူသားများ၏ annotation သို့မဟုတ် data ကို label လုပ်ခြင်းမလိုအပ်ပါ။
- မော်ဒယ်များသည် အလွန်ကြီးမားသည်။ အလွန်နက်ရှိုင်းသော neural networks များကို လေ့ကျင့်ထားပြီး parameters ဘီလီယံများပါဝင်သည်။
- အခြေခံအဆောက်အအုံအဖြစ် အခြားမော်ဒယ်များအတွက် အသုံးပြုရန် ရည်ရွယ်ထားသည်။ ၎င်းသည် အခြားမော်ဒယ်များကို အပေါ်တွင် တည်ဆောက်ရန် အခြေခံအဆောက်အအုံအဖြစ် အသုံးပြုနိုင်သည်။
ပုံရင်းအရင်းအမြစ်: Essential Guide to Foundation Models and Large Language Models | by Babar M Bhatti | Medium
ဒီကွာခြားချက်ကို ပိုမိုရှင်းလင်းစေရန် ChatGPT ကို ဥပမာအနေနှင့် ယူဆောင်ပါမည်။ ChatGPT ၏ ပထမဆုံးဗားရှင်းကို တည်ဆောက်ရန် GPT-3.5 မော်ဒယ်ကို Foundation Model အဖြစ် အသုံးပြုခဲ့သည်။ ၎င်းသည် OpenAI သည် chat-specific data အချို့ကို အသုံးပြု၍ GPT-3.5 ကို ပြုပြင်ထားပြီး chatbot ကဲ့သို့သော စကားပြောအခြေအနေများတွင် စွမ်းဆောင်ရည်ကောင်းစေရန် အထူးပြုလုပ်ထားသည်။
ပုံရင်းအရင်းအမြစ်: 2108.07258.pdf (arxiv.org)
LLMs များကို open source သို့မဟုတ် proprietary အဖြစ် ခွဲခြားနိုင်သည်။
Open-source မော်ဒယ်များသည် အများပြည်သူအတွက် ရရှိနိုင်ပြီး မည်သူမဆို အသုံးပြုနိုင်သော မော်ဒယ်များဖြစ်သည်။ ၎င်းတို့ကို ဖန်တီးသူကုမ္ပဏီ သို့မဟုတ် သုတေသနအသိုင်းအဝိုင်းမှ ရရှိနိုင်သည်။ မော်ဒယ်များကို စစ်ဆေးခြင်း၊ ပြုပြင်ခြင်းနှင့် LLMs ၏ အသုံးချမှုအမျိုးမျိုးအတွက် စိတ်ကြိုက်ပြုလုပ်ခြင်းများကို ခွင့်ပြုသည်။ သို့သော် ၎င်းတို့သည် အမြဲတမ်းအသုံးပြုရန် အကောင်းဆုံးမဖြစ်နိုင်ဘဲ proprietary မော်ဒယ်များကဲ့သို့ စွမ်းဆောင်ရည်မရှိနိုင်ပါ။ ထို့အပြင် open-source မော်ဒယ်များအတွက် ရန်ပုံငွေကနည်းပါးနိုင်ပြီး ရေရှည်ထိန်းသိမ်းမှုမရှိနိုင်သည့်အပြင် နောက်ဆုံးသုတေသနများနှင့် update မလုပ်နိုင်ပါ။ နာမည်ကြီး open-source မော်ဒယ်များတွင် Alpaca, Bloom နှင့် LLaMA ပါဝင်သည်။
Proprietary မော်ဒယ်များသည် ကုမ္ပဏီတစ်ခုမှ ပိုင်ဆိုင်ထားပြီး အများပြည်သူအတွက် မရရှိနိုင်သော မော်ဒယ်များဖြစ်သည်။ ၎င်းတို့သည် အမြဲတမ်းအသုံးပြုရန်အတွက် အကောင်းဆုံးဖြစ်ရန် optimize လုပ်ထားသည်။ သို့သော် ၎င်းတို့ကို စစ်ဆေးခြင်း၊ ပြုပြင်ခြင်း သို့မဟုတ် အသုံးချမှုအမျိုးမျိုးအတွက် စိတ်ကြိုက်ပြုလုပ်ခြင်းကို ခွင့်မပြုပါ။ ထို့အပြင် ၎င်းတို့သည် အခမဲ့ရရှိနိုင်ခြင်းမရှိဘဲ subscription သို့မဟုတ် အသုံးပြုခပေးရန် လိုအပ်နိုင်သည်။ ထို့အပြင် မော်ဒယ်ကို လေ့ကျင့်ရန် အသုံးပြုသော ဒေတာကို ထိန်းချုပ်နိုင်ခြင်းမရှိဘဲ AI ကို တာဝန်ယူမှုနှင့် ဒေတာကိုယ်ရေးကိုယ်တာအချက်အလက်များကို ကာကွယ်ရန် model owner ကို ယုံကြည်ရမည်။ နာမည်ကြီး proprietary မော်ဒယ်များတွင် OpenAI models, Google Bard သို့မဟုတ် Claude 2 ပါဝင်သည်။
LLMs များကို ၎င်းတို့ထုတ်လုပ်သော output အပေါ်မူတည်၍ ခွဲခြားနိုင်သည်။
Embeddings သည် စာသားကို ဂဏန်းပုံစံ (embedding ဟုခေါ်သည်) သို့ ပြောင်းလဲနိုင်သော မော်ဒယ်များဖြစ်သည်။ Embeddings သည် စကားလုံးများ သို့မဟုတ် စာကြောင်းများအကြား ဆက်နွယ်မှုများကို စက်များနားလည်ရန် ပိုမိုလွယ်ကူစေပြီး classification မော်ဒယ်များ သို့မဟုတ် clustering မော်ဒယ်များကဲ့သို့သော အခြားမော်ဒယ်များမှ input အဖြစ် အသုံးပြုနိုင်သည်။ Embedding မော်ဒယ်များကို transfer learning အတွက် အများအားဖြင့် အသုံးပြုသည်။ ဥပမာအားဖြင့် OpenAI embeddings ကို ဖော်ပြနိုင်သည်။
Image generation မော်ဒယ်များသည် ပုံများကို ထုတ်လုပ်သော မော်ဒယ်များဖြစ်သည်။ ၎င်းတို့ကို ပုံတည်းဖြတ်ခြင်း၊ ပုံစီမံခြင်းနှင့် ပုံပြောင်းလဲခြင်းအတွက် အသုံးပြုနိုင်သည်။ Image generation မော်ဒယ်များသည် LAION-5B ကဲ့သို့သော ပုံများ၏ ဒေတာများစွာကို လေ့ကျင့်ထားပြီး ပုံအသစ်များကို ထုတ်လုပ်ရန် သို့မဟုတ် ရှိပြီးသားပုံများကို တည်းဖြတ်ရန် အသုံးပြုနိုင်သည်။ ဥပမာများမှာ DALL-E-3 နှင့် Stable Diffusion models ဖြစ်သည်။
Text နှင့် code generation မော်ဒယ်များသည် စာသား သို့မဟုတ် code ကို ထုတ်လုပ်သော မော်ဒယ်များဖြစ်သည်။ ၎င်းတို့ကို စာသားအကျဉ်းချုပ်ရေးခြင်း၊ ဘာသာပြန်ခြင်းနှင့် မေးခွန်းများကို ဖြေဆိုခြင်းအတွက် အသုံးပြုနိုင်သည်။ Text generation မော်ဒယ်များသည် BookCorpus ကဲ့သို့သော စာသားဒေတာများစွာကို လေ့ကျင့်ထားပြီး စာသားအသစ်များကို ထုတ်လုပ်ရန် သို့မဟုတ် မေးခွန်းများကို ဖြေဆိုရန် အသုံးပြုနိုင်သည်။ Code generation မော်ဒယ်များကဲ့သို့ CodeParrot သည် GitHub ကဲ့သို့သော code ဒေတာများစွာကို လေ့ကျင့်ထားပြီး code အသစ်များကို ထုတ်လုပ်ရန် သို့မဟုတ် ရှိပြီးသား code တွင် bug များကို ပြုပြင်ရန် အသုံးပြုနိုင်သည်။
LLMs များ၏ architecture အမျိုးအစားများကို ဆွေးနွေးရန် analogy ကို အသုံးပြုပါမည်။
သင်၏မန်နေဂျာက သင်တန်းသားများအတွက် quiz ရေးရန် တာဝန်ပေးခဲ့သည်ဟု စဉ်းစားပါ။ သင်မှာ content ဖန်တီးသူနှင့် reviewer အဖြစ် colleagues နှစ်ဦးရှိသည်။
content ဖန်တီးသူသည် Decoder-only မော်ဒယ်ကဲ့သို့ဖြစ်ပြီး ၎င်းသည် topic ကိုကြည့်ပြီး သ ကျွန်ုပ်တို့ အရင်ပိုဒ်များတွင် ဖော်ပြခဲ့သော မော်ဒယ်များ (OpenAI မော်ဒယ်များ၊ Llama2 ကဲ့သို့သော အခမဲ့ရရှိနိုင်သော မော်ဒယ်များ၊ Hugging Face transformers) အများစုကို Azure AI Studio ရှိ Model Catalog တွင် ရရှိနိုင်ပါသည်။
Azure AI Studio သည် Cloud Platform တစ်ခုဖြစ်ပြီး Developer များအတွက် Generative AI အက်ပလီကေးရှင်းများ ဖန်တီးရန်နှင့် တီထွင်မှုမှ စတင်၍ အကဲဖြတ်ခြင်းအထိ တိုးတက်မှု လုပ်ငန်းစဉ်တစ်ခုလုံးကို စီမံခန့်ခွဲရန် ရည်ရွယ်ထားသော platform တစ်ခုဖြစ်သည်။ Azure AI Studio ရှိ Model Catalog သည် အသုံးပြုသူများကို အောက်ပါအတိုင်း အကျိုးကျေးဇူးများပေးနိုင်သည်-
- Catalog တွင် စိတ်ဝင်စားသော Foundation Model ကို ရှာဖွေပါ - proprietary သို့မဟုတ် open source ဖြစ်စေ၊ task, license, သို့မဟုတ် name ဖြင့် filter လုပ်နိုင်ပါသည်။ ရှာဖွေရန် ပိုမိုလွယ်ကူစေရန် မော်ဒယ်များကို collections အဖြစ် စီစဉ်ထားပြီး၊ ဥပမာအားဖြင့် Azure OpenAI collection, Hugging Face collection စသည်ဖြင့် ရှာဖွေနိုင်ပါသည်။
- Model card ကို ပြန်လည်သုံးသပ်ပါ၊ ရည်ရွယ်ချက်နှင့် သင်ကြားမှုအချက်အလက်များ၊ code samples နှင့် internal evaluations library တွင် အကဲဖြတ်မှုရလဒ်များ ပါဝင်သည်။
- Model Benchmarks ပန်းကို အသုံးပြု၍ စီးပွားရေးအခြေအနေနှင့် ကိုက်ညီသော မော်ဒယ်ကို သတ်မှတ်ရန်၊ စက်မှုလုပ်ငန်းတွင် ရရှိနိုင်သော မော်ဒယ်များနှင့် datasets များအကြား benchmark များကို နှိုင်းယှဉ်ပါ။
- Azure AI Studio ၏ experimentation နှင့် tracking စွမ်းရည်များကို အသုံးပြု၍ workload အထူးပြု performance ကို တိုးတက်စေရန် မော်ဒယ်ကို custom training data ဖြင့် fine-tune လုပ်ပါ။
- Original pre-trained model သို့မဟုတ် fine-tuned version ကို remote real-time inference - managed compute - သို့မဟုတ် serverless API endpoint - pay-as-you-go - သို့ deploy လုပ်ပါ၊ ထို့ကြောင့် အက်ပလီကေးရှင်းများသည် ၎င်းကို အသုံးပြုနိုင်ပါသည်။
Note
Catalog တွင်ရှိသော မော်ဒယ်များအားလုံးကို fine-tuning နှင့်/သို့မဟုတ် pay-as-you-go deployment အတွက် လက်ရှိတွင် အသုံးပြုနိုင်မည်မဟုတ်ပါ။ မော်ဒယ်၏ စွမ်းရည်များနှင့် ကန့်သတ်ချက်များကို model card တွင် စစ်ဆေးပါ။
ကျွန်ုပ်တို့၏ စတင်လုပ်ငန်းအဖွဲ့နှင့်အတူ LLM များအမျိုးမျိုးနှင့် Cloud Platform (Azure Machine Learning) ကို စူးစမ်းလေ့လာခဲ့ပြီး မော်ဒယ်များကို နှိုင်းယှဉ်ခြင်း၊ စမ်းသပ်မှု data များတွင် အကဲဖြတ်ခြင်း၊ performance တိုးတက်အောင်လုပ်ခြင်းနှင့် inference endpoints တွင် deploy လုပ်ခြင်းတို့ကို လုပ်ဆောင်နိုင်ခဲ့သည်။
သို့သော် မော်ဒယ်ကို pre-trained အတိုင်း အသုံးပြုမည်ဆိုလျှင် fine-tuning လုပ်ရန် ဘယ်အချိန်တွင် စဉ်းစားသင့်သနည်း။ အထူး workload များတွင် မော်ဒယ် performance ကို တိုးတက်အောင်လုပ်ရန် အခြားနည်းလမ်းများ ရှိပါသလား။
LLM မှာ စီးပွားရေးလုပ်ငန်းအတွက် လိုအပ်သော ရလဒ်များရရှိစေရန် အမျိုးမျိုးသော နည်းလမ်းများကို အသုံးပြုနိုင်ပါသည်။ LLM ကို production တွင် deploy လုပ်သောအခါ training အဆင့်အမျိုးမျိုးရှိသော မော်ဒယ်များကို ရွေးချယ်နိုင်ပြီး၊ အဆင့်အတန်း၊ ကုန်ကျစရိတ်နှင့် အရည်အသွေးအမျိုးမျိုးရှိသည်။ အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်ပါသည်-
-
Prompt engineering with context။ Prompt ပေးသောအခါ သင့်ရလဒ်ကို ရရှိစေရန် context လုံလောက်အောင် ပေးရန် အဓိကထားပါ။
-
Retrieval Augmented Generation, RAG။ သင့် data သည် database သို့မဟုတ် web endpoint တစ်ခုတွင် ရှိနိုင်ပြီး၊ prompt ပေးသောအခါ သင့် data သို့မဟုတ် ၎င်း၏ အစိတ်အပိုင်းတစ်ခုကို ထည့်သွင်းရန် အသုံးပြုနိုင်သည်။ Prompt နှင့်အတူ သက်ဆိုင်သော data ကို ရှာဖွေပြီး အသုံးပြုသူ၏ prompt အတွင်း ထည့်သွင်းနိုင်သည်။
-
Fine-tuned model။ မော်ဒယ်ကို သင့် data ဖြင့် ထပ်မံ training လုပ်ခြင်းဖြင့် သင့်လိုအပ်ချက်များနှင့် ကိုက်ညီသော ရလဒ်များရရှိစေပြီး၊ ကုန်ကျစရိတ်များ တက်နိုင်သည်။
Img source: Four Ways that Enterprises Deploy LLMs | Fiddler AI Blog
Pre-trained LLMs များသည် generalized natural language tasks များတွင် အလွန်ကောင်းမွန်စွာ အလုပ်လုပ်နိုင်ပြီး၊ တစ်ကြောင်းစာမေးခွန်းတစ်ခု သို့မဟုတ် ပြည့်စုံစေရန် စာကြောင်းတစ်ကြောင်းကို prompt ပေးခြင်းဖြင့် “zero-shot” learning အဖြစ် အလုပ်လုပ်နိုင်သည်။
သို့သော် အသုံးပြုသူသည် ၎င်း၏မေးခွန်းကို အကြောင်းအရာများနှင့် အတိအကျ ဖော်ပြနိုင်လျှင်၊ အသုံးပြုသူ၏ မျှော်လင့်ချက်နှင့် အနီးစပ်ဆုံးဖြစ်သော အဖြေကို ရရှိနိုင်မည်ဖြစ်သည်။ Prompt တွင် ဥပမာတစ်ခုသာ ပါဝင်လျှင် “one-shot” learning ဟုခေါ်ပြီး၊ ဥပမာများစွာ ပါဝင်လျှင် “few-shot” learning ဟုခေါ်သည်။ Prompt engineering with context သည် စတင်ရန်အတွက် ကုန်ကျစရိတ်အနည်းဆုံးနည်းလမ်းဖြစ်သည်။
LLMs တွင် training အတွင်း အသုံးပြုထားသော data ကိုသာ အသုံးပြုနိုင်သော ကန့်သတ်ချက်ရှိသည်။ ၎င်းသည် training ပြီးဆုံးပြီးနောက် ဖြစ်ပျက်သော အချက်အလက်များနှင့် company data ကဲ့သို့သော non-public information များကို မသိနိုင်ပါ။
ဤကန့်သတ်ချက်ကို RAG ဖြင့် ဖြေရှင်းနိုင်ပြီး၊ prompt length အကန့်အသတ်များကို ထည့်သွင်းစဉ်းစားပြီး external data ကို prompt အတွင်း ထည့်သွင်းခြင်းဖြင့် အဖြေကို တိုးတက်စေသည်။ Vector database tools (ဥပမာ Azure Vector Search) သည် pre-defined data sources များမှ အသုံးဝင်သော data အစိတ်အပိုင်းများကို ရှာဖွေပြီး prompt context အတွင်း ထည့်သွင်းပေးသည်။
ဤနည်းလမ်းသည် စီးပွားရေးလုပ်ငန်းတစ်ခုတွင် data လုံလောက်မှုမရှိခြင်း၊ အချိန်မလုံလောက်ခြင်း သို့မဟုတ် LLM ကို fine-tune လုပ်ရန် resources မလုံလောက်ခြင်းတို့ရှိသည့်အခါ workload အထူးပြု performance ကို တိုးတက်စေရန်နှင့် အမှားများကို လျှော့ချရန် အလွန်အသုံးဝင်သည်။
Fine-tuning သည် transfer learning ကို အသုံးပြု၍ မော်ဒယ်ကို downstream task သို့မဟုတ် အထူးပြုပြဿနာကို ဖြေရှင်းရန် “အလျင်အမြန်” ပြင်ဆင်ခြင်းဖြစ်သည်။ Few-shot learning နှင့် RAG တို့နှင့် မတူကွဲပြားပြီး၊ updated weights နှင့် biases များပါဝင်သော မော်ဒယ်အသစ်တစ်ခုကို ဖန်တီးရလိမ့်မည်။ ၎င်းသည် training examples များကို prompt နှင့် ၎င်းနှင့်ဆက်စပ်သော output (completion) ဖြင့် လိုအပ်သည်။ ဤနည်းလမ်းကို အောက်ပါအခြေအနေများတွင် သုံးသင့်သည်-
-
Fine-tuned မော်ဒယ်များကို အသုံးပြုခြင်း။ စီးပွားရေးလုပ်ငန်းသည် high performance မော်ဒယ်များထက် less capable မော်ဒယ်များ (ဥပမာ embedding models) ကို အသုံးပြုလိုပါက၊ ကုန်ကျစရိတ်နည်းပြီး အချိန်တိုသော ဖြေရှင်းချက်ကို ရရှိစေသည်။
-
Latency ကို စဉ်းစားခြင်း။ Latency သည် အထူးပြု use-case အတွက် အရေးကြီးသောအခါ၊ prompt များကို အလွန်ရှည်လျားစွာ အသုံးပြုရန် မဖြစ်နိုင်ပါ၊ သို့မဟုတ် မော်ဒယ်မှ သင်ယူရန်လိုအပ်သော ဥပမာများသည် prompt length limit နှင့် ကိုက်ညီမှုမရှိပါ။
-
Up-to-date ဖြစ်နေခြင်း။ စီးပွားရေးလုပ်ငန်းတွင် အရည်အသွေးမြင့် data များနှင့် ground truth labels များရှိပြီး၊ ဤ data ကို အချိန်နှင့်တပြေးညီ update လုပ်ရန် resources များရှိပါက။
LLM ကို အစမှ training လုပ်ခြင်းသည် အလွန်ခက်ခဲပြီး အလွန်ရှုပ်ထွေးသော နည်းလမ်းဖြစ်ပြီး၊ data အများအပြား၊ ကျွမ်းကျင်သော resources နှင့် သင့်လျော်သော computational power လိုအပ်သည်။ ဤရွေးချယ်မှုကို domain-specific use case နှင့် domain-centric data အများအပြားရှိသော စီးပွားရေးလုပ်ငန်းအခြေအနေတွင်သာ စဉ်းစားသင့်သည်။
LLM completion ရလဒ်များကို တိုးတက်အောင်လုပ်ရန် ကောင်းမွန်သော နည်းလမ်းက ဘာဖြစ်နိုင်မလဲ။
- Prompt engineering with context
- RAG
- Fine-tuned model
A:3, သင့်တွင် အချိန်နှင့် resources ရှိပြီး high-quality data ရှိပါက၊ fine-tuning သည် up-to-date ဖြစ်နေဖို့အတွက် အကောင်းဆုံးရွေးချယ်မှုဖြစ်သည်။ သို့သော်၊ အကောင်းဆုံးဖြေရှင်းချက်ကို ရှာဖွေရန် အချိန်မလုံလောက်ပါက RAG ကို စဉ်းစားသင့်သည်။
သင့်စီးပွားရေးလုပ်ငန်းအတွက် RAG ကို အသုံးပြုခြင်း အကြောင်းကို ပိုမိုလေ့လာပါ။
ဤသင်ခန်းစာကို ပြီးဆုံးပြီးနောက်၊ Generative AI Learning collection ကို ကြည့်ရှု၍ Generative AI အသိပညာကို ဆက်လက်မြှင့်တင်ပါ။
Lesson 3 သို့ သွားပါ၊ အဲဒီမှာ Generative AI ကို တာဝန်ယူမှုဖြင့် ဖန်တီးခြင်း အကြောင်းကို လေ့လာပါ!
အကြောင်းကြားချက်:
ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု Co-op Translator ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေသော်လည်း အလိုအလျောက် ဘာသာပြန်မှုများတွင် အမှားများ သို့မဟုတ် မမှန်ကန်မှုများ ပါဝင်နိုင်သည်ကို သတိပြုပါ။ မူရင်းဘာသာစကားဖြင့် ရေးသားထားသော စာရွက်စာတမ်းကို အာဏာတရ အရင်းအမြစ်အဖြစ် သတ်မှတ်သင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူ့ဘာသာပြန်ပညာရှင်များကို အသုံးပြုရန် အကြံပြုပါသည်။ ဤဘာသာပြန်မှုကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအမှားများ သို့မဟုတ် အနားယူမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။











