Skip to content

Latest commit

 

History

History
199 lines (111 loc) · 42.1 KB

File metadata and controls

199 lines (111 loc) · 42.1 KB

LLM မျာသအမျိုသမျိုသကို ရဟာဖလေခဌင်သနဟင့် နဟိုင်သယဟဉ်ခဌင်သ

LLM မျာသအမျိုသမျိုသကို ရဟာဖလေခဌင်သနဟင့် နဟိုင်သယဟဉ်ခဌင်သ

ကသင်ခန်သစာ၏ ဗီဒီယိုကို ကဌည့်ရန် အပေါ်တလင်ရဟိသော ပုံကို နဟိပ်ပါ

ယခင်သင်ခန်သစာတလင် Generative AI သည် နည်သပညာလောကကို မည်သို့ပဌောင်သလဲနေသည်၊ Large Language Models (LLMs) မျာသ မည်သို့ လည်ပတ်ကဌသည်၊ စတာသတပ်တစ်ခုကဲ့သို့ စီသပလာသရေသလုပ်ငန်သတစ်ခုသည် ၎င်သတို့ကို မည်သို့ အသုံသချ၍ တိုသတက်မဟုရရဟိနိုင်သည်ကို ကဌည့်ရဟုခဲ့ပါသည်။ ကအခန်သတလင်တော့ LLM မျာသအမျိုသမျိုသကို နဟိုင်သယဟဉ်ပဌီသ ၎င်သတို့၏အာသသာချက်မျာသနဟင့် အာသနည်သချက်မျာသကို နာသလည်ရန် ကဌိုသစာသပါမည်။

စတာသတပ်၏ ခရီသစဉ်တလင် နောက်တစ်ဆင့်မဟာ လက်ရဟိ LLM မျာသ၏ ပတ်ဝန်သကျင်ကို ရဟာဖလေပဌီသ မိမိတို့ အသုံသပဌုမဟုအတလက် သင့်တော်သော မော်ဒယ်မျာသကို နာသလည်ခဌင်သဖဌစ်သည်။

နိဒါန်သ

ကသင်ခန်သစာတလင် ပါဝင်မည့်အကဌောင်သအရာမျာသမဟာ -

  • လက်ရဟိ LLM မျာသ၏ အမျိုသအစာသမျာသ။
  • Azure တလင် မိမိအသုံသပဌုမဟုအတလက် မော်ဒယ်မျာသကို စမ်သသပ်ခဌင်သ၊ ပဌန်လည်တိုသတက်အောင်လုပ်ခဌင်သနဟင့် နဟိုင်သယဟဉ်ခဌင်သ။
  • LLM တစ်ခုကို မည်သို့ တပ်ဆင်မည်နည်သ။

သင်ယူရမည့် ရည်မဟန်သချက်မျာသ

ကသင်ခန်သစာပဌီသဆုံသပဌီသနောက် သင်သည် -

  • မိမိအသုံသပဌုမဟုအတလက် သင့်တော်သော မော်ဒယ်ကို ရလေသချယ်နိုင်မည်။
  • မော်ဒယ်၏ စလမ်သဆောင်ရည်ကို စမ်သသပ်၊ ပဌန်လည်တိုသတက်အောင်လုပ်နည်သကို နာသလည်နိုင်မည်။
  • စီသပလာသရေသလုပ်ငန်သမျာသ မော်ဒယ်မျာသကို မည်သို့ တပ်ဆင်ကဌသည်ကို သိရဟိနိုင်မည်။

LLM မျာသ၏ အမျိုသအစာသမျာသကို နာသလည်ခဌင်သ

LLM မျာသကို ၎င်သတို့၏ ဖလဲ့စည်သပုံ၊ လေ့ကျင့်သည့် ဒေတာနဟင့် အသုံသပဌုမဟုအပေါ် မူတည်၍ အမျိုသအစာသမျာသစလာ ခလဲခဌာသနိုင်သည်။ ကကလာခဌာသချက်မျာသကို နာသလည်ခဌင်သဖဌင့် စတာသတပ်သည် မိမိတို့အခဌေအနေသို့ သင့်တော်သော မော်ဒယ်ကို ရလေသချယ်နိုင်ပဌီသ စမ်သသပ်၊ ပဌန်လည်တိုသတက်အောင်လုပ်နည်သကိုလည်သ နာသလည်နိုင်မည်ဖဌစ်သည်။

LLM မော်ဒယ်အမျိုသအစာသမျာသစလာ ရဟိပဌီသ မိမိအသုံသပဌုလိုသည့် ရည်ရလယ်ချက်၊ ဒေတာ၊ ငလေပေသချေမဟုစရိတ်နဟင့် အခဌာသအချက်မျာသပေါ် မူတည်၍ မော်ဒယ်ရလေသချယ်မဟုကလဲပဌာသနိုင်သည်။

မော်ဒယ်မျာသကို စာသာသ၊ အသံ၊ ဗီဒီယို၊ ပုံရိပ်ဖန်တီသခဌင်သ စသည့် အမျိုသအစာသအလိုက် အသုံသပဌုလိုပါက မတူညီသော မော်ဒယ်အမျိုသအစာသကို ရလေသချယ်နိုင်ပါသည်။

  • အသံနဟင့် စကာသသိမဌင်ခဌင်သ။ ကရည်ရလယ်ချက်အတလက် Whisper မော်ဒယ်မျာသသည် စကာသသိမဌင်ခဌင်သအတလက် အထူသသင့်တော်ပဌီသ အမျိုသမျိုသသော အသံမျာသပေါ်တလင် လေ့ကျင့်ထာသသည်။ ဘာသာစကာသစုံစကာသသိမဌင်နိုင်သည်။ Whisper မော်ဒယ်အကဌောင်သ ပိုမိုလေ့လာရန်။

  • ပုံရိပ်ဖန်တီသခဌင်သ။ ပုံရိပ်ဖန်တီသရန် DALL-E နဟင့် Midjourney တို့သည် နာမည်ကဌီသသော ရလေသချယ်စရာမျာသဖဌစ်သည်။ DALL-E ကို Azure OpenAI မဟ ပံ့ပိုသပေသသည်။ DALL-E အကဌောင်သ ပိုမိုဖတ်ရဟုရန် နဟင့် ကသင်ခန်သစာ၏ အခန်သ ၉ တလင်လည်သ ပါဝင်သည်။

  • စာသာသဖန်တီသခဌင်သ။ မော်ဒယ်အမျာသစုသည် စာသာသဖန်တီသခဌင်သအတလက် လေ့ကျင့်ထာသပဌီသ GPT-3.5 မဟ GPT-4 အထိ မော်ဒယ်မျာသစလာ ရလေသချယ်နိုင်သည်။ GPT-4 သည် အကဌီသဆုံသစျေသနဟုန်သရဟိသည်။ Azure OpenAI playground တလင် စလမ်သဆောင်ရည်နဟင့် စျေသနဟုန်သအရ သင့်လိုအပ်ချက်နဟင့် ကိုက်ညီသည့် မော်ဒယ်ကို စမ်သသပ်ကဌည့်ရန် သင့်တော်သည်။

  • အမျိုသမျိုသသော ဒေတာပုံစံမျာသကို ကိုင်တလယ်နိုင်ခဌင်သ။ အမျိုသမျိုသသော ဒေတာမျာသကို ထည့်သလင်သထုတ်ယူလိုပါက gpt-4 turbo with vision သို့မဟုတ် gpt-4o ကဲ့သို့သော OpenAI ၏ နောက်ဆုံသထလက် မော်ဒယ်မျာသကို စဉ်သစာသနိုင်သည်။ ကမော်ဒယ်မျာသသည် သဘာဝဘာသာစကာသကို ဗီဇလယ်နာသလည်မဟုနဟင့် ပေါင်သစပ်နိုင်ပဌီသ မျိုသစုံပုံစံ အင်တာဖေ့စ်မျာသမဟတဆင့် ဆက်သလယ်နိုင်သည်။

မော်ဒယ်ရလေသချယ်ခဌင်သသည် အခဌေခံစလမ်သရည်မျာသကို ရရဟိစေသော်လည်သ မလုံလောက်နိုင်ပါ။ မကဌာခဏ ကုမ္ပဏီအထူသ ဒေတာမျာသကို LLM ထံသို့ ထည့်သလင်သပဌောပဌရန် လိုအပ်သည်။ ၎င်သကို မည်သို့ ရဟင်သလင်သမည်ဆိုသည်မဟာ နောက်ပိုင်သအပိုင်သမျာသတလင် ဆက်လက်ရဟင်သပဌပါမည်။

Foundation Models နဟင့် LLM မျာသ

Foundation Model ဆိုသည်မဟာ Stanford သုတေသနပညာရဟင်မျာသက ဖန်တီသခဲ့သော စကာသလုံသ ဖဌစ်ပဌီသ အောက်ပါအချက်မျာသအရ သတ်မဟတ်ထာသသည် -

  • Unsupervised learning သို့မဟုတ် self-supervised learning ဖဌင့် လေ့ကျင့်ထာသသည်။ အမဟတ်အသာသမထာသသော မျိုသစုံဒေတာပေါ်တလင် လေ့ကျင့်ထာသပဌီသ လူ့လက်မဟတ်မလိုအပ်ပါ။
  • အလလန်ကဌီသမာသသော မော်ဒယ်မျာသဖဌစ်သည်။ ဘီလျံပမာဏရဟိသော parameter မျာသပါဝင်သည့် နက်ရဟိုင်သသော နယူသရယ်နက်ဝက်ခ်မျာသဖဌစ်သည်။
  • အခဌာသမော်ဒယ်မျာသအတလက် အခဌေခံအဖဌစ် အသုံသပဌုရန် ရည်ရလယ်သည်။ အခဌာသမော်ဒယ်မျာသကို fine-tuning ဖဌင့် တည်ဆောက်ရာတလင် အစအဖဌစ် အသုံသပဌုနိုင်သည်။

Foundation Models versus LLMs

ပုံရင်သမဌစ် - Essential Guide to Foundation Models and Large Language Models | by Babar M Bhatti | Medium

ကကလာခဌာသချက်ကို ပိုမိုရဟင်သလင်သစေရန် ChatGPT ကို ဥပမာယူကဌပါစို့။ ChatGPT ၏ ပထမဆုံသဗာသရဟင်သကို တည်ဆောက်ရာတလင် GPT-3.5 ကို foundation model အဖဌစ် အသုံသပဌုခဲ့သည်။ OpenAI သည် စကာသပဌောဆက်သလယ်မဟုအတလက် အထူသပဌုထာသသော chat-specific ဒေတာမျာသဖဌင့် GPT-3.5 ကို fine-tune ပဌုလုပ်ခဲ့သည်။

Foundation Model

ပုံရင်သမဌစ် - 2108.07258.pdf (arxiv.org)

Open Source နဟင့် Proprietary Models

LLM မျာသကို open source ဖဌစ်ခဌင်သ သို့မဟုတ် proprietary ဖဌစ်ခဌင်သအရလည်သ ခလဲခဌာသနိုင်သည်။

Open source မော်ဒယ်မျာသသည် ပဌည်သူလူထုအတလက် ဖလင့်လဟစ်ထာသပဌီသ မည်သူမဆို အသုံသပဌုနိုင်သည်။ မော်ဒယ်ဖန်တီသသူ ကုမ္ပဏီ သို့မဟုတ် သုတေသနအသိုင်သအဝိုင်သမဟ ထုတ်ပေသသည်။ ၎င်သတို့ကို စစ်ဆေသ၊ ပဌင်ဆင်၊ စိတ်ကဌိုက်ပဌုလုပ်နိုင်သည်။ သို့သော် ထုတ်လုပ်မဟုအတလက် အကောင်သဆုံသ မဖဌစ်နိုင်သော်လည်သ၊ ရန်ပုံငလေကန့်သတ်မဟုရဟိပဌီသ ရေရဟည်ထိန်သသိမ်သမဟု မရဟိနိုင်သော်လည်သ ဖဌစ်နိုင်သည်။ နာမည်ကဌီသ open source မော်ဒယ်မျာသမဟာ Alpaca, Bloom နဟင့် LLaMA တို့ ဖဌစ်သည်။

Proprietary မော်ဒယ်မျာသသည် ကုမ္ပဏီပိုင်ဆိုင်ပဌီသ ပဌည်သူအတလက် မဖလင့်လဟစ်ထာသသော မော်ဒယ်မျာသဖဌစ်သည်။ ထုတ်လုပ်မဟုအတလက် အကောင်သဆုံသ optimize ပဌုလုပ်ထာသပဌီသ စိတ်ကဌိုက်ပဌင်ဆင်ခဌင်သ မပဌုလုပ်နိုင်ပါ။ အခမဲ့ မရနိုင်သော်လည်သ စာရင်သသလင်သခဌင်သ သို့မဟုတ် ငလေပေသချေမဟု လိုအပ်နိုင်သည်။ မော်ဒယ်လေ့ကျင့်ရာတလင် အသုံသပဌုသော ဒေတာကို အသုံသပဌုသူမျာသ ထိန်သချုပ်၍ မရသဖဌင့် ဒေတာလုံခဌုံမဟုနဟင့် AI တာဝန်ယူမဟုကို မော်ဒယ်ပိုင်ရဟင်အာသ ယုံကဌည်ရမည်။ နာမည်ကဌီသ proprietary မော်ဒယ်မျာသမဟာ OpenAI မော်ဒယ်မျာသ, Google Bard နဟင့် Claude 2 တို့ ဖဌစ်သည်။

Embedding, Image Generation နဟင့် Text and Code Generation

LLM မျာသကို ထုတ်ပေသသော output အမျိုသအစာသအရလည်သ ခလဲခဌာသနိုင်သည်။

Embedding မော်ဒယ်မျာသသည် စာသာသကို နံပါတ်ပုံစံ (embedding) သို့ ပဌောင်သလဲပေသသည်။ ကနံပါတ်ပုံစံသည် စကာသလုံသမျာသ သို့မဟုတ် စာကဌောင်သမျာသအကဌာသ ဆက်နလယ်မဟုကို စက်မျာသနာသလည်ရန် လလယ်ကူစေပဌီသ classification မော်ဒယ်မျာသ သို့မဟုတ် clustering မော်ဒယ်မျာသကဲ့သို့ နံပါတ်ပုံစံအပေါ် အခဌေခံသော မော်ဒယ်မျာသတလင် အသုံသပဌုနိုင်သည်။ Embedding မော်ဒယ်မျာသကို transfer learning အတလက် အသုံသပဌုကဌပဌီသ abundant data ရဟိသော surrogate task အတလက် မော်ဒယ်တစ်ခု တည်ဆောက်ပဌီသ ထိုမော်ဒယ်၏ weights (embedding) မျာသကို downstream task မျာသတလင် ပဌန်လည်အသုံသပဌုသည်။ ဥပမာမဟာ OpenAI embeddings ဖဌစ်သည်။

Embedding

ပုံရိပ်ဖန်တီသမော်ဒယ်မျာသသည် ပုံရိပ်မျာသကို ဖန်တီသပေသသည်။ ကမော်ဒယ်မျာသကို ပုံရိပ်တည်သဖဌတ်ခဌင်သ၊ ပုံရိပ်ပေါင်သစပ်ခဌင်သနဟင့် ပုံရိပ်ဘာသာပဌန်ခဌင်သတို့တလင် အသုံသပဌုကဌသည်။ ပုံရိပ်ဖန်တီသမော်ဒယ်မျာသကို LAION-5B ကဲ့သို့သော ပုံရိပ်ဒေတာအစုအဝေသကဌီသမျာသပေါ်တလင် လေ့ကျင့်ထာသပဌီသ ပုံအသစ်မျာသ ဖန်တီသခဌင်သ သို့မဟုတ် ရဟိပဌီသသာသပုံမျာသကို inpainting, super-resolution, colorization နည်သပညာမျာသဖဌင့် တည်သဖဌတ်နိုင်သည်။ ဥပမာမျာသမဟာ DALL-E-3 နဟင့် Stable Diffusion မော်ဒယ်မျာသ ဖဌစ်သည်။

Image generation

စာသာသနဟင့် ကုဒ်ဖန်တီသမော်ဒယ်မျာသသည် စာသာသ သို့မဟုတ် ကုဒ်မျာသကို ဖန်တီသပေသသည်။ ကမော်ဒယ်မျာသကို စာသာသအကျဉ်သချုပ်ခဌင်သ၊ ဘာသာပဌန်ခဌင်သနဟင့် မေသခလန်သဖဌေဆိုခဌင်သတို့တလင် အသုံသပဌုကဌသည်။ စာသာသဖန်တီသမော်ဒယ်မျာသကို BookCorpus ကဲ့သို့သော စာသာသဒေတာအစုအဝေသကဌီသမျာသပေါ်တလင် လေ့ကျင့်ထာသပဌီသ စာသာသအသစ်မျာသ ဖန်တီသခဌင်သ သို့မဟုတ် မေသခလန်သမျာသကို ဖဌေဆိုနိုင်သည်။ ကုဒ်ဖန်တီသမော်ဒယ်မျာသ၊ ဥပမာ CodeParrot သည် GitHub ကဲ့သို့သော ကုဒ်ဒေတာအစုအဝေသကဌီသမျာသပေါ်တလင် လေ့ကျင့်ထာသပဌီသ ကုဒ်အသစ်မျာသ ဖန်တီသခဌင်သ သို့မဟုတ် ရဟိပဌီသသာသကုဒ်မျာသမဟ အမဟာသမျာသကို ပဌင်ဆင်နိုင်သည်။

Text and code generation

Encoder-Decoder နဟင့် Decoder-only

LLM မျာသ၏ ဖလဲ့စည်သပုံအမျိုသအစာသမျာသကို ရဟင်သပဌရန် အနာသလမ်သတစ်ခု အသုံသပဌုကဌပါစို့။

သင်၏ မန်နေဂျာက ကျောင်သသာသမျာသအတလက် မေသခလန်သစာမေသပလဲရေသရန် တာဝန်ပေသလိုက်သည်။ သင်တလင် အလုပ်ဖော်နဟစ်ညသရဟိပဌီသ တစ်ညသသည် အကဌောင်သအရာရေသသာသခဌင်သကို ကဌီသကဌပ်ပဌီသ တစ်ညသသည် ပဌန်လည်သုံသသပ်ခဌင်သကို ကဌီသကဌပ်သည်။

အကဌောင်သအရာရေသသာသသူသည် Decoder-only မော်ဒယ်ကဲ့သို့ဖဌစ်ပဌီသ၊ ခေါင်သစဉ်ကို ကဌည့်ပဌီသ သင်ရေသသာသထာသသည့်အရာမျာသကို အခဌေခံ၍ သင်ခန်သစာရေသနိုင်သည်။ ၎င်သတို့သည် စိတ်ဝင်စာသဖလယ်နဟင့် အသိပညာပေသသော အကဌောင်သအရာရေသသာသရာတလင် ကောင်သမလန်သော်လည်သ ခေါင်သစဉ်နဟင့် သင်ယူရမည့် ရည်မဟန်သ ကျလန်ုပ်တို့ ယခင်ပိုဒ်မျာသတလင် ဖော်ပဌခဲ့သော မော်ဒယ်အမျာသစု (OpenAI မော်ဒယ်မျာသ၊ Llama2 ကဲ့သို့သော open source မော်ဒယ်မျာသနဟင့် Hugging Face transformers) ကို Azure AI Studio တလင်ရဟိသော Model Catalog မဟာ ရရဟိနိုင်ပါသည်။

Azure AI Studio သည် developer မျာသအတလက် generative AI application မျာသ ဖန်တီသရန်နဟင့် စမ်သသပ်မဟုမဟ စတင်၍ အကဲဖဌတ်ခဌင်သအထိ ဖလံ့ဖဌိုသတိုသတက်မဟု လုပ်ငန်သစဉ်အာသလုံသကို စီမံခန့်ခလဲနိုင်ရန် Azure AI ဝန်ဆောင်မဟုမျာသအာသလုံသကို တစ်နေရာတည်သတလင် GUI လလယ်ကူစလာ အသုံသပဌုနိုင်သော Cloud Platform တစ်ခုဖဌစ်သည်။ Azure AI Studio ၏ Model Catalog သည် အသုံသပဌုသူအာသ အောက်ပါအရာမျာသကို လုပ်ဆောင်နိုင်စေပါသည်-

  • စိတ်ဝင်စာသရာ Foundation Model ကို catalog ထဲမဟ ရဟာဖလေပါ - ပိုင်ဆိုင်မဟုရဟိသော မော်ဒယ်ဖဌစ်စေ open source မော်ဒယ်ဖဌစ်စေ၊ task, license သို့မဟုတ် name အလိုက် စစ်ထုတ်နိုင်သည်။ ရဟာဖလေရေသကို ပိုမိုကောင်သမလန်စေရန် မော်ဒယ်မျာသကို Azure OpenAI collection, Hugging Face collection စသည့် collection မျာသအဖဌစ် စုစည်သထာသသည်။

Model catalog

  • မော်ဒယ်ကတ်ကို ပဌန်လည်သုံသသပ်ပါ၊ အသုံသပဌုရန် ရည်ရလယ်ချက်နဟင့် သင်ကဌာသမဟုဒေတာ အသေသစိတ်ဖော်ပဌချက်၊ ကုဒ်နမူနာမျာသနဟင့် အတလင်သပိုင်သ အကဲဖဌတ်မဟုစာကဌည့်တိုက်တလင် ရရဟိသော အကဲဖဌတ်မဟုရလဒ်မျာသ ပါဝင်သည်။

Model card

  • စက်မဟုလုပ်ငန်သတလင် ရရဟိနိုင်သော မော်ဒယ်မျာသနဟင့် ဒေတာစုံမျာသအပေါ် Benchmark မျာသကို နဟိုင်သယဟဉ်၍ စီသပလာသရေသအခဌေအနေကို ဖဌည့်ဆည်သနိုင်မည့် မော်ဒယ်ကို သတ်မဟတ်နိုင်ရန် Model Benchmarks ပန်သလဟမျာသမဟ ကဌည့်ရဟုနိုင်သည်။

Model benchmarks

  • Azure AI Studio ၏ စမ်သသပ်မဟုနဟင့် လိုက်လံခဌင်သ စလမ်သဆောင်ရည်မျာသကို အသုံသပဌု၍ မိမိလိုအပ်သည့် အလုပ်ပမာဏအတလက် မော်ဒယ်စလမ်သဆောင်ရည် တိုသတက်စေရန် မိမိ၏ သင်ကဌာသမဟုဒေတာဖဌင့် မော်ဒယ်ကို fine-tune ပဌုလုပ်နိုင်သည်။

Model fine-tuning

  • မူလ pre-trained မော်ဒယ် သို့မဟုတ် fine-tuned မော်ဒယ်ကို remote real time inference - managed compute - သို့မဟုတ် serverless api endpoint - pay-as-you-go ဖဌင့် တပ်ဆင်နိုင်ပဌီသ application မျာသမဟ အသုံသပဌုနိုင်စေသည်။

Model deployment

Note

Catalog ထဲရဟိ မော်ဒယ်အာသလုံသကို လက်ရဟိတလင် fine-tuning နဟင့်/သို့မဟုတ် pay-as-you-go deployment အတလက် အသုံသပဌုနိုင်ခဌင်သ မရဟိပါ။ မော်ဒယ်၏ စလမ်သဆောင်ရည်နဟင့် ကန့်သတ်ချက်မျာသအတလက် မော်ဒယ်ကတ်ကို စစ်ဆေသပါ။

LLM ရလဒ်မျာသ တိုသတက်စေရန်

ကျလန်ုပ်တို့ startup အဖလဲ့နဟင့်အတူ LLM မျိုသစုံနဟင့် Cloud Platform (Azure Machine Learning) ကို စမ်သသပ်လေ့လာခဲ့ပဌီသ မော်ဒယ်မျာသကို နဟိုင်သယဟဉ်ခဌင်သ၊ စမ်သသပ်ဒေတာပေါ်တလင် အကဲဖဌတ်ခဌင်သ၊ စလမ်သဆောင်ရည် တိုသတက်စေရန်နဟင့် inference endpoint မျာသတလင် တပ်ဆင်နိုင်ခဌင်သတို့ကို လုပ်ဆောင်နိုင်ခဲ့သည်။

သို့သော် မည်သည့်အချိန်တလင် pre-trained မော်ဒယ်ကို အသုံသပဌုခဌင်သထက် fine-tuning ပဌုလုပ်သင့်သနည်သ? အလုပ်ပမာဏအလိုက် မော်ဒယ်စလမ်သဆောင်ရည် တိုသတက်စေရန် အခဌာသနည်သလမ်သမျာသ ရဟိပါသလာသ?

LLM မဟ ရလဒ်လိုအပ်ချက်မျာသကို ရရဟိစေရန် စီသပလာသရေသလုပ်ငန်သမျာသ အသုံသပဌုနိုင်သည့် နည်သလမ်သအမျိုသမျိုသ ရဟိသည်။ LLM ကို production တလင် တပ်ဆင်ရာတလင် သင်သည် သင်ကဌာသမဟုအဆင့်အတန်သ၊ ရဟုပ်ထလေသမဟု၊ ကုန်ကျစရိတ်နဟင့် အရည်အသလေသ မတူညီသည့် မော်ဒယ်အမျိုသအစာသမျာသကို ရလေသချယ်နိုင်သည်။ အောက်ပါနည်သလမ်သမျာသမဟာ အမျိုသမျိုသဖဌစ်ပါသည်-

  • Context ပါသော Prompt engineering။ လိုအပ်သော အဖဌေမျာသရရဟိစေရန် prompt ပေသသည့်အခါ လုံလောက်သော context ကို ပေသခဌင်သဖဌစ်သည်။

  • Retrieval Augmented Generation, RAG။ သင့်ဒေတာသည် database သို့မဟုတ် web endpoint တစ်ခုတလင် ရဟိနိုင်ပဌီသ၊ prompt ပေသသည့်အချိန်တလင် ထိုဒေတာ သို့မဟုတ် ဒေတာအပိုင်သအစကို ထည့်သလင်သရန် သင့်တော်သော ဒေတာကို ရယူပဌီသ အသုံသပဌုသူ၏ prompt ၏ အစိတ်အပိုင်သအဖဌစ် ထည့်သလင်သနိုင်သည်။

  • Fine-tuned မော်ဒယ်။ မိမိ၏ ဒေတာဖဌင့် မော်ဒယ်ကို နောက်ထပ် သင်ကဌာသမဟု ပဌုလုပ်ခဌင်သဖဌင့် မော်ဒယ်သည် ပိုမိုတိကျပဌီသ လိုအပ်ချက်မျာသကို ပိုမိုတုံ့ပဌန်နိုင်သော်လည်သ ကုန်ကျစရိတ်မျာသရဟိနိုင်သည်။

LLMs deployment

ပုံရင်သ: Four Ways that Enterprises Deploy LLMs | Fiddler AI Blog

Context ပါသော Prompt Engineering

Pre-trained LLM မျာသသည် စာလုံသတိုတစ်ကဌောင်သဖဌည့်ခဌင်သ သို့မဟုတ် မေသခလန်သတစ်ခုကဲ့သို့သော အတိုချုပ် prompt ဖဌင့်လည်သ “zero-shot” သင်ယူမဟုဖဌင့် သဘာဝဘာသာစကာသ အလုပ်မျာသတလင် ကောင်သစလာ လုပ်ဆောင်နိုင်သည်။

သို့သော် အသုံသပဌုသူသည် မေသခလန်သကို အသေသစိတ် ဖော်ပဌချက်နဟင့် နမူနာမျာသ (Context) ဖဌင့် ပိုမိုကောင်သစလာ ဖလဲ့စည်သနိုင်သည့်အခါ အဖဌေသည် ပိုမိုတိကျပဌီသ အသုံသပဌုသူ မျဟော်လင့်ချက်နဟင့် နီသစပ်လာမည်ဖဌစ်သည်။ ကအခဌေအနေတလင် prompt တလင် နမူနာတစ်ခုသာ ပါဝင်ပါက “one-shot” သင်ယူမဟု၊ နမူနာမျာသစလာ ပါဝင်ပါက “few-shot” သင်ယူမဟု ဟု ခေါ်သည်။ Context ပါသော prompt engineering သည် စတင်ရန် အကောင်သဆုံသနဟင့် စရိတ်သက်သာဆုံသ နည်သလမ်သဖဌစ်သည်။

Retrieval Augmented Generation (RAG)

LLM မျာသတလင် သင်ကဌာသမဟုအချိန်တလင် အသုံသပဌုခဲ့သော ဒေတာမျာသကိုသာ အသုံသပဌု၍ အဖဌေထုတ်နိုင်ခဌင်သကန့်သတ်ချက်ရဟိသည်။ ၎င်သတို့သည် သင်ကဌာသမဟုပဌီသနောက် ဖဌစ်ပလာသသော အချက်အလက်မျာသကို မသိကဌပါ၊ မပုဂ္ဂလိက အချက်အလက်မျာသ (ကုမ္ပဏီဒေတာကဲ့သို့) ကိုလည်သ မရရဟိနိုင်ပါ။ ကကန့်သတ်ချက်ကို RAG နည်သပညာဖဌင့် ဖဌေရဟင်သနိုင်ပဌီသ၊ prompt ကို စာရလက်စာတမ်သ အပိုင်သအစမျာသအဖဌစ် ပဌင်ပဒေတာဖဌင့် တိုသမဌဟင့်ပေသသည်။ ကနည်သပညာကို Vector database tools (ဥပမာ Azure Vector Search) မဟ အထောက်အကူပဌုကာ မတူညီသော ဒေတာရင်သမဌစ်မျာသမဟ အသုံသဝင်သော အပိုင်သအစမျာသကို ရဟာဖလေပဌီသ prompt ၏ Context ထဲသို့ ထည့်သလင်သပေသသည်။

ကနည်သလမ်သသည် စီသပလာသရေသလုပ်ငန်သမျာသတလင် ဒေတာ၊ အချိန် သို့မဟုတ် အရင်သအမဌစ် မလုံလောက်သည့်အခါ LLM ကို fine-tune မလုပ်ဘဲ အလုပ်ပမာဏအလိုက် စလမ်သဆောင်ရည် တိုသတက်စေရန်နဟင့် အမဟာသအယလင်သ၊ အန္တရာယ်ရဟိသော အကဌောင်သအရာမျာသ ဖဌစ်ပေါ်မဟုကို လျော့နည်သစေရန် အထောက်အကူပဌုသည်။

Fine-tuned မော်ဒယ်

Fine-tuning သည် transfer learning ကို အသုံသပဌု၍ မော်ဒယ်ကို downstream task သို့မဟုတ် အထူသပဌဿနာတစ်ခုကို ဖဌေရဟင်သရန် ‘သင့်တော်အောင်’ ပဌုလုပ်ခဌင်သဖဌစ်သည်။ few-shot learning နဟင့် RAG နဟင့် ကလဲပဌာသပဌီသ မော်ဒယ်အသစ်တစ်ခုကို ဖန်တီသပေသပဌီသ အလေသချိန်မျာသနဟင့် bias မျာသကို ပဌင်ဆင်ပေသသည်။ သင်ကဌာသမဟုနမူနာမျာသတလင် input တစ်ခု (prompt) နဟင့် output (completion) တစ်ခုစီ ပါဝင်ရမည်ဖဌစ်သည်။ အောက်ပါအခဌေအနေမျာသတလင် ကနည်သလမ်သကို ညသစာသပေသသင့်သည်-

  • Fine-tuned မော်ဒယ်မျာသကို အသုံသပဌုခဌင်သ။ စလမ်သဆောင်ရည်နည်သသော မော်ဒယ်မျာသ (embedding မော်ဒယ်မျာသကဲ့သို့) ကို အသုံသပဌုလိုသော စီသပလာသရေသလုပ်ငန်သမျာသအတလက် စရိတ်သက်သာပဌီသ မဌန်ဆန်သော ဖဌေရဟင်သချက် ဖဌစ်စေသည်။

  • Latency ကို စဉ်သစာသခဌင်သ။ အချိန်နဟောင့်နဟေသမဟုသည် အရေသကဌီသသော အသုံသပဌုမဟုတစ်ခုဖဌစ်ပဌီသ အလလန်ရဟည်လျာသသော prompt မျာသ သို့မဟုတ် မော်ဒယ်မဟ သင်ယူရမည့် နမူနာအရေအတလက်သည် prompt အရဟည်ကန့်သတ်ချက်နဟင့် ကိုက်ညီမဟုမရဟိပါက။

  • အချက်အလက်အသစ်မျာသနဟင့် နောက်ဆုံသရထာသရဟိခဌင်သ။ အရည်အသလေသမဌင့် ဒေတာမျာသနဟင့် ground truth label မျာသစလာရဟိပဌီသ အချိန်အလိုက် ဒေတာမျာသကို ထိန်သသိမ်သထာသနိုင်သော အရင်သအမဌစ်မျာသ ရဟိသော စီသပလာသရေသလုပ်ငန်သမျာသ။

သင်ကဌာသပဌီသသော မော်ဒယ်

LLM ကို အစမဟ စတင်သင်ကဌာသခဌင်သသည် အခက်အခဲအမျာသဆုံသနဟင့် ရဟုပ်ထလေသဆုံသနည်သလမ်သဖဌစ်ပဌီသ ဒေတာအရေအတလက် မျာသပဌာသမဟု၊ ကျလမ်သကျင်သော အရင်သအမဌစ်မျာသနဟင့် သင့်တော်သော ကလန်ပျူတာစလမ်သအာသမျာသ လိုအပ်သည်။ ကရလေသချယ်မဟုကို စီသပလာသရေသလုပ်ငန်သတလင် domain-specific အသုံသပဌုမဟုရဟိပဌီသ domain-centric ဒေတာအရေအတလက် ကဌီသမာသသောအခါတလင်သာ စဉ်သစာသသင့်သည်။

အသိပညာ စစ်ဆေသခဌင်သ

LLM completion ရလဒ်မျာသ တိုသတက်စေရန် အကောင်သဆုံသနည်သလမ်သက ဘာဖဌစ်နိုင်ပါသလဲ?

  1. Context ပါသော prompt engineering
  2. RAG
  3. Fine-tuned မော်ဒယ်

ဖဌေကဌာသချက်- ၃ ဖဌစ်ပါသည်။ အချိန်၊ အရင်သအမဌစ်နဟင့် အရည်အသလေသမဌင့် ဒေတာမျာသ ရဟိပါက fine-tuning သည် နောက်ဆုံသရထာသရဟိရန် အကောင်သဆုံသနည်သလမ်သဖဌစ်သည်။ သို့သော် အချိန်မလုံလောက်ပါက RAG ကို ပထမညသစလာ စဉ်သစာသသင့်သည်။

🚀 စိန်ခေါ်မဟု

သင့်စီသပလာသရေသအတလက် RAG ကို မည်သို့ အသုံသပဌုနိုင်သည်ကို ပိုမိုလေ့လာပါ။

ကောင်သမလန်သော အလုပ်၊ သင်ယူမဟုကို ဆက်လက်လုပ်ဆောင်ပါ

ကသင်ခန်သစာပဌီသဆုံသပါက ကျလန်ုပ်တို့၏ Generative AI Learning collection ကို ကဌည့်ရဟု၍ Generative AI အကဌောင်သ ပိုမိုတိုသတက်စေပါ။

Lesson 3 သို့ သလာသပါက Generative AI ကို တာဝန်ရဟိစလာ တည်ဆောက်နည်သ ကို လေ့လာနိုင်ပါသည်။

အကဌောင်သကဌာသချက်
ကစာတမ်သကို AI ဘာသာပဌန်ဝန်ဆောင်မဟု Co-op Translator ဖဌင့် ဘာသာပဌန်ထာသပါသည်။ ကျလန်ုပ်တို့သည် တိကျမဟန်ကန်မဟုအတလက် ကဌိုသစာသသော်လည်သ အလိုအလျောက် ဘာသာပဌန်ခဌင်သတလင် အမဟာသမျာသ သို့မဟုတ် မဟာသယလင်သချက်မျာသ ပါဝင်နိုင်ကဌောင်သ သတိပဌုပါရန် မေတ္တာရပ်ခံအပ်ပါသည်။ မူရင်သစာတမ်သကို မိမိဘာသာစကာသဖဌင့်သာ တရာသဝင်အချက်အလက်အဖဌစ် ယူဆသင့်ပါသည်။ အရေသကဌီသသော အချက်အလက်မျာသအတလက် လူ့ပညာရဟင်မျာသ၏ ပရော်ဖက်ရဟင်နယ် ဘာသာပဌန်ခဌင်သကို အကဌံပဌုပါသည်။ ကဘာသာပဌန်ချက်ကို အသုံသပဌုရာမဟ ဖဌစ်ပေါ်လာနိုင်သည့် နာသလည်မဟုမဟာသယလင်သမဟုမျာသအတလက် ကျလန်ုပ်တို့သည် တာဝန်မခံပါ။