Skip to content

Latest commit

 

History

History
91 lines (55 loc) · 18.2 KB

File metadata and controls

91 lines (55 loc) · 18.2 KB

Open Source Models

နိဒါန်း

အဖွင့်မူရင်း LLM များ၏ကမ္ဘာကြီးမှာ စိတ်လှုပ်ရှားဖွယ်ကောင်းပြီး အမြဲတမ်းတိုးတက်နေဆဲဖြစ်သည်။ ဒီသင်ခန်းစာမှာ အဖွင့်မူရင်းမော်ဒယ်များကို နက်ရှိုင်းစွာ လေ့လာသွားမှာဖြစ်သည်။ ပုဂ္ဂိုလ်ရေးပိုင်မော်ဒယ်များနှင့် အဖွင့်မူရင်းမော်ဒယ်များကို နှိုင်းယှဉ်သိရှိလိုပါက "Exploring and Comparing Different LLMs" သင်ခန်းစာ သို့ သွားရောက်ကြည့်ရှုနိုင်ပါသည်။ ဒီသင်ခန်းစာမှာ fine-tuning အကြောင်းလည်း ပါဝင်သွားမည်ဖြစ်ပြီး၊ ပိုမိုအသေးစိတ်ရှင်းလင်းချက်များကို "Fine-Tuning LLMs" သင်ခန်းစာ မှာတွေ့နိုင်ပါသည်။

သင်ယူရမည့်ရည်မှန်းချက်များ

  • အဖွင့်မူရင်းမော်ဒယ်များကို နားလည်ခြင်း
  • အဖွင့်မူရင်းမော်ဒယ်များနှင့်အတူ အလုပ်လုပ်ခြင်း၏ အကျိုးကျေးဇူးများကို နားလည်ခြင်း
  • Hugging Face နှင့် Azure AI Studio တွင် ရရှိနိုင်သော အဖွင့်မော်ဒယ်များကို ရှာဖွေခြင်း

အဖွင့်မူရင်းမော်ဒယ်များ ဆိုတာဘာလဲ?

အဖွင့်မူရင်းဆော့ဖ်ဝဲသည် နည်းပညာတိုးတက်မှုတွင် အရေးပါသော အခန်းကဏ္ဍတစ်ခုဖြစ်ပြီး အမျိုးမျိုးသောနယ်ပယ်များတွင် တိုးတက်မှုကို ဦးဆောင်ပေးခဲ့သည်။ Open Source Initiative (OSI) မှ ဆော့ဖ်ဝဲအတွက် ၁၀ ချက်စည်းကမ်း ကို သတ်မှတ်ထားပြီး၊ အဆိုပါဆော့ဖ်ဝဲသည် OSI မှ အတည်ပြုထားသောလိုင်စင်ဖြင့် မူရင်းကုဒ်ကို ဖွင့်လှစ်ဝေမျှထားရမည်ဖြစ်သည်။

LLM များ ဖန်တီးခြင်းသည် ဆော့ဖ်ဝဲဖန်တီးခြင်းနှင့် ဆင်တူသော်လည်း တိတိကျကျ မတူညီပါ။ ဒီအကြောင်းကြောင့် LLM များအတွက် အဖွင့်မူရင်းဆိုသည့် အဓိပ္ပာယ်အပေါ် လူမှုအသိုင်းအဝိုင်းတွင် ဆွေးနွေးမှုများ ဖြစ်ပေါ်ခဲ့သည်။ ရိုးရာအဖွင့်မူရင်းအဓိပ္ပာယ်နှင့် ကိုက်ညီရန် မော်ဒယ်တစ်ခုအတွက် အောက်ပါအချက်များကို ပြည်သူ့အနေဖြင့် ရရှိနိုင်ရမည်ဖြစ်သည်-

  • မော်ဒယ်လေ့ကျင့်ရာတွင် အသုံးပြုသော ဒေတာစုစည်းမှုများ
  • လေ့ကျင့်မှုအတွင်း မော်ဒယ်အလေးချိန်များ အပြည့်အစုံ
  • အကဲဖြတ်ကုဒ်
  • fine-tuning ကုဒ်
  • မော်ဒယ်အလေးချိန်များနှင့် လေ့ကျင့်မှု မီထရစ်များ အပြည့်အစုံ

ယခုအချိန်တွင် ဒီစည်းကမ်းများနှင့် ကိုက်ညီသော မော်ဒယ်အနည်းငယ်သာ ရှိပါသည်။ Allen Institute for Artificial Intelligence (AllenAI) မှ ဖန်တီးသော OLMo မော်ဒယ် သည် ဒီအမျိုးအစားနှင့် ကိုက်ညီသော မော်ဒယ်တစ်ခုဖြစ်သည်။

ဒီသင်ခန်းစာအတွက် မော်ဒယ်များကို "open models" ဟု ခေါ်ဆိုသွားမည်ဖြစ်ပြီး၊ ရေးသားချိန်တွင် အထက်ဖော်ပြပါစည်းကမ်းများနှင့် မကိုက်ညီနိုင်သော်လည်း အနာဂတ်တွင် ပြောင်းလဲနိုင်သည်။

Open Models ၏ အကျိုးကျေးဇူးများ

အလွန်စိတ်ကြိုက်ပြင်ဆင်နိုင်ခြင်း - open models များသည် လေ့ကျင့်မှုအချက်အလက်အသေးစိတ်နှင့်အတူ ထုတ်ပြန်ထားသောကြောင့် သုတေသနပညာရှင်များနှင့် ဖန်တီးသူများသည် မော်ဒယ်၏ အတွင်းပိုင်းကို ပြင်ဆင်နိုင်သည်။ ၎င်းက တိကျသောတာဝန် သို့မဟုတ် သုတေသနနယ်ပယ်အတွက် အထူးပြု fine-tuned မော်ဒယ်များ ဖန်တီးနိုင်စေသည်။ ဥပမာများမှာ ကုဒ်ဖန်တီးခြင်း၊ သင်္ချာဆိုင်ရာ လုပ်ဆောင်ချက်များနှင့် ဇီဝဗေဒတို့ ဖြစ်သည်။

ကုန်ကျစရိတ် - ဒီမော်ဒယ်များကို အသုံးပြုခြင်းနှင့် တပ်ဆင်ခြင်းအတွက် တိုကင်တစ်ခုလျှင် ကုန်ကျစရိတ်သည် ပုဂ္ဂိုလ်ရေးပိုင်မော်ဒယ်များထက် နည်းပါးသည်။ Generative AI အက်ပလီကေးရှင်းများ တည်ဆောက်ရာတွင် သင့်အသုံးပြုမှုအပေါ် မော်ဒယ်များ၏ စွမ်းဆောင်ရည်နှင့် စျေးနှုန်းကို နှိုင်းယှဉ်စဉ်းစားသင့်သည်။

Model Cost အရင်းအမြစ် - Artificial Analysis

တိုးတက်မှုနှင့် လွယ်ကူမှု - open models များနှင့်အတူ အမျိုးမျိုးသော မော်ဒယ်များကို အသုံးပြုခြင်း သို့မဟုတ် ပေါင်းစပ်အသုံးပြုခြင်းတို့တွင် လွယ်ကူမှုရှိသည်။ ဥပမာအနေဖြင့် HuggingChat Assistants တွင် အသုံးပြုသူသည် မော်ဒယ်ကို တိုက်ရိုက် အသုံးပြုသူအင်တာဖေ့စ်မှ ရွေးချယ်နိုင်သည်။

Choose Model

အမျိုးမျိုးသော Open Models များကို ရှာဖွေခြင်း

Llama 2

LLama2 သည် Meta မှ ဖန်တီးထားသော chat အခြေပြု အက်ပလီကေးရှင်းများအတွက် အထူးပြု open model ဖြစ်သည်။ ၎င်း၏ fine-tuning နည်းလမ်းမှာ လူနှင့် စကားပြောဆိုမှုများနှင့် လူ့တုံ့ပြန်ချက်များ အများအပြားပါဝင်သည်။ ဒီနည်းလမ်းကြောင့် မော်ဒယ်သည် လူ့မျှော်မှန်းချက်နှင့် ကိုက်ညီသော ရလဒ်များ ပိုမိုထုတ်ပေးနိုင်ပြီး အသုံးပြုသူအတွေ့အကြုံကို တိုးတက်စေသည်။

Llama ၏ fine-tuned ဥပမာများမှာ Japanese Llama (ဂျပန်ဘာသာအထူးပြု) နှင့် Llama Pro (မူလမော်ဒယ်၏ တိုးတက်မြှင့်တင်ထားသော ဗားရှင်း) တို့ ဖြစ်သည်။

Mistral

Mistral သည် မြင့်မားသော စွမ်းဆောင်ရည်နှင့် ထိရောက်မှုကို အထူးအာရုံစိုက်ထားသော open model ဖြစ်သည်။ Mixture-of-Experts နည်းလမ်းကို အသုံးပြုသည်။ ၎င်းသည် အထူးပြုကျွမ်းကျင်သူ မော်ဒယ်အုပ်စုများကို ပေါင်းစပ်ထားပြီး၊ input အပေါ်မူတည်၍ သတ်မှတ်ထားသော မော်ဒယ်များကိုသာ အသုံးပြုသည်။ ဒီနည်းလမ်းကြောင့် ကွန်ပျူတာတွက်ချက်မှု ပိုမိုထိရောက်စေသည်။

Mistral ၏ fine-tuned ဥပမာများမှာ ဆေးဘက်ဆိုင်ရာအထူးပြု BioMistral နှင့် သင်္ချာဆိုင်ရာတွက်ချက်မှုလုပ်ဆောင်နိုင်သော OpenMath Mistral တို့ ဖြစ်သည်။

Falcon

Falcon သည် Technology Innovation Institute (TII) မှ ဖန်တီးထားသော LLM ဖြစ်သည်။ Falcon-40B သည် ၄၀ ဘီလီယံ ပါရာမီတာဖြင့် လေ့ကျင့်ထားပြီး GPT-3 ထက် ကွန်ပျူတာစွမ်းအားသုံးစွဲမှုနည်းပြီး ပိုမိုကောင်းမွန်သော စွမ်းဆောင်ရည် ပြသနိုင်သည်။ ၎င်းသည် FlashAttention အယ်လဂိုရီသမ်နှင့် multiquery attention ကို အသုံးပြုခြင်းကြောင့် inference အချိန်တွင် မှတ်ဉာဏ်လိုအပ်ချက်များ လျော့နည်းစေသည်။ inference အချိန်လျော့နည်းမှုကြောင့် Falcon-40B သည် chat အက်ပလီကေးရှင်းများအတွက် သင့်တော်သည်။

Falcon ၏ fine-tuned ဥပမာများမှာ open models အပေါ် တည်ဆောက်ထားသော အကူအညီပေး OpenAssistant နှင့် မူလမော်ဒယ်ထက် ပိုမိုကောင်းမွန်သော စွမ်းဆောင်ရည်ရှိသော GPT4ALL တို့ ဖြစ်သည်။

မည်သို့ ရွေးချယ်မည်နည်း

open model ရွေးချယ်ရာတွင် တစ်ခုတည်းသော ဖြေရှင်းချက်မရှိပါ။ စတင်ရန်ကောင်းသော နေရာတစ်ခုမှာ Azure AI Studio ၏ task အလိုက် စစ်ထုတ်ခြင်းဖြစ်သည်။ ၎င်းက မော်ဒယ်သည် မည်သည့်အလုပ်အမျိုးအစားများအတွက် လေ့ကျင့်ထားသည်ကို နားလည်ရန် ကူညီပေးသည်။ Hugging Face မှလည်း LLM Leaderboard ကို ထိန်းသိမ်းထားပြီး သတ်မှတ်ချက်အရ အကောင်းဆုံး စွမ်းဆောင်ရည်ရှိသော မော်ဒယ်များကို ပြသသည်။

အမျိုးမျိုးသော LLM များကို နှိုင်းယှဉ်လိုပါက Artificial Analysis သည် ထူးခြားသော အရင်းအမြစ်တစ်ခုဖြစ်သည်။

Model Quality အရင်းအမြစ် - Artificial Analysis

သီးသန့်အသုံးပြုမှုအတွက် အထူးပြု fine-tuned ဗားရှင်းများကို ရှာဖွေခြင်းကောင်းသည်။ သင့်နှင့် သင့်အသုံးပြုသူများ၏ မျှော်မှန်းချက်များအရ မော်ဒယ်များစွာကို စမ်းသပ်ကြည့်ခြင်းလည်း ကောင်းမွန်သော လေ့လာမှုဖြစ်သည်။

နောက်တစ်ဆင့်များ

open models ၏ အကောင်းဆုံး အချက်မှာ အလျင်အမြန် စတင်အသုံးပြုနိုင်ခြင်းဖြစ်သည်။ ဒီမှာ ဆွေးနွေးထားသော မော်ဒယ်များပါဝင်သော Hugging Face စုစည်းမှုတစ်ခုပါဝင်သော Azure AI Studio Model Catalog ကို ကြည့်ရှုနိုင်ပါသည်။

သင်ယူခြင်းသည် ဒီမှာ မပြီးဆုံးပါ၊ ခရီးကို ဆက်လက်သွားပါ

ဒီသင်ခန်းစာပြီးဆုံးပြီးနောက်၊ ကျွန်ုပ်တို့၏ Generative AI Learning collection ကို ကြည့်ရှု၍ Generative AI အကြောင်း သိမြင်မှုကို ပိုမိုမြှင့်တင်နိုင်ပါသည်။

အကြောင်းကြားချက်
ဤစာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု Co-op Translator ဖြင့် ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှန်ကန်မှုအတွက် ကြိုးစားသော်လည်း အလိုအလျောက် ဘာသာပြန်ခြင်းတွင် အမှားများ သို့မဟုတ် မှားယွင်းချက်များ ပါဝင်နိုင်ကြောင်း သတိပြုပါရန် မေတ္တာရပ်ခံအပ်ပါသည်။ မူရင်းစာတမ်းကို မိမိဘာသာစကားဖြင့်သာ တရားဝင်အချက်အလက်အဖြစ် ယူဆသင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူ့ဘာသာပြန်ပညာရှင်မှ ဘာသာပြန်ခြင်းကို အကြံပြုပါသည်။ ဤဘာသာပြန်ချက်ကို အသုံးပြုရာမှ ဖြစ်ပေါ်လာနိုင်သည့် နားလည်မှုမှားယွင်းမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။