Skip to content

Latest commit

 

History

History
93 lines (56 loc) · 18.9 KB

File metadata and controls

93 lines (56 loc) · 18.9 KB

Open Source Models

အကျဉ်းချုပ်

အခွင့်အရေးပေးထားသော LLM များ၏ကမ္ဘာသည် စိတ်လှုပ်ရှားဖွယ်ကောင်းပြီး အမြဲတမ်းတိုးတက်နေသည်။ ဒီသင်ခန်းစာမှာ အခွင့်အရေးပေးထားသော မော်ဒယ်များကို အနက်အနက်ရှင်းလင်းဖော်ပြပေးရန် ရည်ရွယ်ထားသည်။ အခွင့်အရေးပေးထားသော မော်ဒယ်များနှင့် ပိုင်ဆိုင်မှုရှိသော မော်ဒယ်များကို နှိုင်းယှဉ်ကြည့်လိုပါက "LLM များကို ရှာဖွေခြင်းနှင့် နှိုင်းယှဉ်ခြင်း" သင်ခန်းစာ ကို သွားကြည့်ပါ။ ဒီသင်ခန်းစာမှာ Fine-Tuning အကြောင်းကိုလည်း ဖော်ပြပေးမည်ဖြစ်ပြီး အကြမ်းဖျင်းရှင်းလင်းချက်များကို "Fine-Tuning LLMs" သင်ခန်းစာ မှာ ရှာဖွေကြည့်နိုင်ပါသည်။

သင်ယူရမည့်ရည်မှန်းချက်များ

  • အခွင့်အရေးပေးထားသော မော်ဒယ်များကို နားလည်မှုရရှိခြင်း
  • အခွင့်အရေးပေးထားသော မော်ဒယ်များနှင့်အလုပ်လုပ်ခြင်း၏ အကျိုးကျေးဇူးများကို နားလည်ခြင်း
  • Hugging Face နှင့် Azure AI Studio တွင် ရရှိနိုင်သော အခွင့်အရေးပေးထားသော မော်ဒယ်များကို ရှာဖွေခြင်း

အခွင့်အရေးပေးထားသော မော်ဒယ်များဆိုတာဘာလဲ?

အခွင့်အရေးပေးထားသော ဆော့ဖ်ဝဲသည် နည်းပညာတိုးတက်မှုတွင် အရေးပါသော အခန်းကဏ္ဍတစ်ခုကို ထည့်သွင်းပေးခဲ့သည်။ Open Source Initiative (OSI) သည် ဆော့ဖ်ဝဲအတွက် ၁၀ ခုသော အချက်များ ကို သတ်မှတ်ထားပြီး အခွင့်အရေးပေးထားသော ဆော့ဖ်ဝဲအဖြစ် သတ်မှတ်ရန်လိုအပ်သည်။ Source code ကို OSI မှ အတည်ပြုထားသော လိုင်စင်အောက်တွင် ဖွင့်လှစ်မျှဝေထားရမည်။

LLM များကို ဖွံ့ဖြိုးတိုးတက်စေရန် ဆော့ဖ်ဝဲဖွံ့ဖြိုးတိုးတက်မှုနည်းလမ်းများနှင့် ဆင်တူသော အချက်များရှိသော်လည်း လုပ်ငန်းစဉ်မှာ တိတိကျကျတူညီမှုမရှိပါ။ ဒါကြောင့် LLM များ၏ အခွင့်အရေးပေးထားမှုကို သတ်မှတ်ခြင်းအပေါ် လူမှုအသိုင်းအဝိုင်းတွင် ဆွေးနွေးမှုများ ဖြစ်ပေါ်လာခဲ့သည်။ မော်ဒယ်တစ်ခုသည် အခွင့်အရေးပေးထားသော ဆော့ဖ်ဝဲ၏ ရိုးရာအဓိပ္ပါယ်နှင့် ကိုက်ညီရန် အောက်ပါအချက်အလက်များကို အများပြည်သူသို့ မျှဝေထားရမည်-

  • မော်ဒယ်ကို လေ့ကျင့်ရန် အသုံးပြုသော ဒေတာများ။
  • လေ့ကျင့်မှု၏ အစိတ်အပိုင်းတစ်ခုအနေဖြင့် မော်ဒယ်၏ အလေးချိန်များ။
  • အကဲဖြတ်မှု code။
  • Fine-tuning code။
  • မော်ဒယ်၏ အလုံးစုံအလေးချိန်များနှင့် လေ့ကျင့်မှု metrics။

လက်ရှိတွင် ဒီအချက်များနှင့် ကိုက်ညီသော မော်ဒယ်များမှာ အနည်းငယ်သာ ရှိပါသည်။ Allen Institute for Artificial Intelligence (AllenAI) မှ ဖန်တီးထားသော OLMo မော်ဒယ် သည် ဒီအမျိုးအစားကို ကိုက်ညီသည်။

ဒီသင်ခန်းစာအတွက် မော်ဒယ်များကို "open models" ဟု ခေါ်ဆိုသွားမည်ဖြစ်ပြီး အချို့သောအချက်များကို လက်ရှိရေးသားချိန်တွင် မကိုက်ညီနိုင်ပါ။

အခွင့်အရေးပေးထားသော မော်ဒယ်များ၏ အကျိုးကျေးဇူးများ

အလွန်စိတ်ကြိုက်ပြုလုပ်နိုင်မှု - အခွင့်အရေးပေးထားသော မော်ဒယ်များသည် လေ့ကျင့်မှုအချက်အလက်များကို အသေးစိတ်ဖော်ပြထားသောကြောင့် သုတေသနလုပ်သူများနှင့် ဖွံ့ဖြိုးတိုးတက်မှုလုပ်ငန်းရှင်များသည် မော်ဒယ်၏ အတွင်းပိုင်းကို ပြောင်းလဲနိုင်သည်။ ဒါဟာ အထူးပြုလုပ်ထားသော မော်ဒယ်များကို ဖန်တီးရန် အခွင့်အလမ်းပေးပြီး အထူးလုပ်ငန်းတာဝန်များ သို့မဟုတ် သုတေသနဧရိယာများအတွက် အထူးပြုလုပ်ထားသည်။ ဥပမာအားဖြင့် code ဖန်တီးခြင်း၊ သင်္ချာဆိုင်ရာ လုပ်ဆောင်မှုများနှင့် ဇီဝဗေဒ။

ကုန်ကျစရိတ် - ဒီမော်ဒယ်များကို အသုံးပြုခြင်းနှင့် တပ်ဆင်ခြင်းအတွက် token တစ်ခုချင်းစီ၏ ကုန်ကျစရိတ်သည် ပိုင်ဆိုင်မှုရှိသော မော်ဒယ်များထက် ပိုမိုနည်းပါးသည်။ Generative AI အက်ပလီကေးရှင်းများ တည်ဆောက်ရာတွင် သင့်ရဲ့ အသုံးပြုမှုအပေါ် မော်ဒယ်များ၏ စွမ်းဆောင်ရည်နှင့် စျေးနှုန်းကို သုံးသပ်ရန် လိုအပ်ပါသည်။

Model Cost Source: Artificial Analysis

အလွယ်တကူ ပြောင်းလွယ်ပြင်လွယ် - အခွင့်အရေးပေးထားသော မော်ဒယ်များနှင့်အလုပ်လုပ်ခြင်းသည် မော်ဒယ်အမျိုးမျိုးကို သုံးခြင်း သို့မဟုတ် ပေါင်းစပ်ခြင်းတွင် အလွယ်တကူ ပြောင်းလွယ်ပြင်လွယ် ဖြစ်စေသည်။ ဥပမာအားဖြင့် HuggingChat Assistants သည် အသုံးပြုသူများကို မော်ဒယ်ကို user interface တွင် တိုက်ရိုက်ရွေးချယ်နိုင်စေသည်-

Choose Model

အခွင့်အရေးပေးထားသော မော်ဒယ်များကို ရှာဖွေခြင်း

Llama 2

Meta မှ ဖွံ့ဖြိုးတိုးတက်စေထားသော LLama2 သည် chat-based အက်ပလီကေးရှင်းများအတွက် အထူးပြုထားသော open model ဖြစ်သည်။ ဒါဟာ လေ့ကျင့်မှုနည်းလမ်းကြောင့်ဖြစ်ပြီး အများအပြားသော ဆွေးနွေးမှုများနှင့် လူသားများ၏ အကြံပြုချက်များကို ထည့်သွင်းထားသည်။ ဒီနည်းလမ်းကြောင့် မော်ဒယ်သည် လူသားများ၏ မျှော်လင့်ချက်နှင့် ကိုက်ညီသော ရလဒ်များကို ပိုမိုထုတ်လုပ်နိုင်ပြီး အသုံးပြုသူအတွေ့အကြုံကို ပိုမိုကောင်းမွန်စေသည်။

Llama ၏ Fine-tuned version များအနက် Japanese Llama သည် ဂျပန်ဘာသာစကားအတွက် အထူးပြုထားပြီး Llama Pro သည် base model ထက် ပိုမိုတိုးတက်စေထားသည်။

Mistral

Mistral သည် စွမ်းဆောင်ရည်မြင့်မားမှုနှင့် ထိရောက်မှုကို အဓိကထားသော open model ဖြစ်သည်။ Mixture-of-Experts နည်းလမ်းကို အသုံးပြုထားပြီး အထူးပြုထားသော မော်ဒယ်များကို စနစ်တစ်ခုအတွင်း ပေါင်းစပ်ထားသည်။ input အပေါ်မူတည်၍ အချို့သော မော်ဒယ်များကို ရွေးချယ်အသုံးပြုသည်။ ဒါဟာ input များကို အထူးပြုထားသော မော်ဒယ်များသာ လုပ်ဆောင်သည့်အတွက် စက်ရုပ်လုပ်ဆောင်မှုကို ပိုမိုထိရောက်စေသည်။

Mistral ၏ Fine-tuned version များအနက် BioMistral သည် ဆေးဘက်ဆိုင်ရာဧရိယာအတွက် အထူးပြုထားပြီး OpenMath Mistral သည် သင်္ချာဆိုင်ရာ လုပ်ဆောင်မှုများကို ပြုလုပ်နိုင်သည်။

Falcon

Falcon သည် Technology Innovation Institute (TII) မှ ဖန်တီးထားသော LLM ဖြစ်သည်။ Falcon-40B ကို 40 billion parameters ဖြင့် လေ့ကျင့်ထားပြီး GPT-3 ထက် compute budget နည်းပါးစွာ အသုံးပြု၍ ပိုမိုကောင်းမွန်သော စွမ်းဆောင်ရည်ကို ရရှိစေသည်။ ဒါဟာ FlashAttention algorithm နှင့် multiquery attention ကို အသုံးပြုထားသောကြောင့် ဖြစ်ပြီး inference အချိန်တွင် memory လိုအပ်ချက်များကို လျှော့ချနိုင်သည်။ ဒီလျှော့ချထားသော inference အချိန်ကြောင့် Falcon-40B သည် chat applications များအတွက် သင့်လျော်သည်။

Falcon ၏ Fine-tuned version များအနက် OpenAssistant သည် open models အပေါ် အခြေခံပြီး assistant တစ်ခုကို တည်ဆောက်ထားပြီး GPT4ALL သည် base model ထက် ပိုမိုမြင့်မားသော စွမ်းဆောင်ရည်ကို ပေးစွမ်းသည်။

မော်ဒယ်ရွေးချယ်ခြင်း

open model ကို ရွေးချယ်ရန် တစ်ခုတည်းသော အဖြေမရှိပါ။ Azure AI Studio ၏ filter by task feature ကို အသုံးပြုခြင်းသည် မော်ဒယ်ကို ဘာအမျိုးအစား task များအတွက် လေ့ကျင့်ထားသည်ကို နားလည်ရန် ကောင်းသောနေရာဖြစ်သည်။ Hugging Face သည် LLM Leaderboard ကို ထိန်းသိမ်းထားပြီး အချို့သော metrics အပေါ် အခြေခံ၍ စွမ်းဆောင်ရည်အကောင်းဆုံး မော်ဒယ်များကို ပြသထားသည်။

LLM များကို အမျိုးအစားအလိုက် နှိုင်းယှဉ်ကြည့်ရန် Artificial Analysis သည် အခြားကောင်းမွန်သော အရင်းအမြစ်တစ်ခုဖြစ်သည်-

Model Quality Source: Artificial Analysis

အထူးပြုလုပ်ထားသော version များကို ရှာဖွေခြင်းသည် သင့်ဧရိယာနှင့် ကိုက်ညီသော use case အတွက် ထိရောက်နိုင်သည်။ သင့်နှင့် သင့်အသုံးပြုသူများ၏ မျှော်လင့်ချက်များနှင့် ကိုက်ညီမှုအပေါ် open models များကို စမ်းသပ်ခြင်းသည် ကောင်းမွန်သော လေ့ကျင့်မှုတစ်ခုဖြစ်သည်။

နောက်တစ်ဆင့်

open models တွင် အလွယ်တကူ စတင်လုပ်ဆောင်နိုင်သည်မှာ အကောင်းဆုံးဖြစ်သည်။ ဒီသင်ခန်းစာတွင် ဖော်ပြထားသော မော်ဒယ်များနှင့် Hugging Face collection ကို ထည့်သွင်းထားသော Azure AI Foundry Model Catalog ကို ကြည့်ရှုပါ။

သင်ယူမှုသည် ဒီမှာပဲ ရပ်တန့်မည်မဟုတ်ပါ၊ ခရီးကို ဆက်လက်လုပ်ဆောင်ပါ

ဒီသင်ခန်းစာကို ပြီးမြောက်ပြီးနောက် Generative AI Learning collection ကို ကြည့်ရှုပြီး Generative AI အသိပညာကို ဆက်လက်မြှင့်တင်ပါ!


အကြောင်းကြားချက်:
ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု Co-op Translator ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေသော်လည်း အလိုအလျောက် ဘာသာပြန်မှုများတွင် အမှားများ သို့မဟုတ် မမှန်ကန်မှုများ ပါဝင်နိုင်သည်ကို သတိပြုပါ။ မူရင်းဘာသာစကားဖြင့် ရေးသားထားသော စာရွက်စာတမ်းကို အာဏာတရားရှိသော အရင်းအမြစ်အဖြစ် သတ်မှတ်သင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူက ဘာသာပြန်မှုကို အကြံပြုပါသည်။ ဤဘာသာပြန်မှုကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအမှားများ သို့မဟုတ် အနားယူမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။