အခွင့်အရေးပေးထားသော LLM များ၏ကမ္ဘာသည် စိတ်လှုပ်ရှားဖွယ်ကောင်းပြီး အမြဲတမ်းတိုးတက်နေသည်။ ဒီသင်ခန်းစာမှာ အခွင့်အရေးပေးထားသော မော်ဒယ်များကို အနက်အနက်ရှင်းလင်းဖော်ပြပေးရန် ရည်ရွယ်ထားသည်။ အခွင့်အရေးပေးထားသော မော်ဒယ်များနှင့် ပိုင်ဆိုင်မှုရှိသော မော်ဒယ်များကို နှိုင်းယှဉ်ကြည့်လိုပါက "LLM များကို ရှာဖွေခြင်းနှင့် နှိုင်းယှဉ်ခြင်း" သင်ခန်းစာ ကို သွားကြည့်ပါ။ ဒီသင်ခန်းစာမှာ Fine-Tuning အကြောင်းကိုလည်း ဖော်ပြပေးမည်ဖြစ်ပြီး အကြမ်းဖျင်းရှင်းလင်းချက်များကို "Fine-Tuning LLMs" သင်ခန်းစာ မှာ ရှာဖွေကြည့်နိုင်ပါသည်။
- အခွင့်အရေးပေးထားသော မော်ဒယ်များကို နားလည်မှုရရှိခြင်း
- အခွင့်အရေးပေးထားသော မော်ဒယ်များနှင့်အလုပ်လုပ်ခြင်း၏ အကျိုးကျေးဇူးများကို နားလည်ခြင်း
- Hugging Face နှင့် Azure AI Studio တွင် ရရှိနိုင်သော အခွင့်အရေးပေးထားသော မော်ဒယ်များကို ရှာဖွေခြင်း
အခွင့်အရေးပေးထားသော ဆော့ဖ်ဝဲသည် နည်းပညာတိုးတက်မှုတွင် အရေးပါသော အခန်းကဏ္ဍတစ်ခုကို ထည့်သွင်းပေးခဲ့သည်။ Open Source Initiative (OSI) သည် ဆော့ဖ်ဝဲအတွက် ၁၀ ခုသော အချက်များ ကို သတ်မှတ်ထားပြီး အခွင့်အရေးပေးထားသော ဆော့ဖ်ဝဲအဖြစ် သတ်မှတ်ရန်လိုအပ်သည်။ Source code ကို OSI မှ အတည်ပြုထားသော လိုင်စင်အောက်တွင် ဖွင့်လှစ်မျှဝေထားရမည်။
LLM များကို ဖွံ့ဖြိုးတိုးတက်စေရန် ဆော့ဖ်ဝဲဖွံ့ဖြိုးတိုးတက်မှုနည်းလမ်းများနှင့် ဆင်တူသော အချက်များရှိသော်လည်း လုပ်ငန်းစဉ်မှာ တိတိကျကျတူညီမှုမရှိပါ။ ဒါကြောင့် LLM များ၏ အခွင့်အရေးပေးထားမှုကို သတ်မှတ်ခြင်းအပေါ် လူမှုအသိုင်းအဝိုင်းတွင် ဆွေးနွေးမှုများ ဖြစ်ပေါ်လာခဲ့သည်။ မော်ဒယ်တစ်ခုသည် အခွင့်အရေးပေးထားသော ဆော့ဖ်ဝဲ၏ ရိုးရာအဓိပ္ပါယ်နှင့် ကိုက်ညီရန် အောက်ပါအချက်အလက်များကို အများပြည်သူသို့ မျှဝေထားရမည်-
- မော်ဒယ်ကို လေ့ကျင့်ရန် အသုံးပြုသော ဒေတာများ။
- လေ့ကျင့်မှု၏ အစိတ်အပိုင်းတစ်ခုအနေဖြင့် မော်ဒယ်၏ အလေးချိန်များ။
- အကဲဖြတ်မှု code။
- Fine-tuning code။
- မော်ဒယ်၏ အလုံးစုံအလေးချိန်များနှင့် လေ့ကျင့်မှု metrics။
လက်ရှိတွင် ဒီအချက်များနှင့် ကိုက်ညီသော မော်ဒယ်များမှာ အနည်းငယ်သာ ရှိပါသည်။ Allen Institute for Artificial Intelligence (AllenAI) မှ ဖန်တီးထားသော OLMo မော်ဒယ် သည် ဒီအမျိုးအစားကို ကိုက်ညီသည်။
ဒီသင်ခန်းစာအတွက် မော်ဒယ်များကို "open models" ဟု ခေါ်ဆိုသွားမည်ဖြစ်ပြီး အချို့သောအချက်များကို လက်ရှိရေးသားချိန်တွင် မကိုက်ညီနိုင်ပါ။
အလွန်စိတ်ကြိုက်ပြုလုပ်နိုင်မှု - အခွင့်အရေးပေးထားသော မော်ဒယ်များသည် လေ့ကျင့်မှုအချက်အလက်များကို အသေးစိတ်ဖော်ပြထားသောကြောင့် သုတေသနလုပ်သူများနှင့် ဖွံ့ဖြိုးတိုးတက်မှုလုပ်ငန်းရှင်များသည် မော်ဒယ်၏ အတွင်းပိုင်းကို ပြောင်းလဲနိုင်သည်။ ဒါဟာ အထူးပြုလုပ်ထားသော မော်ဒယ်များကို ဖန်တီးရန် အခွင့်အလမ်းပေးပြီး အထူးလုပ်ငန်းတာဝန်များ သို့မဟုတ် သုတေသနဧရိယာများအတွက် အထူးပြုလုပ်ထားသည်။ ဥပမာအားဖြင့် code ဖန်တီးခြင်း၊ သင်္ချာဆိုင်ရာ လုပ်ဆောင်မှုများနှင့် ဇီဝဗေဒ။
ကုန်ကျစရိတ် - ဒီမော်ဒယ်များကို အသုံးပြုခြင်းနှင့် တပ်ဆင်ခြင်းအတွက် token တစ်ခုချင်းစီ၏ ကုန်ကျစရိတ်သည် ပိုင်ဆိုင်မှုရှိသော မော်ဒယ်များထက် ပိုမိုနည်းပါးသည်။ Generative AI အက်ပလီကေးရှင်းများ တည်ဆောက်ရာတွင် သင့်ရဲ့ အသုံးပြုမှုအပေါ် မော်ဒယ်များ၏ စွမ်းဆောင်ရည်နှင့် စျေးနှုန်းကို သုံးသပ်ရန် လိုအပ်ပါသည်။
အလွယ်တကူ ပြောင်းလွယ်ပြင်လွယ် - အခွင့်အရေးပေးထားသော မော်ဒယ်များနှင့်အလုပ်လုပ်ခြင်းသည် မော်ဒယ်အမျိုးမျိုးကို သုံးခြင်း သို့မဟုတ် ပေါင်းစပ်ခြင်းတွင် အလွယ်တကူ ပြောင်းလွယ်ပြင်လွယ် ဖြစ်စေသည်။ ဥပမာအားဖြင့် HuggingChat Assistants သည် အသုံးပြုသူများကို မော်ဒယ်ကို user interface တွင် တိုက်ရိုက်ရွေးချယ်နိုင်စေသည်-
Meta မှ ဖွံ့ဖြိုးတိုးတက်စေထားသော LLama2 သည် chat-based အက်ပလီကေးရှင်းများအတွက် အထူးပြုထားသော open model ဖြစ်သည်။ ဒါဟာ လေ့ကျင့်မှုနည်းလမ်းကြောင့်ဖြစ်ပြီး အများအပြားသော ဆွေးနွေးမှုများနှင့် လူသားများ၏ အကြံပြုချက်များကို ထည့်သွင်းထားသည်။ ဒီနည်းလမ်းကြောင့် မော်ဒယ်သည် လူသားများ၏ မျှော်လင့်ချက်နှင့် ကိုက်ညီသော ရလဒ်များကို ပိုမိုထုတ်လုပ်နိုင်ပြီး အသုံးပြုသူအတွေ့အကြုံကို ပိုမိုကောင်းမွန်စေသည်။
Llama ၏ Fine-tuned version များအနက် Japanese Llama သည် ဂျပန်ဘာသာစကားအတွက် အထူးပြုထားပြီး Llama Pro သည် base model ထက် ပိုမိုတိုးတက်စေထားသည်။
Mistral သည် စွမ်းဆောင်ရည်မြင့်မားမှုနှင့် ထိရောက်မှုကို အဓိကထားသော open model ဖြစ်သည်။ Mixture-of-Experts နည်းလမ်းကို အသုံးပြုထားပြီး အထူးပြုထားသော မော်ဒယ်များကို စနစ်တစ်ခုအတွင်း ပေါင်းစပ်ထားသည်။ input အပေါ်မူတည်၍ အချို့သော မော်ဒယ်များကို ရွေးချယ်အသုံးပြုသည်။ ဒါဟာ input များကို အထူးပြုထားသော မော်ဒယ်များသာ လုပ်ဆောင်သည့်အတွက် စက်ရုပ်လုပ်ဆောင်မှုကို ပိုမိုထိရောက်စေသည်။
Mistral ၏ Fine-tuned version များအနက် BioMistral သည် ဆေးဘက်ဆိုင်ရာဧရိယာအတွက် အထူးပြုထားပြီး OpenMath Mistral သည် သင်္ချာဆိုင်ရာ လုပ်ဆောင်မှုများကို ပြုလုပ်နိုင်သည်။
Falcon သည် Technology Innovation Institute (TII) မှ ဖန်တီးထားသော LLM ဖြစ်သည်။ Falcon-40B ကို 40 billion parameters ဖြင့် လေ့ကျင့်ထားပြီး GPT-3 ထက် compute budget နည်းပါးစွာ အသုံးပြု၍ ပိုမိုကောင်းမွန်သော စွမ်းဆောင်ရည်ကို ရရှိစေသည်။ ဒါဟာ FlashAttention algorithm နှင့် multiquery attention ကို အသုံးပြုထားသောကြောင့် ဖြစ်ပြီး inference အချိန်တွင် memory လိုအပ်ချက်များကို လျှော့ချနိုင်သည်။ ဒီလျှော့ချထားသော inference အချိန်ကြောင့် Falcon-40B သည် chat applications များအတွက် သင့်လျော်သည်။
Falcon ၏ Fine-tuned version များအနက် OpenAssistant သည် open models အပေါ် အခြေခံပြီး assistant တစ်ခုကို တည်ဆောက်ထားပြီး GPT4ALL သည် base model ထက် ပိုမိုမြင့်မားသော စွမ်းဆောင်ရည်ကို ပေးစွမ်းသည်။
open model ကို ရွေးချယ်ရန် တစ်ခုတည်းသော အဖြေမရှိပါ။ Azure AI Studio ၏ filter by task feature ကို အသုံးပြုခြင်းသည် မော်ဒယ်ကို ဘာအမျိုးအစား task များအတွက် လေ့ကျင့်ထားသည်ကို နားလည်ရန် ကောင်းသောနေရာဖြစ်သည်။ Hugging Face သည် LLM Leaderboard ကို ထိန်းသိမ်းထားပြီး အချို့သော metrics အပေါ် အခြေခံ၍ စွမ်းဆောင်ရည်အကောင်းဆုံး မော်ဒယ်များကို ပြသထားသည်။
LLM များကို အမျိုးအစားအလိုက် နှိုင်းယှဉ်ကြည့်ရန် Artificial Analysis သည် အခြားကောင်းမွန်သော အရင်းအမြစ်တစ်ခုဖြစ်သည်-
အထူးပြုလုပ်ထားသော version များကို ရှာဖွေခြင်းသည် သင့်ဧရိယာနှင့် ကိုက်ညီသော use case အတွက် ထိရောက်နိုင်သည်။ သင့်နှင့် သင့်အသုံးပြုသူများ၏ မျှော်လင့်ချက်များနှင့် ကိုက်ညီမှုအပေါ် open models များကို စမ်းသပ်ခြင်းသည် ကောင်းမွန်သော လေ့ကျင့်မှုတစ်ခုဖြစ်သည်။
open models တွင် အလွယ်တကူ စတင်လုပ်ဆောင်နိုင်သည်မှာ အကောင်းဆုံးဖြစ်သည်။ ဒီသင်ခန်းစာတွင် ဖော်ပြထားသော မော်ဒယ်များနှင့် Hugging Face collection ကို ထည့်သွင်းထားသော Azure AI Foundry Model Catalog ကို ကြည့်ရှုပါ။
ဒီသင်ခန်းစာကို ပြီးမြောက်ပြီးနောက် Generative AI Learning collection ကို ကြည့်ရှုပြီး Generative AI အသိပညာကို ဆက်လက်မြှင့်တင်ပါ!
အကြောင်းကြားချက်:
ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု Co-op Translator ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေသော်လည်း အလိုအလျောက် ဘာသာပြန်မှုများတွင် အမှားများ သို့မဟုတ် မမှန်ကန်မှုများ ပါဝင်နိုင်သည်ကို သတိပြုပါ။ မူရင်းဘာသာစကားဖြင့် ရေးသားထားသော စာရွက်စာတမ်းကို အာဏာတရားရှိသော အရင်းအမြစ်အဖြစ် သတ်မှတ်သင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူက ဘာသာပြန်မှုကို အကြံပြုပါသည်။ ဤဘာသာပြန်မှုကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအမှားများ သို့မဟုတ် အနားယူမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။



