اوپن سورس LLMs کی دنیا دلچسپ اور مسلسل ترقی پذیر ہے۔ یہ سبق اوپن سورس ماڈلز کا تفصیلی جائزہ فراہم کرنے کا مقصد رکھتا ہے۔ اگر آپ یہ جاننا چاہتے ہیں کہ پروپرائٹری ماڈلز اوپن سورس ماڈلز کے مقابلے میں کیسے ہیں، تو "Exploring and Comparing Different LLMs" سبق دیکھیں۔ اس سبق میں fine-tuning کا موضوع بھی شامل ہے، لیکن اس کی مزید تفصیل "Fine-Tuning LLMs" سبق میں ملے گی۔
- اوپن سورس ماڈلز کی سمجھ حاصل کرنا
- اوپن سورس ماڈلز کے ساتھ کام کرنے کے فوائد کو سمجھنا
- Hugging Face اور Azure AI Studio پر دستیاب اوپن ماڈلز کو دریافت کرنا
اوپن سورس سافٹ ویئر نے مختلف شعبوں میں ٹیکنالوجی کی ترقی میں اہم کردار ادا کیا ہے۔ Open Source Initiative (OSI) نے سافٹ ویئر کے لیے 10 معیارات متعین کیے ہیں تاکہ اسے اوپن سورس قرار دیا جا سکے۔ سورس کوڈ کو OSI کی منظور شدہ لائسنس کے تحت کھلے عام شیئر کیا جانا چاہیے۔
اگرچہ LLMs کی ترقی سافٹ ویئر کی ترقی سے مشابہت رکھتی ہے، لیکن یہ عمل بالکل ایک جیسا نہیں ہے۔ اس وجہ سے کمیونٹی میں LLMs کے سیاق و سباق میں اوپن سورس کی تعریف پر کافی بحث ہوئی ہے۔ روایتی اوپن سورس تعریف کے مطابق، ایک ماڈل کے لیے درج ذیل معلومات عوامی طور پر دستیاب ہونی چاہئیں:
- ماڈل کی تربیت کے لیے استعمال ہونے والے ڈیٹا سیٹس
- تربیت کے دوران مکمل ماڈل ویٹس
- تشخیصی کوڈ
- fine-tuning کا کوڈ
- مکمل ماڈل ویٹس اور تربیتی میٹرکس
اس معیار پر پورا اترنے والے صرف چند ماڈلز موجود ہیں۔ Allen Institute for Artificial Intelligence (AllenAI) کا OLMo ماڈل اس زمرے میں آتا ہے۔
اس سبق میں، ہم ماڈلز کو "اوپن ماڈلز" کہیں گے کیونکہ ممکن ہے کہ تحریر کے وقت وہ مذکورہ معیار پر پورے نہ اترتے ہوں۔
بہت زیادہ حسب ضرورت - چونکہ اوپن ماڈلز تفصیلی تربیتی معلومات کے ساتھ جاری کیے جاتے ہیں، محققین اور ڈویلپرز ماڈل کے اندرونی حصوں میں ترمیم کر سکتے ہیں۔ اس سے خاص کام یا مطالعے کے شعبے کے لیے ماہر ماڈلز بنانے کی سہولت ملتی ہے۔ اس کی مثالیں کوڈ جنریشن، ریاضیاتی عملیات اور حیاتیات ہیں۔
لاگت - ان ماڈلز کے استعمال اور تعیناتی کی فی ٹوکن لاگت پروپرائٹری ماڈلز کے مقابلے میں کم ہوتی ہے۔ جب Generative AI ایپلیکیشنز بنائی جائیں، تو اپنے استعمال کے کیس کے لیے کارکردگی اور قیمت کا موازنہ کرنا ضروری ہے۔
لچک - اوپن ماڈلز کے ساتھ کام کرنے سے آپ مختلف ماڈلز استعمال کرنے یا انہیں ملانے میں لچکدار ہوتے ہیں۔ اس کی مثال HuggingChat Assistants ہے جہاں صارف براہ راست یوزر انٹرفیس میں ماڈل منتخب کر سکتا ہے:
LLama2، جو میٹا نے تیار کیا ہے، ایک اوپن ماڈل ہے جو چیٹ پر مبنی ایپلیکیشنز کے لیے بہتر بنایا گیا ہے۔ اس کی fine-tuning کی تکنیک میں بڑی مقدار میں مکالمہ اور انسانی فیڈبیک شامل ہے۔ اس طریقے سے ماڈل ایسے نتائج دیتا ہے جو انسانی توقعات کے زیادہ قریب ہوتے ہیں، جس سے صارف کا تجربہ بہتر ہوتا ہے۔
Llama کے fine-tuned ورژنز کی مثالیں ہیں Japanese Llama جو جاپانی زبان میں مہارت رکھتا ہے، اور Llama Pro جو بنیادی ماڈل کا بہتر ورژن ہے۔
Mistral ایک اوپن ماڈل ہے جو اعلی کارکردگی اور مؤثریت پر زور دیتا ہے۔ یہ Mixture-of-Experts طریقہ استعمال کرتا ہے، جس میں ماہر ماڈلز کا ایک گروپ ایک نظام میں ملایا جاتا ہے، جہاں ان پٹ کے مطابق مخصوص ماڈلز منتخب کیے جاتے ہیں۔ اس سے کمپیوٹیشن زیادہ مؤثر ہو جاتی ہے کیونکہ ماڈلز صرف ان ان پٹس کو ہینڈل کرتے ہیں جن میں وہ ماہر ہوتے ہیں۔
Mistral کے fine-tuned ورژنز کی مثالیں ہیں BioMistral جو طبی شعبے پر مرکوز ہے، اور OpenMath Mistral جو ریاضیاتی حساب کتاب کرتا ہے۔
Falcon ایک LLM ہے جو Technology Innovation Institute (TII) نے بنایا ہے۔ Falcon-40B کو 40 ارب پیرامیٹرز پر تربیت دی گئی ہے، جس نے کم کمپیوٹ بجٹ کے ساتھ GPT-3 سے بہتر کارکردگی دکھائی ہے۔ یہ FlashAttention الگورتھم اور multiquery attention کے استعمال کی بدولت ممکن ہوا ہے، جو inference کے وقت میموری کی ضرورت کو کم کرتا ہے۔ اس کم inference وقت کی وجہ سے Falcon-40B چیٹ ایپلیکیشنز کے لیے موزوں ہے۔
Falcon کے fine-tuned ورژنز کی مثالیں ہیں OpenAssistant، جو اوپن ماڈلز پر مبنی ایک اسسٹنٹ ہے، اور GPT4ALL جو بنیادی ماڈل سے بہتر کارکردگی فراہم کرتا ہے۔
اوپن ماڈل منتخب کرنے کا کوئی واحد جواب نہیں ہے۔ شروع کرنے کے لیے Azure AI Studio کے filter by task فیچر کا استعمال کریں۔ یہ آپ کو سمجھنے میں مدد دے گا کہ ماڈل کو کس قسم کے کاموں کے لیے تربیت دی گئی ہے۔ Hugging Face بھی ایک LLM Leaderboard رکھتا ہے جو مخصوص میٹرکس کی بنیاد پر بہترین کارکردگی دکھانے والے ماڈلز کو ظاہر کرتا ہے۔
مختلف اقسام کے LLMs کا موازنہ کرنے کے لیے Artificial Analysis ایک اور بہترین ذریعہ ہے:
اگر آپ کسی خاص استعمال کے کیس پر کام کر رہے ہیں، تو اسی شعبے پر مرکوز fine-tuned ورژنز تلاش کرنا مؤثر ہو سکتا ہے۔ متعدد اوپن ماڈلز کے ساتھ تجربہ کرنا اور دیکھنا کہ وہ آپ اور آپ کے صارفین کی توقعات کے مطابق کیسے کارکردگی دکھاتے ہیں، ایک اچھی مشق ہے۔
اوپن ماڈلز کی سب سے اچھی بات یہ ہے کہ آپ ان کے ساتھ کام شروع کر سکتے ہیں بہت جلدی۔ Azure AI Studio Model Catalog دیکھیں، جس میں Hugging Face کا ایک خاص مجموعہ شامل ہے جس میں وہ ماڈلز شامل ہیں جن پر ہم نے یہاں بات کی ہے۔
اس سبق کو مکمل کرنے کے بعد، ہمارے Generative AI Learning collection کو دیکھیں تاکہ آپ اپنی Generative AI کی معلومات کو مزید بڑھا سکیں!
دستخطی نوٹ:
یہ دستاویز AI ترجمہ سروس Co-op Translator کے ذریعے ترجمہ کی گئی ہے۔ اگرچہ ہم درستگی کے لیے کوشاں ہیں، براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستیاں ہو سکتی ہیں۔ اصل دستاویز اپنی مادری زبان میں ہی معتبر ماخذ سمجھی جانی چاہیے۔ اہم معلومات کے لیے پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کی ذمہ داری ہم پر عائد نہیں ہوتی۔



