Skip to content

Latest commit

 

History

History
91 lines (55 loc) · 10.8 KB

File metadata and controls

91 lines (55 loc) · 10.8 KB

نماذج مفتوحة المصدر

المقدمة

عالم نماذج LLM مفتوحة المصدر مثير ويتطور باستمرار. تهدف هذه الدرس إلى تقديم نظرة معمقة على نماذج مفتوحة المصدر. إذا كنت تبحث عن معلومات حول كيفية مقارنة النماذج الخاصة بالنماذج مفتوحة المصدر، انتقل إلى درس "استكشاف ومقارنة نماذج LLM المختلفة". ستغطي هذه الدرس أيضًا موضوع التخصيص، ولكن يمكن العثور على شرح أكثر تفصيلًا في درس "تخصيص نماذج LLM".

أهداف التعلم

  • فهم نماذج مفتوحة المصدر
  • فهم فوائد العمل مع نماذج مفتوحة المصدر
  • استكشاف النماذج المفتوحة المتاحة على Hugging Face وAzure AI Studio

ما هي نماذج مفتوحة المصدر؟

لعبت البرمجيات مفتوحة المصدر دورًا حاسمًا في نمو التكنولوجيا عبر مجالات مختلفة. وقد حددت مبادرة المصدر المفتوح (OSI) 10 معايير للبرمجيات لتصنيفها كمفتوحة المصدر. يجب مشاركة الشفرة المصدرية بشكل مفتوح تحت ترخيص معتمد من OSI.

بينما يتشابه تطوير نماذج LLM مع تطوير البرمجيات، إلا أن العملية ليست نفسها تمامًا. وقد أدى ذلك إلى الكثير من النقاش في المجتمع حول تعريف المصدر المفتوح في سياق نماذج LLM. لكي يتماشى النموذج مع التعريف التقليدي للمصدر المفتوح، يجب أن تكون المعلومات التالية متاحة للجمهور:

  • مجموعات البيانات المستخدمة لتدريب النموذج.
  • أوزان النموذج الكاملة كجزء من التدريب.
  • رمز التقييم.
  • رمز التخصيص.
  • أوزان النموذج الكاملة ومقاييس التدريب.

حاليًا، هناك عدد قليل فقط من النماذج التي تطابق هذه المعايير. النموذج OLMo الذي أنشأه معهد Allen للذكاء الاصطناعي (AllenAI) هو واحد من هذه الفئة.

لهذا الدرس، سنشير إلى النماذج على أنها "نماذج مفتوحة" للمضي قدمًا حيث قد لا تطابق المعايير المذكورة أعلاه في وقت الكتابة.

فوائد النماذج المفتوحة

قابلة للتخصيص بشكل كبير - نظرًا لأن النماذج المفتوحة تُصدر مع معلومات تدريب مفصلة، يمكن للباحثين والمطورين تعديل الأجزاء الداخلية للنموذج. هذا يتيح إنشاء نماذج متخصصة للغاية يتم تخصيصها لمهمة محددة أو مجال دراسي. بعض الأمثلة على ذلك هي توليد الشفرات، العمليات الرياضية والبيولوجيا.

التكلفة - تكلفة كل رمز لاستخدام ونشر هذه النماذج أقل من تكلفة النماذج الخاصة. عند بناء تطبيقات الذكاء الاصطناعي التوليدي، يجب النظر إلى الأداء مقابل السعر عند العمل مع هذه النماذج على حالتك.

تكلفة النموذج المصدر: التحليل الاصطناعي

المرونة - العمل مع النماذج المفتوحة يمكنك من أن تكون مرنًا من حيث استخدام نماذج مختلفة أو دمجها. مثال على ذلك هو مساعدي HuggingChat حيث يمكن للمستخدم اختيار النموذج المستخدم مباشرة في واجهة المستخدم:

اختر النموذج

استكشاف نماذج مفتوحة مختلفة

Llama 2

LLama2، الذي طورته Meta هو نموذج مفتوح محسن للتطبيقات القائمة على المحادثات. وذلك بسبب طريقة التخصيص الخاصة به، التي تضمنت كمية كبيرة من الحوارات وردود الفعل البشرية. باستخدام هذه الطريقة، ينتج النموذج نتائج أكثر توافقًا مع توقعات البشر مما يوفر تجربة مستخدم أفضل.

بعض الأمثلة على إصدارات Llama المحسنة تشمل Llama الياباني، الذي يتخصص في اللغة اليابانية وLlama Pro، وهو نسخة محسنة من النموذج الأساسي.

Mistral

Mistral هو نموذج مفتوح يركز بشكل كبير على الأداء العالي والكفاءة. يستخدم نهج مزيج من الخبراء الذي يجمع مجموعة من النماذج الخبيرة المتخصصة في نظام واحد حيث يتم اختيار نماذج معينة للاستخدام بناءً على المدخلات. هذا يجعل الحساب أكثر فعالية حيث تعالج النماذج فقط المدخلات التي تتخصص فيها.

بعض الأمثلة على إصدارات Mistral المحسنة تشمل BioMistral، الذي يركز على المجال الطبي وOpenMath Mistral، الذي يقوم بإجراء الحسابات الرياضية.

Falcon

Falcon هو نموذج LLM أنشأه معهد الابتكار التكنولوجي (TII). تم تدريب Falcon-40B على 40 مليار معلمة وقد أظهر أداءً أفضل من GPT-3 بميزانية حساب أقل. ويرجع ذلك إلى استخدامه لخوارزمية FlashAttention والانتباه متعدد الاستعلامات التي تمكنه من تقليل متطلبات الذاكرة في وقت الاستنتاج. مع هذا الوقت المستقطع للاستنتاج، يكون Falcon-40B مناسبًا لتطبيقات المحادثة.

بعض الأمثلة على إصدارات Falcon المحسنة تشمل OpenAssistant، وهو مساعد مبني على نماذج مفتوحة وGPT4ALL، الذي يوفر أداءً أعلى من النموذج الأساسي.

كيفية الاختيار

لا يوجد جواب واحد لاختيار النموذج المفتوح. مكان جيد للبدء هو استخدام ميزة تصفية حسب المهمة في Azure AI Studio. سيساعدك ذلك على فهم أنواع المهام التي تم تدريب النموذج عليها. كما يحافظ Hugging Face على لوحة قيادة LLM التي تعرض لك أفضل النماذج أداءً بناءً على مقاييس معينة.

عند النظر إلى مقارنة نماذج LLM عبر الأنواع المختلفة، التحليل الاصطناعي هو مورد رائع آخر:

جودة النموذج المصدر: التحليل الاصطناعي

إذا كنت تعمل على حالة استخدام محددة، فإن البحث عن إصدارات محسنة تركز على نفس المجال يمكن أن يكون فعالًا. تجربة نماذج مفتوحة متعددة لرؤية كيف تؤدي وفقًا لتوقعاتك وتوقعات مستخدميك هي ممارسة جيدة أخرى.

الخطوات التالية

أفضل جزء في النماذج المفتوحة هو أنك يمكنك البدء في العمل معها بسرعة كبيرة. تحقق من كتالوج نماذج Azure AI Studio، الذي يحتوي على مجموعة خاصة من Hugging Face مع هذه النماذج التي ناقشناها هنا.

التعلم لا يتوقف هنا، استمر في الرحلة

بعد إكمال هذا الدرس، تحقق من مجموعة تعلم الذكاء الاصطناعي التوليدي لتستمر في رفع مستوى معرفتك بالذكاء الاصطناعي التوليدي!

إخلاء المسؤولية:
تم ترجمة هذه الوثيقة باستخدام خدمة الترجمة بالذكاء الاصطناعي Co-op Translator. بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو عدم دقة. يجب اعتبار الوثيقة الأصلية بلغتها الأم المصدر الموثوق. للحصول على معلومات حيوية، يُوصى بالترجمة البشرية المهنية. نحن غير مسؤولين عن أي سوء فهم أو تفسير خاطئ ناتج عن استخدام هذه الترجمة.