Skip to content

Latest commit

 

History

History
95 lines (58 loc) · 10.7 KB

File metadata and controls

95 lines (58 loc) · 10.7 KB

نماذج المصدر المفتوح

مقدمة

عالم نماذج اللغة الكبيرة مفتوحة المصدر مثير ويتطور باستمرار. تهدف هذه الدرس إلى تقديم نظرة متعمقة على النماذج مفتوحة المصدر. إذا كنت تبحث عن معلومات حول كيفية مقارنة النماذج المملوكة بالنماذج مفتوحة المصدر، انتقل إلى درس "استكشاف ومقارنة نماذج اللغة الكبيرة المختلفة". كما سيغطي هذا الدرس موضوع الضبط الدقيق، لكن يمكن العثور على شرح أكثر تفصيلاً في درس "الضبط الدقيق لنماذج اللغة الكبيرة".

أهداف التعلم

  • اكتساب فهم لنماذج المصدر المفتوح
  • فهم فوائد العمل مع نماذج المصدر المفتوح
  • استكشاف النماذج المفتوحة المتاحة على Hugging Face واستوديو Azure AI

ما هي نماذج المصدر المفتوح؟

لعب البرمجيات مفتوحة المصدر دورًا حيويًا في نمو التكنولوجيا عبر مجالات مختلفة. قامت مبادرة المصدر المفتوح (OSI) بتعريف 10 معايير للبرمجيات لتصنيفها كمصدر مفتوح. يجب أن يتم مشاركة شفرة المصدر علنًا بموجب ترخيص معتمد من OSI.

بينما يحتوي تطوير نماذج اللغة الكبيرة على عناصر مشابهة لتطوير البرمجيات، فإن العملية ليست متطابقة تمامًا. وقد أثار هذا الكثير من النقاش في المجتمع حول تعريف المصدر المفتوح في سياق نماذج اللغة الكبيرة. لكي يتوافق النموذج مع التعريف التقليدي للمصدر المفتوح، يجب أن تكون المعلومات التالية متاحة للجمهور:

  • مجموعات البيانات المستخدمة لتدريب النموذج.
  • أوزان النموذج الكاملة كجزء من التدريب.
  • كود التقييم.
  • كود الضبط الدقيق.
  • أوزان النموذج الكاملة ومقاييس التدريب.

يوجد حاليًا عدد قليل فقط من النماذج التي تطابق هذه المعايير. نموذج OLMo الذي أنشأه معهد ألين للذكاء الاصطناعي (AllenAI) هو واحد من هذه الفئة.

لهذا الدرس، سنشير إلى النماذج باسم "النماذج المفتوحة" لأنّها قد لا تطابق المعايير أعلاه في وقت الكتابة.

فوائد النماذج المفتوحة

قابلة للتخصيص بدرجة عالية - نظرًا لأن النماذج المفتوحة تُصدر مع معلومات تدريب مفصلة، يمكن للباحثين والمطورين تعديل مكونات النموذج الداخلية. هذا يمكّن من إنشاء نماذج متخصصة للغاية يتم ضبطها بدقة لمهمة أو مجال دراسة معين. بعض الأمثلة على ذلك هي توليد الشيفرة، العمليات الرياضية، وعلم الأحياء.

التكلفة - تكلفة الاستخدام والنشر لكل رمز في هذه النماذج أقل من النماذج المملوكة. عند بناء تطبيقات الذكاء الاصطناعي التوليدي، يجب النظر في الأداء مقابل السعر عند العمل مع هذه النماذج على حالتك الخاصة.

تكلفة النموذج
المصدر: Artificial Analysis

المرونة - العمل مع النماذج المفتوحة يتيح لك المرونة من حيث استخدام نماذج مختلفة أو دمجها. مثال على ذلك هو مساعدي HuggingChat حيث يمكن للمستخدم اختيار النموذج المستخدم مباشرة من واجهة المستخدم:

اختيار النموذج

استكشاف نماذج مفتوحة مختلفة

Llama 2

LLama2، الذي طورته Meta، هو نموذج مفتوح مُحسّن لتطبيقات الدردشة. ويرجع ذلك إلى طريقة الضبط الدقيق التي شملت كمية كبيرة من الحوارات وردود الفعل البشرية. باستخدام هذه الطريقة، ينتج النموذج نتائج أكثر توافقًا مع توقعات البشر مما يوفر تجربة مستخدم أفضل.

بعض الأمثلة على نسخ Llama المضبوطة بدقة تشمل Japanese Llama، المتخصصة في اللغة اليابانية، وLlama Pro، وهي نسخة محسنة من النموذج الأساسي.

Mistral

Mistral هو نموذج مفتوح يركز بشدة على الأداء العالي والكفاءة. يستخدم نهج مزيج الخبراء الذي يجمع مجموعة من النماذج المتخصصة في نظام واحد حيث يتم اختيار نماذج معينة للاستخدام بناءً على الإدخال. هذا يجعل الحساب أكثر فعالية حيث تتعامل النماذج فقط مع المدخلات التي تتخصص فيها.

بعض الأمثلة على نسخ Mistral المضبوطة بدقة تشمل BioMistral، التي تركز على المجال الطبي، وOpenMath Mistral، التي تؤدي العمليات الحسابية الرياضية.

Falcon

Falcon هو نموذج لغة كبيرة أنشأه معهد الابتكار التكنولوجي (TII). تم تدريب Falcon-40B على 40 مليار معلمة وقد أظهر أداءً أفضل من GPT-3 مع ميزانية حسابية أقل. ويرجع ذلك إلى استخدامه لخوارزمية FlashAttention والانتباه متعدد الاستعلامات التي تمكنه من تقليل متطلبات الذاكرة أثناء الاستدلال. مع هذا الوقت المنخفض للاستدلال، فإن Falcon-40B مناسب لتطبيقات الدردشة.

بعض الأمثلة على نسخ Falcon المضبوطة بدقة هي OpenAssistant، مساعد مبني على نماذج مفتوحة، وGPT4ALL، الذي يقدم أداءً أعلى من النموذج الأساسي.

كيفية الاختيار

لا يوجد جواب واحد لاختيار نموذج مفتوح. مكان جيد للبدء هو استخدام ميزة التصفية حسب المهمة في استوديو Azure AI. هذا سيساعدك على فهم أنواع المهام التي تم تدريب النموذج عليها. كما يحتفظ Hugging Face بلوحة ترتيب لنماذج اللغة الكبيرة تُظهر أفضل النماذج أداءً بناءً على مقاييس معينة.

عند الرغبة في مقارنة نماذج اللغة الكبيرة عبر الأنواع المختلفة، يُعد Artificial Analysis مصدرًا رائعًا آخر:

جودة النموذج
المصدر: Artificial Analysis

إذا كنت تعمل على حالة استخدام محددة، فإن البحث عن نسخ مضبوطة بدقة تركز على نفس المجال يمكن أن يكون فعالًا. تجربة عدة نماذج مفتوحة لمعرفة كيف تؤدي وفقًا لتوقعاتك وتوقعات المستخدمين هي ممارسة جيدة أخرى.

الخطوات التالية

أفضل جزء في النماذج المفتوحة هو أنه يمكنك البدء في العمل معها بسرعة كبيرة. اطلع على كتالوج نماذج Azure AI Foundry، الذي يضم مجموعة محددة من Hugging Face مع هذه النماذج التي ناقشناها هنا.

التعلم لا يتوقف هنا، استمر في الرحلة

بعد إكمال هذا الدرس، اطلع على مجموعة تعلم الذكاء الاصطناعي التوليدي لمواصلة رفع مستوى معرفتك في الذكاء الاصطناعي التوليدي!


إخلاء المسؤولية:
تمت ترجمة هذا المستند باستخدام خدمة الترجمة الآلية Co-op Translator. بينما نسعى لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو عدم دقة. يجب اعتبار المستند الأصلي بلغته الأصلية المصدر الموثوق به. للمعلومات الهامة، يُنصح بالاعتماد على الترجمة البشرية المهنية. نحن غير مسؤولين عن أي سوء فهم أو تفسير ناتج عن استخدام هذه الترجمة.