generative-ai-for-beginners/translations/he/16-open-source-models/README.md at main · jarkalmar/generative-ai-for-beginners

מבוא

עולם ה-LLM בקוד פתוח מרגש ומתפתח כל הזמן. שיעור זה נועד לספק מבט מעמיק על מודלים בקוד פתוח. אם אתם מחפשים מידע על איך מודלים קנייניים משווים למודלים בקוד פתוח, עברו לשיעור "חקירת והשוואת מודלים שונים של LLM". שיעור זה יכסה גם את נושא ההתאמה המדויקת (fine-tuning) אך הסבר מפורט יותר ניתן למצוא בשיעור "התאמה מדויקת של LLMs".

מטרות הלמידה

לקבל הבנה של מודלים בקוד פתוח
להבין את היתרונות של עבודה עם מודלים בקוד פתוח
לחקור את המודלים הפתוחים הזמינים ב-Hugging Face וב-Azure AI Studio

מה הם מודלים בקוד פתוח?

תוכנה בקוד פתוח שיחקה תפקיד מרכזי בצמיחת הטכנולוגיה בתחומים שונים. יוזמת הקוד הפתוח (OSI) הגדירה 10 קריטריונים לתוכנה כדי שתסווג כקוד פתוח. קוד המקור חייב להיות משותף בפומבי תחת רישיון שאושר על ידי OSI.

בעוד שפיתוח LLMs כולל אלמנטים דומים לפיתוח תוכנה, התהליך אינו זהה במדויק. זה עורר דיון רב בקהילה לגבי הגדרת קוד פתוח בהקשר של LLMs. כדי שמודל יתאים להגדרה המסורתית של קוד פתוח, המידע הבא צריך להיות זמין לציבור:

מערכי נתונים ששימשו לאימון המודל.
משקלי המודל המלאים כחלק מהאימון.
קוד ההערכה.
קוד ההתאמה המדויקת (fine-tuning).
משקלי המודל המלאים ומדדי האימון.

כרגע קיימים רק כמה מודלים שעומדים בקריטריונים אלו. מודל OLMo שפותח על ידי מכון אלן לאינטליגנציה מלאכותית (AllenAI) הוא אחד שמתאים לקטגוריה זו.

בשיעור זה, נתייחס למודלים כ"מודלים פתוחים" מכיוון שהם עשויים לא להתאים לקריטריונים הנ"ל בזמן הכתיבה.

יתרונות של מודלים פתוחים

ניתנים להתאמה גבוהה - מכיוון שמודלים פתוחים משוחררים עם מידע מפורט על האימון, חוקרים ומפתחים יכולים לשנות את הפנימיות של המודל. זה מאפשר יצירת מודלים מתמחים מאוד המותאמים למשימה או תחום לימוד ספציפי. דוגמאות לכך הן יצירת קוד, פעולות מתמטיות וביולוגיה.

עלות - העלות לכל טוקן לשימוש ופריסה של מודלים אלו נמוכה יותר מזו של מודלים קנייניים. כאשר בונים יישומי AI גנרטיביים, יש לשקול את הביצועים מול המחיר בעת עבודה עם מודלים אלו במקרי השימוש שלכם.

מקור: Artificial Analysis

גמישות - עבודה עם מודלים פתוחים מאפשרת גמישות בשימוש במודלים שונים או בשילוב שלהם. דוגמה לכך היא עוזרי HuggingChat שבה המשתמש יכול לבחור את המודל בשימוש ישירות בממשק המשתמש:

חקירת מודלים פתוחים שונים

Llama 2

LLama2, שפותח על ידי Meta, הוא מודל פתוח המותאם ליישומי שיחה. זאת בזכות שיטת ההתאמה המדויקת שלו, שכללה כמות גדולה של דיאלוג ומשוב אנושי. בשיטה זו, המודל מפיק תוצאות המותאמות יותר לציפיות האנושיות ומספק חוויית משתמש טובה יותר.

דוגמאות לגרסאות מותאמות של Llama כוללות את Japanese Llama, שמתמחה ביפנית, ו-Llama Pro, שהיא גרסה משופרת של המודל הבסיסי.

Mistral

Mistral הוא מודל פתוח עם דגש חזק על ביצועים גבוהים ויעילות. הוא משתמש בגישת Mixture-of-Experts שמשלבת קבוצת מודלים מומחים מתמחים למערכת אחת שבה בהתאם לקלט, נבחרים מודלים מסוימים לשימוש. זה הופך את החישוב ליעיל יותר כי המודלים מתמקדים רק בקלטים שבהם הם מתמחים.

דוגמאות לגרסאות מותאמות של Mistral כוללות את BioMistral, שמתמקד בתחום הרפואי, ו-OpenMath Mistral, שמבצע חישובים מתמטיים.

Falcon

Falcon הוא LLM שפותח על ידי Technology Innovation Institute (TII). ה-Falcon-40B אומן על 40 מיליארד פרמטרים שהוכח כי הוא מבצע טוב יותר מ-GPT-3 עם תקציב חישוב נמוך יותר. זאת בזכות השימוש באלגוריתם FlashAttention ובתשומת לב מרובת שאילתות שמאפשרים לו להפחית את דרישות הזיכרון בזמן ההסקה. בזכות זמן ההסקה המופחת, ה-Falcon-40B מתאים ליישומי שיחה.

דוגמאות לגרסאות מותאמות של Falcon הן OpenAssistant, עוזר שנבנה על מודלים פתוחים, ו-GPT4ALL, שמספק ביצועים גבוהים יותר מהמודל הבסיסי.

איך לבחור

אין תשובה אחת לבחירת מודל פתוח. מקום טוב להתחיל הוא להשתמש בפילטר לפי משימה ב-Azure AI Studio. זה יעזור לכם להבין לאילו סוגי משימות המודל אומן. Hugging Face גם מחזיקה בלוח מובילים של LLM שמראה את המודלים הטובים ביותר לפי מדדים מסוימים.

כשמחפשים להשוות LLMs בין סוגים שונים, Artificial Analysis הוא משאב מצוין נוסף:

מקור: Artificial Analysis

אם עובדים על מקרה שימוש ספציפי, חיפוש גרסאות מותאמות שמתמקדות באותו תחום יכול להיות יעיל. ניסוי עם מספר מודלים פתוחים כדי לראות איך הם מתפקדים לפי הציפיות שלכם ושל המשתמשים הוא גם פרקטיקה טובה.

צעדים הבאים

החלק הטוב במודלים פתוחים הוא שניתן להתחיל לעבוד איתם די מהר. בדקו את קטלוג המודלים של Azure AI Foundry, שמציג אוסף ספציפי של Hugging Face עם המודלים שדיברנו עליהם כאן.

הלמידה לא נעצרת כאן, המשיכו את המסע

לאחר שסיימתם את השיעור הזה, בדקו את אוסף הלמידה של AI גנרטיבי שלנו כדי להמשיך לשפר את הידע שלכם ב-AI גנרטיבי!

כתב ויתור:
מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית Co-op Translator. למרות שאנו שואפים לדיוק, יש לקחת בחשבון כי תרגומים אוטומטיים עלולים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפת המקור שלו נחשב למקור הסמכותי. למידע קריטי מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. אנו לא נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

מבוא

מטרות הלמידה

מה הם מודלים בקוד פתוח?

יתרונות של מודלים פתוחים

חקירת מודלים פתוחים שונים

Llama 2

Mistral

Falcon

איך לבחור

צעדים הבאים

הלמידה לא נעצרת כאן, המשיכו את המסע

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

מבוא

מטרות הלמידה

מה הם מודלים בקוד פתוח?

יתרונות של מודלים פתוחים

חקירת מודלים פתוחים שונים

Llama 2

Mistral

Falcon

איך לבחור

צעדים הבאים

הלמידה לא נעצרת כאן, המשיכו את המסע