עולם מודלי LLM בקוד פתוח הוא מרגש ומתפתח ללא הרף. שיעור זה נועד לספק מבט מעמיק על מודלים בקוד פתוח. אם אתם מחפשים מידע על ההשוואה בין מודלים קנייניים למודלים בקוד פתוח, עברו לשיעור "חקר והשוואת מודלי LLM שונים". שיעור זה יעסוק גם בנושא כיוונון עדין, אך הסבר מפורט יותר ניתן למצוא בשיעור "כיוונון עדין של LLMs".
- להבין את מודלי הקוד הפתוח
- להבין את היתרונות של עבודה עם מודלי קוד פתוח
- לחקור את המודלים הפתוחים הזמינים ב-Hugging Face וב-Azure AI Studio
תוכנה בקוד פתוח מילאה תפקיד מרכזי בצמיחת הטכנולוגיה בתחומים שונים. יוזמת הקוד הפתוח (OSI) הגדירה 10 קריטריונים לתוכנה כדי להיות מסווגת כקוד פתוח. קוד המקור חייב להיות משותף באופן פתוח תחת רישיון שאושר על ידי OSI.
בעוד שפיתוח מודלי LLM כולל אלמנטים דומים לפיתוח תוכנה, התהליך אינו זהה לחלוטין. הדבר עורר דיון רב בקהילה על הגדרת הקוד הפתוח בהקשר של LLMs. כדי שמודל יתאים להגדרה המסורתית של קוד פתוח, המידע הבא צריך להיות זמין לציבור:
- מערכי הנתונים ששימשו לאימון המודל.
- משקלי המודל המלאים כחלק מהאימון.
- קוד ההערכה.
- קוד הכיוונון העדין.
- משקלי המודל המלאים ומדדי האימון.
כיום ישנם רק מעט מודלים שעומדים בקריטריונים הללו. מודל OLMo שנוצר על ידי מכון אלן לאינטליגנציה מלאכותית (AllenAI) הוא אחד שמתאים לקטגוריה זו.
בשיעור זה, נתייחס למודלים כ"מודלים פתוחים" מעתה ואילך, שכן ייתכן שהם אינם עומדים בקריטריונים הנ"ל בזמן כתיבת השיעור.
ניתנים להתאמה אישית גבוהה - מכיוון שמודלים פתוחים משוחררים עם מידע מפורט על האימון, חוקרים ומפתחים יכולים לשנות את המודל מבפנים. הדבר מאפשר יצירת מודלים מותאמים במיוחד למשימה או תחום מחקר מסוים. דוגמאות לכך כוללות יצירת קוד, פעולות מתמטיות וביולוגיה.
עלות - העלות לכל טוקן בשימוש ובפריסה של מודלים אלו נמוכה יותר מזו של מודלים קנייניים. בעת בניית יישומי AI גנרטיביים, יש לבחון את הביצועים מול המחיר בהתאם למקרה השימוש שלכם.
גמישות - עבודה עם מודלים פתוחים מאפשרת גמישות בשימוש במודלים שונים או בשילוב ביניהם. דוגמה לכך היא HuggingChat Assistants, שבה המשתמש יכול לבחור את המודל שבו נעשה שימוש ישירות בממשק המשתמש:
LLama2, שפותח על ידי Meta, הוא מודל פתוח שמותאם ליישומים מבוססי צ'אט. זאת בזכות שיטת הכיוונון העדין שלו, שכללה כמות גדולה של דיאלוגים ומשוב אנושי. בשיטה זו, המודל מייצר תוצאות שמתאימות יותר לציפיות אנושיות, מה שמספק חוויית משתמש טובה יותר.
דוגמאות לגרסאות כיוונון עדין של Llama כוללות Japanese Llama, שמתמחה ביפנית, ו-Llama Pro, שהיא גרסה משופרת של המודל הבסיסי.
Mistral הוא מודל פתוח שמתמקד בביצועים גבוהים ויעילות. הוא משתמש בגישת Mixture-of-Experts, שמשלבת קבוצת מודלים מומחים מיוחדים למערכת אחת שבה, בהתאם לקלט, מודלים מסוימים נבחרים לשימוש. הדבר הופך את החישוב ליעיל יותר, שכן המודלים מטפלים רק בקלטים שהם מתמחים בהם.
דוגמאות לגרסאות כיוונון עדין של Mistral כוללות BioMistral, שמתמקד בתחום הרפואי, ו-OpenMath Mistral, שמבצע חישובים מתמטיים.
Falcon הוא מודל LLM שנוצר על ידי מכון החדשנות הטכנולוגית (TII). Falcon-40B אומן על 40 מיליארד פרמטרים, מה שהוכח כיעיל יותר מ-GPT-3 עם תקציב חישוב נמוך יותר. זאת בזכות השימוש באלגוריתם FlashAttention ובתשומת לב מרובת שאילתות, שמאפשרים להפחית את דרישות הזיכרון בזמן ההסקה. עם זמן הסקה מופחת זה, Falcon-40B מתאים ליישומי צ'אט.
דוגמאות לגרסאות כיוונון עדין של Falcon כוללות את OpenAssistant, עוזר שנבנה על מודלים פתוחים, ו-GPT4ALL, שמספק ביצועים גבוהים יותר מהמודל הבסיסי.
אין תשובה אחת לבחירת מודל פתוח. מקום טוב להתחיל בו הוא שימוש בתכונת הסינון לפי משימה של Azure AI Studio. זה יעזור לכם להבין אילו סוגי משימות המודל אומן עבורן. Hugging Face גם מתחזקת לוח דירוג LLM שמראה את המודלים בעלי הביצועים הטובים ביותר על בסיס מדדים מסוימים.
כאשר מחפשים להשוות בין LLMs מסוגים שונים, Artificial Analysis הוא משאב נהדר נוסף:
אם עובדים על מקרה שימוש ספציפי, חיפוש גרסאות כיוונון עדין שמתמקדות באותו תחום יכול להיות יעיל. ניסוי עם מספר מודלים פתוחים כדי לראות כיצד הם מתפקדים בהתאם לציפיות שלכם ושל המשתמשים שלכם הוא גם פרקטיקה טובה.
החלק הטוב ביותר במודלים פתוחים הוא שניתן להתחיל לעבוד איתם די מהר. בדקו את קטלוג המודלים של Azure AI Foundry, שמציג אוסף ספציפי של Hugging Face עם המודלים שדיברנו עליהם כאן.
לאחר סיום השיעור, בדקו את אוסף הלמידה של AI גנרטיבי שלנו כדי להמשיך ולהעמיק את הידע שלכם ב-AI גנרטיבי!
כתב ויתור:
מסמך זה תורגם באמצעות שירות תרגום AI Co-op Translator. למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי אנושי. איננו אחראים לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.



