Açık kaynak LLM dünyası heyecan verici ve sürekli gelişiyor. Bu ders, açık kaynak modellerine derinlemesine bir bakış sunmayı amaçlıyor. Eğer tescilli modellerin açık kaynak modellerle nasıl karşılaştırıldığı hakkında bilgi arıyorsanız, "Farklı LLM’leri Keşfetme ve Karşılaştırma" dersi sayfasına göz atabilirsiniz. Bu ders ayrıca ince ayar (fine-tuning) konusunu da ele alacak, ancak daha detaylı açıklama için "LLM’lerin İnce Ayarı" dersi incelenebilir.
- Açık kaynak Modelleri anlamak
- Açık kaynak Modellerle çalışmanın avantajlarını kavramak
- Hugging Face ve Azure AI Studio’da bulunan açık modelleri keşfetmek
Açık kaynak yazılım, çeşitli alanlarda teknolojinin gelişiminde önemli bir rol oynamıştır. Open Source Initiative (OSI), yazılımların açık kaynak olarak sınıflandırılması için 10 kriter belirlemiştir. Kaynak kodu, OSI tarafından onaylanmış bir lisans altında açıkça paylaşılmalıdır.
LLM geliştirme süreci yazılım geliştirmeye benzer unsurlar taşısa da tamamen aynı değildir. Bu durum, toplulukta LLM’ler bağlamında açık kaynak tanımının ne olduğu konusunda çokça tartışmaya yol açmıştır. Geleneksel açık kaynak tanımıyla uyumlu bir model için aşağıdaki bilgilerin kamuya açık olması gerekir:
- Modelin eğitildiği veri setleri.
- Eğitim sürecinin bir parçası olarak tam model ağırlıkları.
- Değerlendirme kodu.
- İnce ayar (fine-tuning) kodu.
- Tam model ağırlıkları ve eğitim metrikleri.
Şu anda bu kriterlere uyan sadece birkaç model bulunmaktadır. Allen Institute for Artificial Intelligence (AllenAI) tarafından oluşturulan OLMo modeli bu kategoriye uyan modellerden biridir.
Bu ders için, yazım anında yukarıdaki kriterlere tam uymayabilecekleri için modelleri “açık modeller” olarak adlandıracağız.
Yüksek Özelleştirilebilirlik - Açık modeller, detaylı eğitim bilgileriyle yayınlandığı için araştırmacılar ve geliştiriciler modelin iç yapısını değiştirebilir. Bu, belirli bir görev veya çalışma alanı için ince ayar yapılmış, yüksek derecede uzmanlaşmış modeller oluşturmayı mümkün kılar. Örnekler arasında kod üretimi, matematiksel işlemler ve biyoloji yer alır.
Maliyet - Bu modelleri kullanmanın ve dağıtmanın token başına maliyeti, tescilli modellere göre daha düşüktür. Üretken AI uygulamaları geliştirirken, kullanım durumunuza göre bu modellerle çalışırken performans ve fiyat dengesi göz önünde bulundurulmalıdır.
Esneklik - Açık modellerle çalışmak, farklı modelleri kullanma veya birleştirme konusunda esneklik sağlar. Örneğin, HuggingChat Asistanları kullanıcı arayüzünde doğrudan kullanılacak modeli seçme imkanı sunar:
LLama2, Meta tarafından geliştirilen, sohbet tabanlı uygulamalara optimize edilmiş bir açık modeldir. Bu, modelin büyük miktarda diyalog ve insan geri bildirimi içeren ince ayar yöntemi sayesinde mümkün olmuştur. Bu yöntemle model, insan beklentilerine daha uygun sonuçlar üretir ve daha iyi bir kullanıcı deneyimi sağlar.
Llama’nın ince ayar yapılmış bazı versiyonları arasında Japonca’ya odaklanan Japanese Llama ve temel modelin geliştirilmiş versiyonu olan Llama Pro yer alır.
Mistral, yüksek performans ve verimliliğe odaklanan açık bir modeldir. Mixture-of-Experts yaklaşımını kullanır; bu yöntem, uzmanlaşmış modellerden oluşan bir grubu tek bir sistemde birleştirir ve girdiye bağlı olarak belirli modeller seçilerek kullanılır. Bu sayede hesaplama daha etkili hale gelir çünkü modeller sadece uzman oldukları girdilerle ilgilenir.
Mistral’ın ince ayar yapılmış bazı versiyonları arasında tıp alanına odaklanan BioMistral ve matematiksel hesaplama yapan OpenMath Mistral bulunur.
Falcon, Technology Innovation Institute (TII) tarafından oluşturulan bir LLM’dir. Falcon-40B, 40 milyar parametre üzerinde eğitilmiştir ve daha az hesaplama bütçesiyle GPT-3’ten daha iyi performans gösterdiği kanıtlanmıştır. Bunun sebebi, FlashAttention algoritması ve çoklu sorgu dikkat mekanizması kullanarak çıkarım sırasında bellek gereksinimlerini azaltmasıdır. Bu azalmış çıkarım süresi sayesinde Falcon-40B sohbet uygulamaları için uygundur.
Falcon’un ince ayar yapılmış bazı versiyonları arasında açık modeller üzerine inşa edilmiş bir asistan olan OpenAssistant ve temel modelden daha yüksek performans sunan GPT4ALL yer alır.
Açık model seçmek için tek bir doğru cevap yoktur. Başlamak için iyi bir yer, Azure AI Studio’nun görev bazlı filtreleme özelliğini kullanmaktır. Bu, modelin hangi tür görevler için eğitildiğini anlamanıza yardımcı olur. Hugging Face ayrıca belirli metriklere göre en iyi performans gösteren modelleri gösteren bir LLM Lider Tablosu tutmaktadır.
Farklı türlerdeki LLM’leri karşılaştırmak için Artificial Analysis de harika bir kaynaktır:
Belirli bir kullanım durumu üzerinde çalışıyorsanız, aynı alana odaklanmış ince ayar yapılmış versiyonları aramak etkili olabilir. Birden fazla açık modeli deneyerek sizin ve kullanıcılarınızın beklentilerine göre nasıl performans gösterdiklerini görmek de iyi bir uygulamadır.
Açık modellerin en güzel yanı, onlarla çalışmaya oldukça hızlı başlayabilmenizdir. Burada bahsettiğimiz modelleri içeren özel bir Hugging Face koleksiyonuna sahip Azure AI Studio Model Kataloğu sayfasını inceleyin.
Bu dersi tamamladıktan sonra, Üretken AI bilginizi geliştirmeye devam etmek için Generative AI Learning koleksiyonumuza göz atın!
Feragatname:
Bu belge, AI çeviri servisi Co-op Translator kullanılarak çevrilmiştir. Doğruluk için çaba göstersek de, otomatik çevirilerin hatalar veya yanlışlıklar içerebileceğini lütfen unutmayın. Orijinal belge, kendi dilinde yetkili kaynak olarak kabul edilmelidir. Kritik bilgiler için profesyonel insan çevirisi önerilir. Bu çevirinin kullanımı sonucu ortaya çıkabilecek yanlış anlamalar veya yorum hatalarından sorumlu değiliz.



