Açık kaynaklı LLM'lerin dünyası heyecan verici ve sürekli değişiyor. Bu ders, açık kaynak modellerine derinlemesine bir bakış sunmayı amaçlıyor. Eğer özel modellerin açık kaynak modellerle nasıl karşılaştırıldığını öğrenmek istiyorsanız, "Farklı LLM'leri Keşfetmek ve Karşılaştırmak" dersi bölümüne göz atabilirsiniz. Bu ders ayrıca ince ayar konusunu ele alacak, ancak daha ayrıntılı bir açıklama için "LLM'lere İnce Ayar Yapmak" dersi bölümüne bakabilirsiniz.
- Açık kaynak modelleri anlamak
- Açık kaynak modellerle çalışmanın faydalarını anlamak
- Hugging Face ve Azure AI Studio'daki açık modelleri keşfetmek
Açık kaynak yazılım, teknolojinin çeşitli alanlarda büyümesinde önemli bir rol oynamıştır. Open Source Initiative (OSI), bir yazılımın açık kaynak olarak sınıflandırılması için 10 kriter tanımlamıştır. Kaynak kodu, OSI tarafından onaylanmış bir lisans altında açıkça paylaşılmalıdır.
LLM'lerin geliştirilmesi, yazılım geliştirmeye benzer unsurlar içerirken, süreç tam olarak aynı değildir. Bu durum, LLM'ler bağlamında açık kaynak tanımı hakkında toplulukta birçok tartışma yaratmıştır. Bir modelin geleneksel açık kaynak tanımına uygun olması için aşağıdaki bilgilerin kamuya açık olması gerekir:
- Modeli eğitmek için kullanılan veri setleri.
- Eğitim sürecinin bir parçası olarak tam model ağırlıkları.
- Değerlendirme kodu.
- İnce ayar kodu.
- Tam model ağırlıkları ve eğitim metrikleri.
Şu anda bu kriterlere uyan çok az model bulunmaktadır. Allen Institute for Artificial Intelligence (AllenAI) tarafından oluşturulan OLMo modeli bu kategoriye uyan bir örnektir.
Bu ders için, yazım sırasında yukarıdaki kriterlere uymayabileceklerinden dolayı modelleri "açık modeller" olarak adlandıracağız.
Son Derece Özelleştirilebilir - Açık modeller ayrıntılı eğitim bilgileriyle yayınlandığından, araştırmacılar ve geliştiriciler modelin iç yapısını değiştirebilir. Bu, belirli bir görev veya çalışma alanı için ince ayar yapılmış son derece özel modellerin oluşturulmasını sağlar. Örnekler arasında kod üretimi, matematiksel işlemler ve biyoloji bulunmaktadır.
Maliyet - Bu modelleri kullanma ve dağıtma maliyeti, özel modellere göre daha düşüktür. Üretken AI uygulamaları oluştururken, bu modellerle çalışırken performans ve fiyat arasındaki dengeyi göz önünde bulundurmak önemlidir.
Esneklik - Açık modellerle çalışmak, farklı modelleri kullanma veya birleştirme konusunda esneklik sağlar. Bunun bir örneği, kullanıcıların doğrudan kullanıcı arayüzünde kullanılan modeli seçebildiği HuggingChat Asistanları:
LLama2, Meta tarafından geliştirilen ve sohbet tabanlı uygulamalar için optimize edilmiş bir açık modeldir. Bu, büyük miktarda diyalog ve insan geri bildirimi içeren ince ayar yöntemi sayesinde gerçekleşmiştir. Bu yöntemle model, insan beklentilerine daha uygun sonuçlar üreterek daha iyi bir kullanıcı deneyimi sağlar.
Llama'nın ince ayar yapılmış bazı versiyonları arasında Japonca konusunda uzmanlaşmış Japanese Llama ve temel modelin geliştirilmiş bir versiyonu olan Llama Pro bulunmaktadır.
Mistral, yüksek performans ve verimliliğe odaklanan bir açık modeldir. Mixture-of-Experts yaklaşımını kullanır; bu, bir grup uzmanlaşmış modelin bir sistemde birleştirilmesi ve girdiye bağlı olarak belirli modellerin seçilmesi anlamına gelir. Bu, modellerin yalnızca uzmanlaştıkları girdileri ele alması nedeniyle hesaplamayı daha etkili hale getirir.
Mistral'ın ince ayar yapılmış bazı versiyonları arasında tıbbi alana odaklanan BioMistral ve matematiksel hesaplama yapan OpenMath Mistral bulunmaktadır.
Falcon, Teknoloji İnovasyon Enstitüsü (TII) tarafından oluşturulan bir LLM'dir. Falcon-40B, 40 milyar parametre üzerinde eğitilmiş olup, daha az hesaplama bütçesiyle GPT-3'ten daha iyi performans gösterdiği kanıtlanmıştır. Bu, FlashAttention algoritması ve çoklu sorgu dikkat mekanizması kullanımı sayesinde gerçekleşir; bu, çıkarım zamanında bellek gereksinimlerini azaltmasını sağlar. Bu azaltılmış çıkarım süresiyle Falcon-40B, sohbet uygulamaları için uygundur.
Falcon'un ince ayar yapılmış bazı versiyonları arasında açık modeller üzerine inşa edilmiş bir asistan olan OpenAssistant ve temel modelden daha yüksek performans sunan GPT4ALL bulunmaktadır.
Bir açık model seçmek için tek bir doğru cevap yoktur. Başlamak için iyi bir yer, Azure AI Studio'nun görev filtreleme özelliğini kullanmaktır. Bu, modelin hangi tür görevler için eğitildiğini anlamanıza yardımcı olur. Hugging Face ayrıca belirli metriklere göre en iyi performans gösteren modelleri gösteren bir LLM Liderlik Tablosu tutmaktadır.
Farklı türlerdeki LLM'leri karşılaştırmak için Artificial Analysis başka harika bir kaynaktır:
Belirli bir kullanım durumu üzerinde çalışıyorsanız, aynı alana odaklanmış ince ayar yapılmış versiyonları aramak etkili olabilir. Açık modellerin birden fazlasını deneyerek, sizin ve kullanıcılarınızın beklentilerine göre nasıl performans gösterdiklerini görmek de iyi bir uygulamadır.
Açık modellerle çalışmaya başlamak oldukça hızlıdır. Burada tartıştığımız modellerin yer aldığı özel bir Hugging Face koleksiyonunu içeren Azure AI Foundry Model Catalog bölümüne göz atabilirsiniz.
Bu dersi tamamladıktan sonra, Üretken AI Öğrenme koleksiyonumuza göz atarak Üretken AI bilginizi geliştirmeye devam edin!
Feragatname:
Bu belge, AI çeviri hizmeti Co-op Translator kullanılarak çevrilmiştir. Doğruluk için çaba göstersek de, otomatik çeviriler hata veya yanlışlıklar içerebilir. Belgenin orijinal dili, yetkili kaynak olarak kabul edilmelidir. Kritik bilgiler için profesyonel insan çevirisi önerilir. Bu çevirinin kullanımından kaynaklanan herhangi bir yanlış anlama veya yanlış yorumlama durumunda sorumluluk kabul edilmez.



