Skip to content

Latest commit

 

History

History
91 lines (55 loc) · 8.46 KB

File metadata and controls

91 lines (55 loc) · 8.46 KB

Open Source Models

Pendahuluan

Dunia LLM open-source sangat menarik dan terus berkembang. Pelajaran ini bertujuan memberikan pandangan mendalam tentang model open source. Jika Anda mencari informasi tentang bagaimana model proprietary dibandingkan dengan model open source, kunjungi pelajaran "Exploring and Comparing Different LLMs". Pelajaran ini juga akan membahas topik fine-tuning, namun penjelasan lebih rinci dapat ditemukan di pelajaran "Fine-Tuning LLMs".

Tujuan Pembelajaran

  • Memahami Model open source
  • Memahami manfaat bekerja dengan Model open source
  • Menjelajahi model open yang tersedia di Hugging Face dan Azure AI Studio

Apa itu Model Open Source?

Perangkat lunak open source telah memainkan peran penting dalam perkembangan teknologi di berbagai bidang. Open Source Initiative (OSI) telah mendefinisikan 10 kriteria untuk perangkat lunak agar diklasifikasikan sebagai open source. Kode sumber harus dibagikan secara terbuka di bawah lisensi yang disetujui oleh OSI.

Meskipun pengembangan LLM memiliki elemen yang mirip dengan pengembangan perangkat lunak, prosesnya tidak persis sama. Hal ini memunculkan banyak diskusi di komunitas mengenai definisi open source dalam konteks LLM. Agar sebuah model sesuai dengan definisi open source tradisional, informasi berikut harus tersedia untuk umum:

  • Dataset yang digunakan untuk melatih model.
  • Bobot model lengkap sebagai bagian dari pelatihan.
  • Kode evaluasi.
  • Kode fine-tuning.
  • Bobot model lengkap dan metrik pelatihan.

Saat ini hanya ada beberapa model yang memenuhi kriteria ini. Model OLMo yang dibuat oleh Allen Institute for Artificial Intelligence (AllenAI) adalah salah satu yang masuk kategori ini.

Untuk pelajaran ini, kami akan menyebut model-model tersebut sebagai "model terbuka" karena mungkin belum sepenuhnya memenuhi kriteria di atas pada saat penulisan.

Manfaat Model Terbuka

Sangat Dapat Disesuaikan - Karena model terbuka dirilis dengan informasi pelatihan yang detail, peneliti dan pengembang dapat memodifikasi bagian dalam model. Ini memungkinkan pembuatan model yang sangat khusus yang di-fine-tune untuk tugas atau bidang studi tertentu. Contohnya termasuk pembuatan kode, operasi matematika, dan biologi.

Biaya - Biaya per token untuk menggunakan dan menerapkan model ini lebih rendah dibandingkan model proprietary. Saat membangun aplikasi Generative AI, penting untuk mempertimbangkan performa dibandingkan harga saat menggunakan model ini untuk kasus penggunaan Anda.

Model Cost
Sumber: Artificial Analysis

Fleksibilitas - Bekerja dengan model terbuka memungkinkan Anda lebih fleksibel dalam menggunakan berbagai model atau menggabungkannya. Contohnya adalah HuggingChat Assistants di mana pengguna dapat memilih model yang digunakan langsung dari antarmuka pengguna:

Choose Model

Menjelajahi Berbagai Model Terbuka

Llama 2

LLama2, yang dikembangkan oleh Meta, adalah model terbuka yang dioptimalkan untuk aplikasi berbasis chat. Ini karena metode fine-tuning-nya yang melibatkan banyak dialog dan umpan balik manusia. Dengan metode ini, model menghasilkan hasil yang lebih sesuai dengan harapan manusia sehingga memberikan pengalaman pengguna yang lebih baik.

Beberapa contoh versi Llama yang sudah di-fine-tune termasuk Japanese Llama, yang mengkhususkan diri dalam bahasa Jepang, dan Llama Pro, versi yang ditingkatkan dari model dasar.

Mistral

Mistral adalah model terbuka dengan fokus kuat pada performa tinggi dan efisiensi. Model ini menggunakan pendekatan Mixture-of-Experts yang menggabungkan sekelompok model ahli khusus ke dalam satu sistem, di mana tergantung pada input, model tertentu dipilih untuk digunakan. Ini membuat komputasi lebih efektif karena model hanya menangani input yang menjadi keahliannya.

Beberapa contoh versi Mistral yang sudah di-fine-tune termasuk BioMistral, yang fokus pada domain medis, dan OpenMath Mistral, yang melakukan komputasi matematika.

Falcon

Falcon adalah LLM yang dibuat oleh Technology Innovation Institute (TII). Falcon-40B dilatih dengan 40 miliar parameter dan telah terbukti berkinerja lebih baik daripada GPT-3 dengan anggaran komputasi yang lebih rendah. Ini berkat penggunaan algoritma FlashAttention dan multiquery attention yang memungkinkan pengurangan kebutuhan memori saat inferensi. Dengan waktu inferensi yang lebih singkat ini, Falcon-40B cocok untuk aplikasi chat.

Beberapa contoh versi Falcon yang sudah di-fine-tune adalah OpenAssistant, asisten yang dibangun di atas model terbuka, dan GPT4ALL, yang memberikan performa lebih tinggi dibandingkan model dasar.

Cara Memilih

Tidak ada jawaban pasti dalam memilih model terbuka. Tempat yang baik untuk memulai adalah dengan menggunakan fitur filter berdasarkan tugas di Azure AI Studio. Ini akan membantu Anda memahami jenis tugas apa yang telah dilatih oleh model tersebut. Hugging Face juga memiliki LLM Leaderboard yang menunjukkan model dengan performa terbaik berdasarkan metrik tertentu.

Saat ingin membandingkan LLM dari berbagai jenis, Artificial Analysis adalah sumber yang sangat baik:

Model Quality
Sumber: Artificial Analysis

Jika mengerjakan kasus penggunaan spesifik, mencari versi yang sudah di-fine-tune dan fokus pada area yang sama bisa sangat efektif. Mencoba beberapa model terbuka untuk melihat bagaimana performanya sesuai dengan harapan Anda dan pengguna juga merupakan praktik yang baik.

Langkah Selanjutnya

Bagian terbaik dari model terbuka adalah Anda bisa mulai menggunakannya dengan cepat. Lihat Azure AI Studio Model Catalog, yang menampilkan koleksi khusus dari Hugging Face dengan model-model yang telah kita bahas di sini.

Pembelajaran tidak berhenti di sini, lanjutkan Perjalanan

Setelah menyelesaikan pelajaran ini, kunjungi koleksi Generative AI Learning untuk terus meningkatkan pengetahuan Anda tentang Generative AI!

Penafian:
Dokumen ini telah diterjemahkan menggunakan layanan terjemahan AI Co-op Translator. Meskipun kami berupaya untuk akurasi, harap diketahui bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang sahih. Untuk informasi penting, disarankan menggunakan terjemahan profesional oleh manusia. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang salah yang timbul dari penggunaan terjemahan ini.