Skip to content

Latest commit

 

History

History
93 lines (56 loc) · 8.42 KB

File metadata and controls

93 lines (56 loc) · 8.42 KB

Model Open Source

Pendahuluan

Dunia LLM open source sangat menarik dan terus berkembang. Pelajaran ini bertujuan untuk memberikan pandangan mendalam tentang model open source. Jika Anda mencari informasi tentang bagaimana model proprietary dibandingkan dengan model open source, kunjungi pelajaran "Mengeksplorasi dan Membandingkan Berbagai LLM". Pelajaran ini juga akan membahas topik fine-tuning, tetapi penjelasan lebih rinci dapat ditemukan di pelajaran "Fine-Tuning LLMs".

Tujuan Pembelajaran

  • Memahami model open source
  • Memahami manfaat bekerja dengan model open source
  • Mengeksplorasi model open source yang tersedia di Hugging Face dan Azure AI Studio

Apa itu Model Open Source?

Perangkat lunak open source telah memainkan peran penting dalam perkembangan teknologi di berbagai bidang. Open Source Initiative (OSI) telah mendefinisikan 10 kriteria untuk perangkat lunak agar dapat diklasifikasikan sebagai open source. Kode sumber harus dibagikan secara terbuka di bawah lisensi yang disetujui oleh OSI.

Meskipun pengembangan LLM memiliki elemen yang mirip dengan pengembangan perangkat lunak, prosesnya tidak sepenuhnya sama. Hal ini memunculkan banyak diskusi di komunitas tentang definisi open source dalam konteks LLM. Agar model sesuai dengan definisi tradisional open source, informasi berikut harus tersedia secara publik:

  • Dataset yang digunakan untuk melatih model.
  • Bobot model lengkap sebagai bagian dari pelatihan.
  • Kode evaluasi.
  • Kode fine-tuning.
  • Bobot model lengkap dan metrik pelatihan.

Saat ini hanya ada beberapa model yang memenuhi kriteria ini. Model OLMo yang dibuat oleh Allen Institute for Artificial Intelligence (AllenAI) adalah salah satu yang sesuai dengan kategori ini.

Untuk pelajaran ini, kita akan merujuk model sebagai "model terbuka" ke depannya karena mungkin tidak sesuai dengan kriteria di atas pada saat penulisan.

Manfaat Model Terbuka

Sangat Dapat Disesuaikan - Karena model terbuka dirilis dengan informasi pelatihan yang rinci, peneliti dan pengembang dapat memodifikasi bagian dalam model. Hal ini memungkinkan pembuatan model yang sangat khusus yang disesuaikan untuk tugas atau bidang studi tertentu. Beberapa contohnya adalah pembuatan kode, operasi matematika, dan biologi.

Biaya - Biaya per token untuk menggunakan dan menerapkan model ini lebih rendah dibandingkan dengan model proprietary. Saat membangun aplikasi Generative AI, penting untuk mempertimbangkan kinerja vs harga saat bekerja dengan model ini untuk kasus penggunaan Anda.

Biaya Model
Sumber: Artificial Analysis

Fleksibilitas - Bekerja dengan model terbuka memungkinkan Anda fleksibel dalam menggunakan berbagai model atau menggabungkannya. Contohnya adalah HuggingChat Assistants di mana pengguna dapat memilih model yang digunakan langsung di antarmuka pengguna:

Pilih Model

Mengeksplorasi Berbagai Model Terbuka

Llama 2

LLama2, dikembangkan oleh Meta, adalah model terbuka yang dioptimalkan untuk aplikasi berbasis chat. Hal ini disebabkan oleh metode fine-tuning-nya, yang melibatkan sejumlah besar dialog dan umpan balik manusia. Dengan metode ini, model menghasilkan hasil yang lebih sesuai dengan ekspektasi manusia sehingga memberikan pengalaman pengguna yang lebih baik.

Beberapa contoh versi fine-tuning dari Llama termasuk Japanese Llama, yang mengkhususkan diri dalam bahasa Jepang, dan Llama Pro, yang merupakan versi yang ditingkatkan dari model dasar.

Mistral

Mistral adalah model terbuka yang berfokus pada kinerja tinggi dan efisiensi. Model ini menggunakan pendekatan Mixture-of-Experts yang menggabungkan sekelompok model ahli khusus ke dalam satu sistem di mana tergantung pada input, model tertentu dipilih untuk digunakan. Hal ini membuat komputasi lebih efektif karena model hanya menangani input yang mereka kuasai.

Beberapa contoh versi fine-tuning dari Mistral termasuk BioMistral, yang berfokus pada domain medis, dan OpenMath Mistral, yang melakukan perhitungan matematika.

Falcon

Falcon adalah LLM yang dibuat oleh Technology Innovation Institute (TII). Falcon-40B dilatih dengan 40 miliar parameter yang telah terbukti berkinerja lebih baik daripada GPT-3 dengan anggaran komputasi yang lebih rendah. Hal ini disebabkan oleh penggunaan algoritma FlashAttention dan multiquery attention yang memungkinkan pengurangan kebutuhan memori saat waktu inferensi. Dengan waktu inferensi yang lebih rendah, Falcon-40B cocok untuk aplikasi chat.

Beberapa contoh versi fine-tuning dari Falcon adalah OpenAssistant, asisten yang dibangun di atas model terbuka, dan GPT4ALL, yang memberikan kinerja lebih tinggi dibandingkan model dasar.

Cara Memilih

Tidak ada jawaban tunggal untuk memilih model terbuka. Tempat yang baik untuk memulai adalah dengan menggunakan fitur filter berdasarkan tugas di Azure AI Studio. Ini akan membantu Anda memahami jenis tugas yang telah dilatih oleh model. Hugging Face juga memiliki LLM Leaderboard yang menunjukkan model dengan kinerja terbaik berdasarkan metrik tertentu.

Saat ingin membandingkan LLM di berbagai jenis, Artificial Analysis adalah sumber daya yang bagus lainnya:

Kualitas Model
Sumber: Artificial Analysis

Jika bekerja pada kasus penggunaan tertentu, mencari versi fine-tuning yang berfokus pada area yang sama bisa efektif. Bereksperimen dengan beberapa model terbuka untuk melihat bagaimana mereka berkinerja sesuai dengan ekspektasi Anda dan pengguna Anda adalah praktik yang baik.

Langkah Selanjutnya

Bagian terbaik dari model terbuka adalah Anda dapat mulai bekerja dengan mereka dengan cukup cepat. Lihat Azure AI Foundry Model Catalog, yang menampilkan koleksi Hugging Face khusus dengan model yang kita bahas di sini.

Pembelajaran tidak berhenti di sini, lanjutkan Perjalanan Anda

Setelah menyelesaikan pelajaran ini, lihat koleksi Pembelajaran Generative AI kami untuk terus meningkatkan pengetahuan Anda tentang Generative AI!


Penafian:
Dokumen ini telah diterjemahkan menggunakan layanan penerjemahan AI Co-op Translator. Meskipun kami berupaya untuk memberikan hasil yang akurat, harap diketahui bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang otoritatif. Untuk informasi yang penting, disarankan menggunakan jasa penerjemahan manusia profesional. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang timbul dari penggunaan terjemahan ini.