Dunia LLM sumber terbuka sangat menarik dan sentiasa berkembang. Pelajaran ini bertujuan untuk memberikan pandangan mendalam mengenai model sumber terbuka. Jika anda mencari maklumat tentang bagaimana model proprietari dibandingkan dengan model sumber terbuka, sila ke pelajaran "Meneroka dan Membandingkan Pelbagai LLM". Pelajaran ini juga akan membincangkan topik penalaan halus tetapi penjelasan yang lebih terperinci boleh didapati dalam pelajaran "Penalaan Halus LLM".
- Memahami Model sumber terbuka
- Memahami manfaat bekerja dengan Model sumber terbuka
- Meneroka model terbuka yang tersedia di Hugging Face dan Azure AI Studio
Perisian sumber terbuka telah memainkan peranan penting dalam perkembangan teknologi di pelbagai bidang. Open Source Initiative (OSI) telah mentakrifkan 10 kriteria untuk perisian supaya diklasifikasikan sebagai sumber terbuka. Kod sumber mesti dikongsi secara terbuka di bawah lesen yang diluluskan oleh OSI.
Walaupun pembangunan LLM mempunyai elemen yang serupa dengan pembangunan perisian, prosesnya tidak sama sepenuhnya. Ini telah menimbulkan banyak perbincangan dalam komuniti mengenai definisi sumber terbuka dalam konteks LLM. Untuk model selaras dengan definisi tradisional sumber terbuka, maklumat berikut harus tersedia secara awam:
- Set data yang digunakan untuk melatih model.
- Berat model penuh sebagai sebahagian daripada latihan.
- Kod penilaian.
- Kod penalaan halus.
- Berat model penuh dan metrik latihan.
Pada masa ini, hanya beberapa model yang memenuhi kriteria ini. Model OLMo yang dibangunkan oleh Allen Institute for Artificial Intelligence (AllenAI) adalah salah satu yang sesuai dengan kategori ini.
Untuk pelajaran ini, kami akan merujuk model-model ini sebagai "model terbuka" kerana mungkin tidak memenuhi kriteria di atas pada masa penulisan.
Sangat Boleh Disesuaikan - Oleh kerana model terbuka dikeluarkan dengan maklumat latihan yang terperinci, penyelidik dan pembangun boleh mengubah suai bahagian dalaman model. Ini membolehkan penciptaan model yang sangat khusus yang ditala halus untuk tugasan atau bidang kajian tertentu. Contohnya termasuk penjanaan kod, operasi matematik dan biologi.
Kos - Kos setiap token untuk menggunakan dan melaksanakan model ini lebih rendah berbanding model proprietari. Apabila membina aplikasi Generative AI, adalah penting untuk menilai prestasi berbanding harga apabila menggunakan model ini untuk kes penggunaan anda.
Fleksibiliti - Bekerja dengan model terbuka membolehkan anda lebih fleksibel dari segi menggunakan model yang berbeza atau menggabungkannya. Contohnya adalah HuggingChat Assistants di mana pengguna boleh memilih model yang digunakan terus dalam antara muka pengguna:
LLama2, yang dibangunkan oleh Meta adalah model terbuka yang dioptimumkan untuk aplikasi berasaskan sembang. Ini kerana kaedah penalaan halusnya, yang merangkumi sejumlah besar dialog dan maklum balas manusia. Dengan kaedah ini, model menghasilkan keputusan yang lebih selaras dengan jangkaan manusia yang memberikan pengalaman pengguna yang lebih baik.
Beberapa contoh versi Llama yang ditala halus termasuk Japanese Llama, yang khusus dalam bahasa Jepun dan Llama Pro, yang merupakan versi dipertingkatkan model asas.
Mistral adalah model terbuka yang menumpukan perhatian tinggi pada prestasi dan kecekapan. Ia menggunakan pendekatan Mixture-of-Experts yang menggabungkan sekumpulan model pakar khusus ke dalam satu sistem di mana bergantung pada input, model tertentu dipilih untuk digunakan. Ini menjadikan pengiraan lebih berkesan kerana model hanya menangani input yang mereka pakar dalamnya.
Beberapa contoh versi Mistral yang ditala halus termasuk BioMistral, yang fokus pada domain perubatan dan OpenMath Mistral, yang melakukan pengiraan matematik.
Falcon adalah LLM yang dicipta oleh Technology Innovation Institute (TII). Falcon-40B dilatih menggunakan 40 bilion parameter yang telah terbukti berprestasi lebih baik daripada GPT-3 dengan bajet pengiraan yang lebih rendah. Ini kerana penggunaan algoritma FlashAttention dan multiquery attention yang membolehkan pengurangan keperluan memori semasa inferens. Dengan masa inferens yang dikurangkan ini, Falcon-40B sesuai untuk aplikasi sembang.
Beberapa contoh versi Falcon yang ditala halus adalah OpenAssistant, pembantu yang dibina berdasarkan model terbuka dan GPT4ALL, yang memberikan prestasi lebih tinggi daripada model asas.
Tiada jawapan tunggal untuk memilih model terbuka. Tempat yang baik untuk bermula adalah dengan menggunakan ciri tapis mengikut tugasan di Azure AI Studio. Ini akan membantu anda memahami jenis tugasan yang telah dilatih oleh model tersebut. Hugging Face juga mengekalkan LLM Leaderboard yang menunjukkan model terbaik berdasarkan metrik tertentu.
Apabila ingin membandingkan LLM merentasi pelbagai jenis, Artificial Analysis adalah sumber yang sangat baik:
Jika bekerja pada kes penggunaan tertentu, mencari versi yang ditala halus yang fokus pada bidang yang sama boleh menjadi berkesan. Mencuba beberapa model terbuka untuk melihat bagaimana prestasi mereka mengikut jangkaan anda dan pengguna anda adalah amalan yang baik.
Bahagian terbaik mengenai model terbuka ialah anda boleh mula bekerja dengan mereka dengan cepat. Lihat Azure AI Studio Model Catalog, yang menampilkan koleksi khusus Hugging Face dengan model-model yang telah kita bincangkan di sini.
Selepas menamatkan pelajaran ini, lihat koleksi Generative AI Learning kami untuk terus meningkatkan pengetahuan Generative AI anda!
Penafian:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator. Walaupun kami berusaha untuk ketepatan, sila ambil maklum bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang sahih. Untuk maklumat penting, terjemahan profesional oleh manusia adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.



