Skip to content

Latest commit

 

History

History
128 lines (73 loc) · 14.2 KB

File metadata and controls

128 lines (73 loc) · 14.2 KB

Pengenalan AI Generatif dan Model Bahasa Besar

(Klik gambar di atas untuk menonton video dari pelajaran ini)

AI Generatif adalah kecerdasan buatan yang mampu menghasilkan teks, gambar, dan jenis konten lainnya. Yang membuatnya menjadi teknologi yang fantastis adalah bahwa ia mendemokratisasi AI, siapa pun dapat menggunakannya hanya dengan petunjuk teks, sebuah kalimat yang ditulis dalam bahasa alami. Anda tidak perlu belajar bahasa seperti Java atau SQL untuk mencapai sesuatu yang berharga, yang Anda butuhkan hanyalah menggunakan bahasa Anda, nyatakan apa yang Anda inginkan dan keluarlah saran dari model AI. Aplikasi dan dampaknya sangat besar, Anda dapat menulis atau memahami laporan, menulis aplikasi, dan banyak lagi, semuanya dalam hitungan detik.

Dalam kurikulum ini, kita akan menjelajahi bagaimana startup kita memanfaatkan AI generatif untuk membuka skenario baru di dunia pendidikan dan bagaimana kita menangani tantangan yang tak terhindarkan terkait dengan implikasi sosial dari penerapannya dan keterbatasan teknologi.

Pengenalan

Pelajaran ini akan mencakup:

  • Pengenalan skenario bisnis: ide dan misi startup kita.
  • AI Generatif dan bagaimana kita mencapai lanskap teknologi saat ini.
  • Cara kerja internal model bahasa besar.
  • Kemampuan utama dan kasus penggunaan praktis Model Bahasa Besar.

Tujuan Pembelajaran

Setelah menyelesaikan pelajaran ini, Anda akan memahami:

  • Apa itu AI generatif dan bagaimana Model Bahasa Besar bekerja.
  • Bagaimana Anda dapat memanfaatkan model bahasa besar untuk berbagai kasus penggunaan, dengan fokus pada skenario pendidikan.

Skenario: startup pendidikan kita

Kecerdasan Buatan Generatif (AI) mewakili puncak teknologi AI, mendorong batasan dari apa yang dulu dianggap tidak mungkin. Model AI generatif memiliki beberapa kemampuan dan aplikasi, tetapi untuk kurikulum ini kita akan menjelajahi bagaimana ini merevolusi pendidikan melalui startup fiksi. Kita akan menyebut startup ini sebagai startup kita. Startup kita bekerja di bidang pendidikan dengan pernyataan misi ambisius

meningkatkan aksesibilitas dalam pembelajaran, dalam skala global, memastikan akses pendidikan yang adil dan menyediakan pengalaman pembelajaran yang dipersonalisasi kepada setiap pelajar, sesuai dengan kebutuhan mereka.

Tim startup kita menyadari bahwa kita tidak akan dapat mencapai tujuan ini tanpa memanfaatkan salah satu alat paling kuat di zaman modern – Model Bahasa Besar (LLM).

AI generatif diharapkan dapat merevolusi cara kita belajar dan mengajar saat ini, dengan siswa memiliki guru virtual yang tersedia 24 jam sehari yang menyediakan sejumlah besar informasi dan contoh, dan guru dapat memanfaatkan alat inovatif untuk menilai siswa mereka dan memberikan umpan balik.

Untuk memulai, mari kita definisikan beberapa konsep dasar dan terminologi yang akan kita gunakan sepanjang kurikulum.

Bagaimana kita mendapatkan AI Generatif?

Meskipun hype luar biasa yang diciptakan baru-baru ini oleh pengumuman model AI generatif, teknologi ini sudah dibuat selama beberapa dekade, dengan upaya penelitian pertama dimulai pada tahun 60-an. Sekarang kita berada pada titik dengan AI yang memiliki kemampuan kognitif manusia, seperti percakapan seperti yang ditunjukkan oleh misalnya OpenAI ChatGPT atau Bing Chat, yang juga menggunakan model GPT untuk percakapan pencarian web Bing.

Mundur sedikit, prototipe AI pertama terdiri dari chatbot yang diketik, mengandalkan basis pengetahuan yang diekstraksi dari sekelompok ahli dan diwakili ke dalam komputer. Jawaban dalam basis pengetahuan dipicu oleh kata kunci yang muncul dalam teks input. Namun, segera menjadi jelas bahwa pendekatan semacam itu, menggunakan chatbot yang diketik, tidak dapat diskalakan dengan baik.

Pendekatan statistik terhadap AI: Pembelajaran Mesin

Titik balik tiba selama tahun 90-an, dengan penerapan pendekatan statistik terhadap analisis teks. Ini mengarah pada pengembangan algoritma baru – yang dikenal sebagai pembelajaran mesin – yang mampu mempelajari pola dari data tanpa diprogram secara eksplisit. Pendekatan ini memungkinkan mesin untuk mensimulasikan pemahaman bahasa manusia: model statistik dilatih pada pasangan teks-label, memungkinkan model untuk mengklasifikasikan teks input yang tidak dikenal dengan label yang telah ditentukan sebelumnya yang mewakili maksud pesan.

Jaringan saraf dan asisten virtual modern

Dalam beberapa tahun terakhir, evolusi teknologi perangkat keras, yang mampu menangani jumlah data yang lebih besar dan perhitungan yang lebih kompleks, mendorong penelitian dalam AI, yang mengarah pada pengembangan algoritma pembelajaran mesin canggih yang dikenal sebagai jaringan saraf atau algoritma pembelajaran mendalam.

Jaringan saraf (dan khususnya Jaringan Saraf Rekuren – RNN) secara signifikan meningkatkan pemrosesan bahasa alami, memungkinkan representasi makna teks dengan cara yang lebih bermakna, menilai konteks kata dalam kalimat.

Ini adalah teknologi yang menggerakkan asisten virtual yang lahir pada dekade pertama abad baru, sangat mahir dalam menafsirkan bahasa manusia, mengidentifikasi kebutuhan, dan melakukan tindakan untuk memenuhinya – seperti menjawab dengan skrip yang telah ditentukan sebelumnya atau mengonsumsi layanan pihak ketiga.

Hari ini, AI Generatif

Jadi begitulah kita sampai pada AI Generatif hari ini, yang dapat dilihat sebagai subset dari pembelajaran mendalam.

Setelah beberapa dekade penelitian di bidang AI, arsitektur model baru – yang disebut Transformer – mengatasi batasan RNN, mampu mendapatkan urutan teks yang jauh lebih panjang sebagai input. Transformer didasarkan pada mekanisme perhatian, memungkinkan model untuk memberikan bobot berbeda pada input yang diterimanya, ‘lebih memperhatikan’ di mana informasi yang paling relevan terkonsentrasi, terlepas dari urutannya dalam urutan teks.

Sebagian besar model AI generatif terbaru – juga dikenal sebagai Model Bahasa Besar (LLM), karena mereka bekerja dengan input dan output tekstual – memang didasarkan pada arsitektur ini. Yang menarik dari model-model ini – dilatih pada sejumlah besar data yang tidak berlabel dari berbagai sumber seperti buku, artikel, dan situs web – adalah bahwa mereka dapat diadaptasi untuk berbagai tugas dan menghasilkan teks yang secara tata bahasa benar dengan kesan kreativitas. Jadi, tidak hanya mereka secara luar biasa meningkatkan kapasitas mesin untuk ‘memahami’ teks input, tetapi mereka juga memungkinkan kapasitas mereka untuk menghasilkan respons asli dalam bahasa manusia.

Bagaimana model bahasa besar bekerja?

Di bab berikutnya kita akan menjelajahi berbagai jenis model AI Generatif, tetapi untuk saat ini mari kita lihat bagaimana model bahasa besar bekerja, dengan fokus pada model OpenAI GPT (Generative Pre-trained Transformer).

  • Tokenizer, teks ke angka: Model Bahasa Besar menerima teks sebagai input dan menghasilkan teks sebagai output. Namun, sebagai model statistik, mereka bekerja jauh lebih baik dengan angka daripada urutan teks. Itulah sebabnya setiap input ke model diproses oleh tokenizer, sebelum digunakan oleh model inti. Token adalah potongan teks – terdiri dari sejumlah karakter variabel, jadi tugas utama tokenizer adalah membagi input menjadi array token. Kemudian, setiap token dipetakan dengan indeks token, yang merupakan pengkodean bilangan bulat dari potongan teks asli.

  • Memprediksi token output: Diberikan n token sebagai input (dengan max n bervariasi dari satu model ke model lainnya), model dapat memprediksi satu token sebagai output. Token ini kemudian dimasukkan ke dalam input iterasi berikutnya, dalam pola jendela yang berkembang, memungkinkan pengalaman pengguna yang lebih baik dalam mendapatkan satu (atau beberapa) kalimat sebagai jawaban. Ini menjelaskan mengapa, jika Anda pernah bermain dengan ChatGPT, Anda mungkin memperhatikan bahwa terkadang sepertinya berhenti di tengah kalimat.

  • Proses seleksi, distribusi probabilitas: Token output dipilih oleh model sesuai dengan probabilitasnya terjadi setelah urutan teks saat ini. Ini karena model memprediksi distribusi probabilitas atas semua ‘token berikutnya’ yang mungkin, dihitung berdasarkan pelatihannya. Namun, tidak selalu token dengan probabilitas tertinggi dipilih dari distribusi yang dihasilkan. Tingkat keacakan ditambahkan pada pilihan ini, dengan cara model bertindak secara non-deterministik - kita tidak mendapatkan output yang sama persis untuk input yang sama. Tingkat keacakan ini ditambahkan untuk mensimulasikan proses berpikir kreatif dan dapat disesuaikan menggunakan parameter model yang disebut suhu.

Bagaimana startup kita dapat memanfaatkan Model Bahasa Besar?

Sekarang kita memiliki pemahaman yang lebih baik tentang cara kerja internal model bahasa besar, mari kita lihat beberapa contoh praktis dari tugas paling umum yang dapat mereka lakukan dengan cukup baik, dengan mata pada skenario bisnis kita. Kita mengatakan bahwa kemampuan utama dari Model Bahasa Besar adalah menghasilkan teks dari awal, dimulai dari input tekstual, yang ditulis dalam bahasa alami.

Tetapi jenis input dan output tekstual apa? Input dari model bahasa besar dikenal sebagai prompt, sementara output dikenal sebagai completion, istilah yang mengacu pada mekanisme model dalam menghasilkan token berikutnya untuk melengkapi input saat ini. Kita akan mendalami apa itu prompt dan bagaimana merancangnya dengan cara untuk mendapatkan hasil maksimal dari model kita. Tetapi untuk saat ini, mari kita katakan bahwa prompt dapat mencakup:

  • Sebuah instruksi yang menentukan jenis output yang kita harapkan dari model. Instruksi ini terkadang dapat menyertakan beberapa contoh atau beberapa data tambahan.

    1. Meringkas artikel, buku, ulasan produk, dan lainnya, bersama dengan ekstraksi wawasan dari data yang tidak terstruktur.

    2. Ide kreatif dan desain artikel, esai, tugas, atau lainnya.

  • Sebuah pertanyaan, yang diajukan dalam bentuk percakapan dengan agen.

  • Sebuah potongan teks untuk melengkapi, yang secara implisit adalah permintaan bantuan menulis.

  • Sebuah potongan kode bersama dengan permintaan untuk menjelaskan dan mendokumentasikannya, atau komentar yang meminta untuk menghasilkan potongan kode yang melakukan tugas tertentu.

Contoh-contoh di atas cukup sederhana dan tidak dimaksudkan untuk menjadi demonstrasi lengkap dari kemampuan Model Bahasa Besar. Mereka dimaksudkan untuk menunjukkan potensi penggunaan AI generatif, terutama tetapi tidak terbatas pada konteks pendidikan.

Selain itu, output dari model AI generatif tidak sempurna dan terkadang kreativitas model dapat bekerja melawannya, menghasilkan output yang merupakan kombinasi kata-kata yang dapat diinterpretasikan oleh pengguna manusia sebagai mistifikasi realitas, atau dapat bersifat ofensif. AI generatif tidak cerdas - setidaknya dalam definisi kecerdasan yang lebih komprehensif, termasuk penalaran kritis dan kreatif atau kecerdasan emosional; itu tidak deterministik, dan itu tidak dapat dipercaya, karena fabrikasi, seperti referensi yang salah, konten, dan pernyataan, dapat digabungkan dengan informasi yang benar, dan disajikan dengan cara yang meyakinkan dan percaya diri. Dalam pelajaran berikutnya, kita akan menangani semua keterbatasan ini dan kita akan melihat apa yang dapat kita lakukan untuk menguranginya.

Tugas

Tugas Anda adalah membaca lebih lanjut tentang AI generatif dan mencoba mengidentifikasi area di mana Anda akan menambahkan AI generatif hari ini yang tidak memilikinya. Bagaimana dampaknya berbeda dari melakukannya dengan cara "lama", bisakah Anda melakukan sesuatu yang tidak bisa Anda lakukan sebelumnya, atau apakah Anda lebih cepat? Tulis ringkasan 300 kata tentang seperti apa tampilan startup AI impian Anda dan sertakan header seperti "Masalah", "Bagaimana saya akan menggunakan AI", "Dampak" dan opsional rencana bisnis.

Jika Anda melakukan tugas ini, Anda mungkin bahkan siap untuk melamar ke inkubator Microsoft, Microsoft for Startups Founders Hub kami menawarkan kredit untuk Azure, OpenAI, mentoring dan banyak lagi, cek itu!

Pemeriksaan Pengetahuan

Apa yang benar tentang model bahasa besar?

  1. Anda mendapatkan respons yang sama persis setiap kali.
  2. Ini melakukan hal-hal dengan sempurna, hebat dalam menambahkan angka, menghasilkan kode yang berfungsi, dll.
  3. Respons dapat bervariasi meskipun menggunakan prompt yang sama. Ini juga hebat dalam memberi Anda draf pertama dari sesuatu, baik itu teks atau kode. Tetapi Anda perlu memperbaiki hasilnya.

A: 3, sebuah LLM bersifat non-deterministik, responsnya bervariasi, namun, Anda dapat mengontrol variansnya melalui pengaturan suhu. Anda juga tidak boleh mengharapkan itu melakukan hal-hal dengan sempurna, itu ada di sini untuk melakukan pekerjaan berat untuk Anda yang sering berarti Anda mendapatkan upaya pertama yang baik pada sesuatu yang perlu Anda tingkatkan secara bertahap.

Kerja Bagus! Lanjutkan Perjalanan

Setelah menyelesaikan pelajaran ini, lihat koleksi Pembelajaran AI Generatif kami untuk terus meningkatkan pengetahuan AI Generatif Anda!

Lanjutkan ke Pelajaran 2 di mana kita akan melihat bagaimana menjelajahi dan membandingkan berbagai jenis LLM!

Penafian:
Dokumen ini telah diterjemahkan menggunakan layanan penerjemahan AI Co-op Translator. Meskipun kami berusaha untuk akurasi, harap diingat bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang berwenang. Untuk informasi penting, disarankan menggunakan terjemahan manusia profesional. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang salah yang timbul dari penggunaan terjemahan ini.