Kejuruteraan konteks adalah konsep baru dalam ruang AI yang meneroka bagaimana maklumat disusun, disampaikan, dan dikekalkan sepanjang interaksi antara pelanggan dan perkhidmatan AI. Seiring dengan evolusi ekosistem Model Context Protocol (MCP), pemahaman tentang cara mengurus konteks dengan berkesan menjadi semakin penting. Modul ini memperkenalkan konsep kejuruteraan konteks dan meneroka potensi aplikasinya dalam pelaksanaan MCP.
Menjelang akhir modul ini, anda akan dapat:
- Memahami konsep baru kejuruteraan konteks dan peranannya dalam aplikasi MCP
- Mengenal pasti cabaran utama dalam pengurusan konteks yang ditangani oleh reka bentuk protokol MCP
- Meneroka teknik untuk meningkatkan prestasi model melalui pengurusan konteks yang lebih baik
- Mempertimbangkan pendekatan untuk mengukur dan menilai keberkesanan konteks
- Mengaplikasikan konsep baru ini untuk memperbaiki pengalaman AI melalui rangka kerja MCP
Kejuruteraan konteks adalah konsep baru yang menumpukan pada reka bentuk dan pengurusan aliran maklumat antara pengguna, aplikasi, dan model AI secara sengaja. Berbeza dengan bidang yang sudah mantap seperti kejuruteraan prompt, kejuruteraan konteks masih dalam proses definisi oleh para pengamal yang berusaha menyelesaikan cabaran unik dalam menyediakan maklumat yang tepat kepada model AI pada masa yang sesuai.
Seiring dengan evolusi model bahasa besar (LLM), kepentingan konteks menjadi semakin jelas. Kualiti, kesesuaian, dan struktur konteks yang kita berikan secara langsung mempengaruhi output model. Kejuruteraan konteks meneroka hubungan ini dan berusaha membangunkan prinsip untuk pengurusan konteks yang berkesan.
"Pada tahun 2025, model-model yang ada sangat pintar. Tetapi walaupun manusia paling bijak tidak akan dapat menjalankan tugas mereka dengan berkesan tanpa konteks apa yang diminta... 'Kejuruteraan konteks' adalah tahap seterusnya dalam kejuruteraan prompt. Ia mengenai melakukan ini secara automatik dalam sistem dinamik." — Walden Yan, Cognition AI
Kejuruteraan konteks mungkin merangkumi:
- Pemilihan Konteks: Menentukan maklumat yang relevan untuk tugasan tertentu
- Penyusunan Konteks: Mengatur maklumat untuk memaksimumkan kefahaman model
- Penyampaian Konteks: Mengoptimumkan cara dan masa maklumat dihantar kepada model
- Penyelenggaraan Konteks: Mengurus keadaan dan evolusi konteks dari masa ke masa
- Penilaian Konteks: Mengukur dan memperbaiki keberkesanan konteks
Bidang fokus ini sangat relevan dengan ekosistem MCP, yang menyediakan cara standard untuk aplikasi memberikan konteks kepada LLM.
Salah satu cara untuk memvisualisasikan kejuruteraan konteks adalah dengan menjejaki perjalanan maklumat melalui sistem MCP:
graph LR
A[User Input] --> B[Context Assembly]
B --> C[Model Processing]
C --> D[Response Generation]
D --> E[State Management]
E -->|Next Interaction| A
style A fill:#A8D5BA,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style B fill:#7FB3D5,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style D fill:#C39BD3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style E fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
- Input Pengguna: Maklumat mentah dari pengguna (teks, imej, dokumen)
- Penyusunan Konteks: Menggabungkan input pengguna dengan konteks sistem, sejarah perbualan, dan maklumat lain yang diperoleh
- Pemprosesan Model: Model AI memproses konteks yang telah disusun
- Penjanaan Respons: Model menghasilkan output berdasarkan konteks yang diberikan
- Pengurusan Keadaan: Sistem mengemas kini keadaan dalaman berdasarkan interaksi
Perspektif ini menonjolkan sifat dinamik konteks dalam sistem AI dan menimbulkan persoalan penting tentang cara terbaik mengurus maklumat pada setiap tahap.
Seiring bidang kejuruteraan konteks berkembang, beberapa prinsip awal mula muncul daripada para pengamal. Prinsip ini mungkin membantu dalam membuat pilihan pelaksanaan MCP:
Konteks harus dikongsi sepenuhnya antara semua komponen sistem dan tidak terpecah-pecah di antara agen atau proses yang berbeza. Apabila konteks diagihkan, keputusan yang dibuat di satu bahagian sistem mungkin bertentangan dengan keputusan di bahagian lain.
graph TD
subgraph "Fragmented Context Approach"
A1[Agent 1] --- C1[Context 1]
A2[Agent 2] --- C2[Context 2]
A3[Agent 3] --- C3[Context 3]
end
subgraph "Unified Context Approach"
B1[Agent] --- D1[Shared Complete Context]
end
style A1 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style A2 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style A3 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style B1 fill:#A9DFBF,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C1 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C2 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C3 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style D1 fill:#D7BDE2,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
Dalam aplikasi MCP, ini mencadangkan reka bentuk sistem di mana konteks mengalir lancar melalui keseluruhan rangkaian dan tidak dipisahkan.
Setiap tindakan yang diambil oleh model mengandungi keputusan tersirat tentang cara mentafsir konteks. Apabila beberapa komponen bertindak berdasarkan konteks yang berbeza, keputusan tersirat ini boleh bertentangan, menyebabkan hasil yang tidak konsisten.
Prinsip ini mempunyai implikasi penting untuk aplikasi MCP:
- Utamakan pemprosesan linear untuk tugasan kompleks berbanding pelaksanaan selari dengan konteks yang terpecah
- Pastikan semua titik keputusan mempunyai akses kepada maklumat konteks yang sama
- Reka bentuk sistem supaya langkah-langkah berikut dapat melihat keseluruhan konteks keputusan terdahulu
Apabila perbualan dan proses menjadi lebih panjang, tetingkap konteks akhirnya akan penuh. Kejuruteraan konteks yang berkesan meneroka pendekatan untuk mengurus ketegangan antara konteks yang menyeluruh dan had teknikal.
Pendekatan yang sedang diteroka termasuk:
- Pemampatan konteks yang mengekalkan maklumat penting sambil mengurangkan penggunaan token
- Pemuatan konteks secara progresif berdasarkan kepentingan kepada keperluan semasa
- Ringkasan interaksi sebelumnya sambil mengekalkan keputusan dan fakta utama
Model Context Protocol (MCP) direka dengan kesedaran terhadap cabaran unik dalam pengurusan konteks. Memahami cabaran ini membantu menjelaskan aspek utama reka bentuk protokol MCP:
Kebanyakan model AI mempunyai saiz tetingkap konteks yang tetap, mengehadkan jumlah maklumat yang boleh diproses sekaligus.
Respons Reka Bentuk MCP:
- Protokol menyokong konteks berstruktur berasaskan sumber yang boleh dirujuk dengan cekap
- Sumber boleh dipaginasi dan dimuatkan secara progresif
Menentukan maklumat mana yang paling relevan untuk dimasukkan dalam konteks adalah sukar.
Respons Reka Bentuk MCP:
- Alat fleksibel membolehkan pengambilan maklumat secara dinamik berdasarkan keperluan
- Prompt berstruktur membolehkan organisasi konteks yang konsisten
Mengurus keadaan sepanjang interaksi memerlukan penjejakan konteks yang teliti.
Respons Reka Bentuk MCP:
- Pengurusan sesi yang distandardkan
- Corak interaksi yang jelas untuk evolusi konteks
Jenis data yang berbeza (teks, imej, data berstruktur) memerlukan pengendalian yang berbeza.
Respons Reka Bentuk MCP:
- Reka bentuk protokol mengakomodasi pelbagai jenis kandungan
- Representasi standard maklumat multi-modal
Konteks sering mengandungi maklumat sensitif yang mesti dilindungi.
Respons Reka Bentuk MCP:
- Sempadan jelas antara tanggungjawab klien dan pelayan
- Pilihan pemprosesan tempatan untuk meminimumkan pendedahan data
Memahami cabaran ini dan bagaimana MCP menanganinya menyediakan asas untuk meneroka teknik kejuruteraan konteks yang lebih maju.
Seiring bidang kejuruteraan konteks berkembang, beberapa pendekatan menjanjikan mula muncul. Ini mewakili pemikiran semasa dan bukan amalan terbaik yang sudah mantap, dan mungkin akan berkembang seiring pengalaman pelaksanaan MCP bertambah.
Berbeza dengan seni bina multi-agen yang mengagihkan konteks, sesetengah pengamal mendapati pemprosesan linear berbenang tunggal menghasilkan keputusan yang lebih konsisten. Ini selaras dengan prinsip mengekalkan konteks yang bersatu.
graph TD
A[Task Start] --> B[Process Step 1]
B --> C[Process Step 2]
C --> D[Process Step 3]
D --> E[Result]
style A fill:#A9CCE3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style B fill:#A3E4D7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style D fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style E fill:#D2B4DE,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
Walaupun pendekatan ini mungkin kelihatan kurang cekap berbanding pemprosesan selari, ia sering menghasilkan keputusan yang lebih koheren dan boleh dipercayai kerana setiap langkah dibina atas pemahaman lengkap keputusan sebelumnya.
Memecahkan konteks besar kepada bahagian yang boleh diurus dan mengutamakan apa yang paling penting.
# Conceptual Example: Context Chunking and Prioritization
def process_with_chunked_context(documents, query):
# 1. Break documents into smaller chunks
chunks = chunk_documents(documents)
# 2. Calculate relevance scores for each chunk
scored_chunks = [(chunk, calculate_relevance(chunk, query)) for chunk in chunks]
# 3. Sort chunks by relevance score
sorted_chunks = sorted(scored_chunks, key=lambda x: x[1], reverse=True)
# 4. Use the most relevant chunks as context
context = create_context_from_chunks([chunk for chunk, score in sorted_chunks[:5]])
# 5. Process with the prioritized context
return generate_response(context, query)Konsep di atas menggambarkan bagaimana kita boleh memecahkan dokumen besar kepada bahagian yang boleh diurus dan memilih hanya bahagian yang paling relevan untuk konteks. Pendekatan ini membantu bekerja dalam had tetingkap konteks sambil memanfaatkan pangkalan pengetahuan yang besar.
Memuatkan konteks secara progresif mengikut keperluan dan bukan sekaligus.
sequenceDiagram
participant User
participant App
participant MCP Server
participant AI Model
User->>App: Ask Question
App->>MCP Server: Initial Request
MCP Server->>AI Model: Minimal Context
AI Model->>MCP Server: Initial Response
alt Needs More Context
MCP Server->>MCP Server: Identify Missing Context
MCP Server->>MCP Server: Load Additional Context
MCP Server->>AI Model: Enhanced Context
AI Model->>MCP Server: Final Response
end
MCP Server->>App: Response
App->>User: Answer
Pemuatan konteks progresif bermula dengan konteks minimum dan berkembang hanya apabila perlu. Ini boleh mengurangkan penggunaan token dengan ketara untuk pertanyaan mudah sambil mengekalkan keupayaan untuk menangani soalan kompleks.
Mengurangkan saiz konteks sambil mengekalkan maklumat penting.
graph TD
A[Full Context] --> B[Compression Model]
B --> C[Compressed Context]
C --> D[Main Processing Model]
D --> E[Response]
style A fill:#A9CCE3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style B fill:#A3E4D7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style D fill:#D2B4DE,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style E fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
Pemampatan konteks menumpukan pada:
- Menghapuskan maklumat berulang
- Meringkaskan kandungan panjang
- Mengekstrak fakta dan butiran utama
- Mengekalkan elemen konteks kritikal
- Mengoptimumkan penggunaan token
Pendekatan ini amat berguna untuk mengekalkan perbualan panjang dalam tetingkap konteks atau memproses dokumen besar dengan cekap. Sesetengah pengamal menggunakan model khusus untuk pemampatan konteks dan ringkasan sejarah perbualan.
Semasa meneroka bidang baru kejuruteraan konteks, beberapa pertimbangan penting perlu diambil kira ketika bekerja dengan pelaksanaan MCP. Ini bukan amalan terbaik yang preskriptif tetapi bidang eksplorasi yang mungkin membawa penambahbaikan dalam kes penggunaan anda.
Sebelum melaksanakan penyelesaian pengurusan konteks yang kompleks, nyatakan dengan jelas apa yang ingin dicapai:
- Maklumat khusus apa yang model perlukan untuk berjaya?
- Maklumat mana yang penting dan mana yang tambahan?
- Apakah kekangan prestasi anda (kelewatan, had token, kos)?
Sesetengah pengamal berjaya dengan konteks yang disusun dalam lapisan konseptual:
- Lapisan Teras: Maklumat penting yang sentiasa diperlukan model
- Lapisan Situasi: Konteks khusus untuk interaksi semasa
- Lapisan Sokongan: Maklumat tambahan yang mungkin berguna
- Lapisan Sandaran: Maklumat yang diakses hanya apabila perlu
Keberkesanan konteks sering bergantung pada cara anda mengambil maklumat:
- Carian semantik dan embeddings untuk mencari maklumat yang relevan secara konseptual
- Carian berdasarkan kata kunci untuk butiran fakta tertentu
- Pendekatan hibrid yang menggabungkan pelbagai kaedah pengambilan
- Penapisan metadata untuk mengecilkan skop berdasarkan kategori, tarikh, atau sumber
Struktur dan aliran konteks boleh mempengaruhi kefahaman model:
- Mengelompokkan maklumat berkaitan bersama
- Menggunakan format dan organisasi yang konsisten
- Mengekalkan susunan logik atau kronologi apabila sesuai
- Mengelakkan maklumat yang bertentangan
Walaupun seni bina multi-agen popular dalam banyak rangka kerja AI, ia membawa cabaran besar dalam pengurusan konteks:
- Fragmentasi konteks boleh menyebabkan keputusan tidak konsisten antara agen
- Pemprosesan selari mungkin memperkenalkan konflik yang sukar diselesaikan
- Overhead komunikasi antara agen boleh mengurangkan peningkatan prestasi
- Pengurusan keadaan yang kompleks diperlukan untuk mengekalkan koherensi
Dalam banyak kes, pendekatan agen tunggal dengan pengurusan konteks menyeluruh mungkin menghasilkan keputusan yang lebih boleh dipercayai berbanding beberapa agen khusus dengan konteks terpecah.
Untuk memperbaiki kejuruteraan konteks dari masa ke masa, pertimbangkan cara anda mengukur kejayaan:
- Ujian A/B dengan struktur konteks berbeza
- Memantau penggunaan token dan masa respons
- Menjejak kepuasan pengguna dan kadar penyelesaian tugasan
- Menganalisis bila dan mengapa strategi konteks gagal
Pertimbangan ini mewakili bidang eksplorasi aktif dalam ruang kejuruteraan konteks. Seiring bidang ini matang, corak dan amalan yang lebih pasti mungkin muncul.
Seiring kejuruteraan konteks muncul sebagai konsep, para pengamal mula meneroka cara mengukur keberkesanannya. Tiada rangka kerja yang mantap lagi, tetapi pelbagai metrik sedang dipertimbangkan yang boleh membantu membimbing kerja masa depan.
- Nisbah Konteks-ke-Respons: Berapa banyak konteks diperlukan berbanding saiz respons?
- Penggunaan Token: Berapa peratus token konteks yang nampaknya mempengaruhi respons?
- Pengurangan Konteks: Sejauh mana kita boleh memampatkan maklumat mentah?
- Impak Kelewatan: Bagaimana pengurusan konteks mempengaruhi masa respons?
- Ekonomi Token: Adakah kita mengoptimumkan penggunaan token dengan berkesan?
- Ketepatan Pengambilan: Sejauh mana maklumat yang diambil relevan?
- Penggunaan Sumber: Apakah sumber pengkomputeran yang diperlukan?
- Kesesuaian Respons: Sejauh mana respons menjawab pertanyaan?
- Ketepatan Fakta: Adakah pengurusan konteks meningkatkan ketepatan fakta?
- Konsistensi: Adakah respons konsisten untuk pertanyaan serupa?
- Kadar Halusinasi: Adakah konteks yang lebih baik mengurangkan halusinasi model?
- Kadar Susulan: Berapa kerap pengguna memerlukan penjelasan lanjut?
- Penyelesaian Tugasan: Adakah pengguna berjaya mencapai matlamat mereka?
- Penunjuk Kepuasan: Bagaimana pengguna menilai pengalaman mereka?
Semasa bereksperimen dengan kejuruteraan konteks dalam pelaksanaan MCP, pertimbangkan pendekatan eksploratori ini:
- Perbandingan Asas: Tetapkan asas dengan pendekatan konteks mudah sebelum menguji kaedah lebih canggih
- Perubahan Berperingkat: Ubah satu aspek pengurusan konteks pada satu masa untuk mengasingkan kesannya
- Penilaian Berpusatkan Pengguna: Gabungkan metrik kuantitatif dengan maklum balas kualitatif pengguna
- Analisis Kegagalan: Teliti kes di mana strategi konteks gagal untuk memahami penambahbaikan berpotensi
- Penilaian Pelbagai Dimensi: Pertimbangkan pertukaran antara kecekapan, kualiti, dan pengalaman pengguna
Pendekatan eksperimen dan pelbagai aspek ini selaras dengan sifat kejuruteraan konteks yang sedang berkembang.
Kejuruteraan konteks adalah bidang eksplorasi baru yang mungkin menjadi pusat kepada aplikasi MCP yang berkesan. Dengan mempertimbangkan dengan teliti bagaimana maklumat mengalir melalui sistem anda, anda berpotensi mencipta pengalaman AI yang lebih cekap, tepat, dan bernilai kepada pengguna.
Teknik dan pendekatan yang diterangkan dalam modul ini mewakili pemikiran awal dalam bidang ini, bukan amalan yang sudah mantap. Kejuruteraan konteks mungkin berkembang menjadi disiplin yang lebih terperinci seiring dengan kemajuan keupayaan AI dan pemahaman kita yang mendalam. Buat masa ini, eksperimen digabungkan dengan pengukuran yang teliti nampaknya pendekatan paling produktif.
Bidang kejuruteraan konteks masih di peringkat awal, tetapi beberapa arah yang menjanjikan mula muncul:
- Prinsip kejuruteraan konteks mungkin memberi impak besar kepada prestasi model, kecekapan, pengalaman pengguna, dan kebolehpercayaan
- Pendekatan berbenang tunggal dengan pengurusan konteks menyeluruh mungkin mengatasi seni bina multi-agen untuk banyak kes penggunaan
- Model pemampatan konteks khusus mungkin menjadi komponen standard dalam rangkaian AI
- Ketegangan antara kelengkapan konteks dan had token mungkin mendorong inovasi dalam pengendalian konteks
- Apabila model menjadi lebih cekap dalam komunikasi seperti manusia, kerjasama multi-agen sebenar mungkin menjadi lebih praktikal
- Pelaksanaan MCP mungkin berkembang untuk menstandardkan corak pengurusan konteks yang muncul daripada eksperimen semasa
graph TD
A[Early Explorations] -->|Experimentation| B[Emerging Patterns]
B -->|Validation| C[Established Practices]
C -->|Application| D[New Challenges]
D -->|Innovation| A
style A fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style B fill:#A9DFBF,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C fill:#F4D03F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style D fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
- Model Context Protocol Website
- Model Context Protocol Specification
- Dokumentasi MCP
- MCP C# SDK
- MCP Python SDK
- MCP TypeScript SDK
- MCP Inspector - Alat ujian visual untuk pelayan MCP
- Jangan Bina Multi-Ejen: Prinsip Kejuruteraan Konteks - Pandangan Walden Yan mengenai prinsip kejuruteraan konteks
- Panduan Praktikal untuk Membina Ejen - Panduan OpenAI tentang reka bentuk ejen yang berkesan
- Membina Ejen yang Berkesan - Pendekatan Anthropic dalam pembangunan ejen
- Pengambilan Dinamik untuk Model Bahasa Besar - Penyelidikan mengenai pendekatan pengambilan dinamik
- Hilang di Tengah: Bagaimana Model Bahasa Menggunakan Konteks Panjang - Penyelidikan penting mengenai corak pemprosesan konteks
- Penjanaan Imej Berhierarki Berdasarkan Teks dengan CLIP Latents - Kertas DALL-E 2 dengan pandangan tentang penyusunan konteks
- Meneroka Peranan Konteks dalam Seni Bina Model Bahasa Besar - Penyelidikan terkini mengenai pengendalian konteks
- Kerjasama Multi-Ejen: Satu Tinjauan - Penyelidikan mengenai sistem multi-ejen dan cabarannya
- Teknik Pengoptimuman Tetingkap Konteks
- Teknik RAG Lanjutan
- Dokumentasi Semantic Kernel
- Alat AI untuk Pengurusan Konteks
Penafian:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator. Walaupun kami berusaha untuk ketepatan, sila ambil maklum bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang sahih. Untuk maklumat penting, terjemahan profesional oleh manusia adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.