Context engineering je novi koncept u području umjetne inteligencije koji istražuje kako se informacije strukturiraju, prenose i održavaju tijekom interakcija između korisnika i AI servisa. Kako se Model Context Protocol (MCP) ekosustav razvija, razumijevanje učinkovitog upravljanja kontekstom postaje sve važnije. Ovaj modul uvodi pojam context engineeringa i istražuje njegove potencijalne primjene u MCP implementacijama.
Na kraju ovog modula moći ćete:
- Razumjeti novi koncept context engineeringa i njegovu moguću ulogu u MCP aplikacijama
- Prepoznati ključne izazove u upravljanju kontekstom koje MCP protokol nastoji riješiti
- Istražiti tehnike za poboljšanje performansi modela kroz bolje upravljanje kontekstom
- Razmotriti pristupe za mjerenje i evaluaciju učinkovitosti konteksta
- Primijeniti ove nove koncepte za unapređenje AI iskustava kroz MCP okvir
Context engineering je novi koncept usmjeren na namjerno dizajniranje i upravljanje protokom informacija između korisnika, aplikacija i AI modela. Za razliku od etabliranih područja poput prompt engineeringa, context engineering je još uvijek u fazi definiranja od strane praktičara koji rade na rješavanju jedinstvenih izazova pružanja pravih informacija AI modelima u pravom trenutku.
Kako su veliki jezični modeli (LLM) napredovali, važnost konteksta postala je sve očitija. Kvaliteta, relevantnost i struktura konteksta koji pružamo izravno utječu na izlaze modela. Context engineering istražuje ovaj odnos i nastoji razviti principe za učinkovito upravljanje kontekstom.
"Godine 2025., modeli su iznimno inteligentni. Ali čak ni najpametniji čovjek neće moći učinkovito obaviti svoj posao bez konteksta onoga što se traži... 'Context engineering' je sljedeća razina prompt engineeringa. Radi se o automatskom upravljanju u dinamičkom sustavu." — Walden Yan, Cognition AI
Context engineering može obuhvaćati:
- Odabir konteksta: Određivanje koje su informacije relevantne za određeni zadatak
- Strukturiranje konteksta: Organiziranje informacija za maksimalno razumijevanje modela
- Dostava konteksta: Optimizacija načina i vremena slanja informacija modelima
- Održavanje konteksta: Upravljanje stanjem i razvojem konteksta tijekom vremena
- Evaluacija konteksta: Mjerenje i poboljšanje učinkovitosti konteksta
Ova područja su posebno važna za MCP ekosustav, koji pruža standardizirani način da aplikacije dostave kontekst LLM-ovima.
Jedan od načina da se vizualizira context engineering je praćenje puta koji informacije prolaze kroz MCP sustav:
graph LR
A[User Input] --> B[Context Assembly]
B --> C[Model Processing]
C --> D[Response Generation]
D --> E[State Management]
E -->|Next Interaction| A
style A fill:#A8D5BA,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style B fill:#7FB3D5,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style D fill:#C39BD3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style E fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
- Unos korisnika: Sirove informacije od korisnika (tekst, slike, dokumenti)
- Sastavljanje konteksta: Kombiniranje korisničkog unosa sa sustavnim kontekstom, poviješću razgovora i drugim dohvaćenim informacijama
- Obrada modela: AI model obrađuje sastavljeni kontekst
- Generiranje odgovora: Model proizvodi izlaze na temelju danog konteksta
- Upravljanje stanjem: Sustav ažurira svoj interni status na temelju interakcije
Ova perspektiva ističe dinamičnu prirodu konteksta u AI sustavima i postavlja važna pitanja o tome kako najbolje upravljati informacijama u svakoj fazi.
Kako se područje context engineeringa razvija, neki rani principi počinju izlaziti iz prakse. Ti principi mogu pomoći u oblikovanju MCP implementacija:
Kontekst bi trebao biti u potpunosti dijeljen između svih komponenti sustava, a ne fragmentiran između više agenata ili procesa. Kada je kontekst razdijeljen, odluke donesene u jednom dijelu sustava mogu biti u sukobu s onima u drugom.
graph TD
subgraph "Fragmented Context Approach"
A1[Agent 1] --- C1[Context 1]
A2[Agent 2] --- C2[Context 2]
A3[Agent 3] --- C3[Context 3]
end
subgraph "Unified Context Approach"
B1[Agent] --- D1[Shared Complete Context]
end
style A1 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style A2 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style A3 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style B1 fill:#A9DFBF,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C1 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C2 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C3 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style D1 fill:#D7BDE2,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
U MCP aplikacijama to sugerira dizajniranje sustava u kojima kontekst neometano teče kroz cijeli proces, a ne da bude podijeljen u zasebne dijelove.
Svaka akcija koju model poduzme sadrži implicitne odluke o tome kako interpretirati kontekst. Kada više komponenti djeluje na različitim kontekstima, te implicitne odluke mogu biti u sukobu, što dovodi do nekonzistentnih rezultata.
Ovaj princip ima važne implikacije za MCP aplikacije:
- Preferirati linearno procesiranje složenih zadataka umjesto paralelnog izvođenja s fragmentiranim kontekstom
- Osigurati da svi odlučujući dijelovi imaju pristup istim informacijama o kontekstu
- Dizajnirati sustave u kojima kasniji koraci mogu vidjeti puni kontekst ranijih odluka
Kako razgovori i procesi traju dulje, kontekstni prozori se na kraju prepunjavaju. Učinkovit context engineering istražuje pristupe za upravljanje ovim napetostima između sveobuhvatnog konteksta i tehničkih ograničenja.
Mogući pristupi uključuju:
- Kompresiju konteksta koja zadržava bitne informacije uz smanjenje broja tokena
- Postupno učitavanje konteksta prema relevantnosti za trenutne potrebe
- Sažimanje prethodnih interakcija uz očuvanje ključnih odluka i činjenica
Model Context Protocol (MCP) dizajniran je s osviještenošću o jedinstvenim izazovima upravljanja kontekstom. Razumijevanje tih izazova pomaže objasniti ključne aspekte dizajna MCP protokola:
Većina AI modela ima fiksnu veličinu kontekstnog prozora, što ograničava količinu informacija koje mogu obraditi odjednom.
Odgovor MCP dizajna:
- Protokol podržava strukturirani, resursno bazirani kontekst koji se može učinkovito referencirati
- Resursi se mogu paginirati i učitavati postupno
Teško je odrediti koje su informacije najvažnije za uključivanje u kontekst.
Odgovor MCP dizajna:
- Fleksibilni alati omogućuju dinamičko dohvaćanje informacija prema potrebi
- Strukturirani promptovi omogućuju dosljednu organizaciju konteksta
Upravljanje stanjem kroz interakcije zahtijeva pažljivo praćenje konteksta.
Odgovor MCP dizajna:
- Standardizirano upravljanje sesijama
- Jasno definirani obrasci interakcije za evoluciju konteksta
Različite vrste podataka (tekst, slike, strukturirani podaci) zahtijevaju različite pristupe.
Odgovor MCP dizajna:
- Dizajn protokola podržava različite tipove sadržaja
- Standardizirana reprezentacija višemodalnih informacija
Kontekst često sadrži osjetljive informacije koje treba zaštititi.
Odgovor MCP dizajna:
- Jasne granice između odgovornosti klijenta i servera
- Opcije lokalne obrade za minimiziranje izloženosti podataka
Razumijevanje ovih izazova i načina na koji ih MCP rješava pruža temelj za istraživanje naprednijih tehnika context engineeringa.
Kako se područje context engineeringa razvija, pojavljuju se nekoliko obećavajućih pristupa. Oni predstavljaju trenutačne ideje, a ne uspostavljene najbolje prakse, i vjerojatno će se razvijati s iskustvom u MCP implementacijama.
Za razliku od višestrukih agenata koji dijele kontekst, neki praktičari otkrivaju da linearno procesiranje u jednom nizu daje konzistentnije rezultate. To je u skladu s principom održavanja jedinstvenog konteksta.
graph TD
A[Task Start] --> B[Process Step 1]
B --> C[Process Step 2]
C --> D[Process Step 3]
D --> E[Result]
style A fill:#A9CCE3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style B fill:#A3E4D7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style D fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style E fill:#D2B4DE,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
Iako ovaj pristup može izgledati manje učinkovit od paralelnog procesiranja, često daje koherentnije i pouzdanije rezultate jer svaki korak gradi na potpunom razumijevanju prethodnih odluka.
Razbijanje velikih konteksta na upravljive dijelove i davanje prioriteta najvažnijim informacijama.
# Conceptual Example: Context Chunking and Prioritization
def process_with_chunked_context(documents, query):
# 1. Break documents into smaller chunks
chunks = chunk_documents(documents)
# 2. Calculate relevance scores for each chunk
scored_chunks = [(chunk, calculate_relevance(chunk, query)) for chunk in chunks]
# 3. Sort chunks by relevance score
sorted_chunks = sorted(scored_chunks, key=lambda x: x[1], reverse=True)
# 4. Use the most relevant chunks as context
context = create_context_from_chunks([chunk for chunk, score in sorted_chunks[:5]])
# 5. Process with the prioritized context
return generate_response(context, query)Gornji koncept ilustrira kako možemo razbiti velike dokumente na manje dijelove i odabrati samo najrelevantnije za kontekst. Ovaj pristup pomaže raditi unutar ograničenja kontekstnog prozora, a istovremeno koristi velike baze znanja.
Učitavanje konteksta postupno, prema potrebi, umjesto odjednom.
sequenceDiagram
participant User
participant App
participant MCP Server
participant AI Model
User->>App: Ask Question
App->>MCP Server: Initial Request
MCP Server->>AI Model: Minimal Context
AI Model->>MCP Server: Initial Response
alt Needs More Context
MCP Server->>MCP Server: Identify Missing Context
MCP Server->>MCP Server: Load Additional Context
MCP Server->>AI Model: Enhanced Context
AI Model->>MCP Server: Final Response
end
MCP Server->>App: Response
App->>User: Answer
Postupno učitavanje konteksta počinje s minimalnim kontekstom i širi se samo kad je potrebno. To može značajno smanjiti broj tokena za jednostavne upite, a zadržati sposobnost rješavanja složenih pitanja.
Smanjivanje veličine konteksta uz očuvanje bitnih informacija.
graph TD
A[Full Context] --> B[Compression Model]
B --> C[Compressed Context]
C --> D[Main Processing Model]
D --> E[Response]
style A fill:#A9CCE3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style B fill:#A3E4D7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style C fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style D fill:#D2B4DE,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
style E fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
Kompresija konteksta fokusira se na:
- Uklanjanje suvišnih informacija
- Sažimanje dugog sadržaja
- Izvlačenje ključnih činjenica i detalja
- Očuvanje kritičnih elemenata konteksta
- Optimizaciju za učinkovitost tokena
Ovaj pristup je posebno vrijedan za održavanje dugih razgovora unutar kontekstnih prozora ili za učinkovitu obradu velikih dokumenata. Neki praktičari koriste specijalizirane modele posebno za kompresiju i sažimanje povijesti razgovora.
Dok istražujemo novo područje context engineeringa, nekoliko razmatranja vrijedi imati na umu pri radu s MCP implementacijama. Ovo nisu propisane najbolje prakse, već područja istraživanja koja mogu donijeti poboljšanja u vašem specifičnom slučaju.
Prije implementacije složenih rješenja za upravljanje kontekstom, jasno definirajte što želite postići:
- Koje specifične informacije model treba za uspjeh?
- Koje su informacije ključne, a koje dodatne?
- Koja su vaša ograničenja u performansama (kašnjenje, ograničenja tokena, troškovi)?
Neki praktičari uspješno koriste kontekst organiziran u konceptualne slojeve:
- Temeljni sloj: Ključne informacije koje model uvijek treba
- Situacijski sloj: Kontekst specifičan za trenutnu interakciju
- Pomoćni sloj: Dodatne informacije koje mogu biti korisne
- Rezervni sloj: Informacije dostupne samo po potrebi
Učinkovitost vašeg konteksta često ovisi o načinu dohvaćanja informacija:
- Semantičko pretraživanje i embeddings za pronalazak konceptualno relevantnih informacija
- Pretraživanje po ključnim riječima za specifične činjenice
- Hibridni pristupi koji kombiniraju više metoda dohvaćanja
- Filtriranje metapodataka za sužavanje opsega prema kategorijama, datumima ili izvorima
Struktura i tok vašeg konteksta mogu utjecati na razumijevanje modela:
- Grupiranje povezanih informacija
- Korištenje dosljednog formatiranja i organizacije
- Održavanje logičnog ili kronološkog reda gdje je prikladno
- Izbjegavanje kontradiktornih informacija
Iako su višestruki agenti popularni u mnogim AI okvirima, oni donose značajne izazove u upravljanju kontekstom:
- Fragmentacija konteksta može dovesti do nekonzistentnih odluka među agentima
- Paralelno procesiranje može uzrokovati sukobe koje je teško uskladiti
- Troškovi komunikacije između agenata mogu poništiti dobitke u performansama
- Potrebno je složeno upravljanje stanjem za održavanje koherentnosti
U mnogim slučajevima, pristup s jednim agentom i sveobuhvatnim upravljanjem kontekstom može dati pouzdanije rezultate od više specijaliziranih agenata s fragmentiranim kontekstom.
Za poboljšanje context engineeringa tijekom vremena, razmotrite kako ćete mjeriti uspjeh:
- A/B testiranje različitih struktura konteksta
- Praćenje korištenja tokena i vremena odgovora
- Praćenje zadovoljstva korisnika i stope dovršetka zadataka
- Analiza kada i zašto strategije konteksta ne uspijevaju
Ova razmatranja predstavljaju aktivna područja istraživanja u prostoru context engineeringa. Kako se područje razvija, vjerojatno će se pojaviti jasniji obrasci i prakse.
Kako context engineering postaje koncept, praktičari počinju istraživati kako bismo mogli mjeriti njegovu učinkovitost. Još ne postoji uspostavljeni okvir, ali razmatraju se različite metrike koje bi mogle usmjeriti budući rad.
- Omjer konteksta i odgovora: Koliko je konteksta potrebno u odnosu na veličinu odgovora?
- Iskorištenost tokena: Koliki postotak tokena iz konteksta utječe na odgovor?
- Smanjenje konteksta: Koliko učinkovito možemo komprimirati sirove informacije?
- Utjecaj na kašnjenje: Kako upravljanje kontekstom utječe na vrijeme odgovora?
- Ekonomija tokena: Optimiziramo li korištenje tokena?
- Preciznost dohvaćanja: Koliko su relevantne dohvaćene informacije?
- Korištenje resursa: Koji su zahtjevi za računalnim resursima?
- Relevantnost odgovora: Koliko dobro odgovor zadovoljava upit?
- Činjenična točnost: Poboljšava li upravljanje kontekstom točnost činjenica?
- Dosljednost: Jesu li odgovori dosljedni za slične upite?
- Stopa halucinacija: Smanjuje li bolji kontekst halucinacije modela?
- Stopa dodatnih pitanja: Koliko često korisnici traže pojašnjenja?
- Dovršetak zadataka: Ostvaruju li korisnici svoje ciljeve?
- Pokazatelji zadovoljstva: Kako korisnici ocjenjuju svoje iskustvo?
Prilikom eksperimentiranja s context engineeringom u MCP implementacijama, razmotrite ove pristupe:
- Usporedbe s osnovnom linijom: Uspostavite osnovu s jednostavnim pristupima prije testiranja složenijih metoda
- Postupne promjene: Mijenjajte jedan aspekt upravljanja kontekstom u jednom trenutku kako biste izolirali učinke
- Evaluacija usmjerena na korisnika: Kombinirajte kvantitativne metrike s kvalitativnim povratnim informacijama korisnika
- Analiza neuspjeha: Istražite slučajeve kada strategije konteksta ne uspijevaju kako biste razumjeli moguće poboljšanja
- Višedimenzionalna procjena: Razmotrite kompromise između učinkovitosti, kvalitete i korisničkog iskustva
Ovaj eksperimentalni, višestruki pristup mjerenju usklađen je s novom prirodom context engineeringa.
Context engineering je novo područje istraživanja koje bi moglo postati ključno za učinkovite MCP aplikacije. Pažljivim razmatranjem protoka informacija kroz vaš sustav možete stvoriti AI iskustva koja su učinkovitija, točnija i korisnija za korisnike.
Tehnike
- Model Context Protocol Website
- Model Context Protocol Specification
- MCP Documentation
- MCP C# SDK
- MCP Python SDK
- MCP TypeScript SDK
- MCP Inspector - Vizualni alat za testiranje MCP servera
- Nemojte graditi višestruke agente: principi Context Engineeringa - Walden Yanovi uvidi o principima Context Engineeringa
- Praktični vodič za izgradnju agenata - OpenAI vodič za učinkoviti dizajn agenata
- Izgradnja učinkovitih agenata - Anthropicov pristup razvoju agenata
- Dinamičko poboljšanje pretraživanja za velike jezične modele - Istraživanje o dinamičkim pristupima pretraživanju
- Izgubljeni u sredini: kako jezični modeli koriste dugi kontekst - Važno istraživanje o obrascima obrade konteksta
- Hijerarhijska generacija slika uvjetovana tekstom s CLIP latentima - DALL-E 2 rad s uvidima u strukturiranje konteksta
- Istraživanje uloge konteksta u arhitekturama velikih jezičnih modela - Najnovije istraživanje o upravljanju kontekstom
- Suradnja višestrukih agenata: pregled - Istraživanje o sustavima višestrukih agenata i njihovim izazovima
- Tehnike optimizacije kontekstnog prozora
- Napredne RAG tehnike
- Dokumentacija Semantic Kernel
- AI alat za upravljanje kontekstom
Odricanje od odgovornosti:
Ovaj dokument je preveden korištenjem AI usluge za prevođenje Co-op Translator. Iako težimo točnosti, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati autoritativnim izvorom. Za kritične informacije preporučuje se profesionalni ljudski prijevod. Ne snosimo odgovornost za bilo kakva nesporazuma ili pogrešna tumačenja koja proizlaze iz korištenja ovog prijevoda.