Context Engineering: Novi koncept u MCP ekosustavu

Pregled

Context engineering je novi koncept u području umjetne inteligencije koji istražuje kako se informacije strukturiraju, prenose i održavaju tijekom interakcija između korisnika i AI servisa. Kako se Model Context Protocol (MCP) ekosustav razvija, razumijevanje učinkovitog upravljanja kontekstom postaje sve važnije. Ovaj modul uvodi pojam context engineeringa i istražuje njegove potencijalne primjene u MCP implementacijama.

Ciljevi učenja

Na kraju ovog modula moći ćete:

Razumjeti novi koncept context engineeringa i njegovu moguću ulogu u MCP aplikacijama
Prepoznati ključne izazove u upravljanju kontekstom koje MCP protokol nastoji riješiti
Istražiti tehnike za poboljšanje performansi modela kroz bolje upravljanje kontekstom
Razmotriti pristupe za mjerenje i evaluaciju učinkovitosti konteksta
Primijeniti ove nove koncepte za unapređenje AI iskustava kroz MCP okvir

Uvod u Context Engineering

Context engineering je novi koncept usmjeren na namjerno dizajniranje i upravljanje protokom informacija između korisnika, aplikacija i AI modela. Za razliku od etabliranih područja poput prompt engineeringa, context engineering je još uvijek u fazi definiranja od strane praktičara koji rade na rješavanju jedinstvenih izazova pružanja pravih informacija AI modelima u pravom trenutku.

Kako su veliki jezični modeli (LLM) napredovali, važnost konteksta postala je sve očitija. Kvaliteta, relevantnost i struktura konteksta koji pružamo izravno utječu na izlaze modela. Context engineering istražuje ovaj odnos i nastoji razviti principe za učinkovito upravljanje kontekstom.

"Godine 2025., modeli su iznimno inteligentni. Ali čak ni najpametniji čovjek neće moći učinkovito obaviti svoj posao bez konteksta onoga što se traži... 'Context engineering' je sljedeća razina prompt engineeringa. Radi se o automatskom upravljanju u dinamičkom sustavu." — Walden Yan, Cognition AI

Context engineering može obuhvaćati:

Odabir konteksta: Određivanje koje su informacije relevantne za određeni zadatak
Strukturiranje konteksta: Organiziranje informacija za maksimalno razumijevanje modela
Dostava konteksta: Optimizacija načina i vremena slanja informacija modelima
Održavanje konteksta: Upravljanje stanjem i razvojem konteksta tijekom vremena
Evaluacija konteksta: Mjerenje i poboljšanje učinkovitosti konteksta

Ova područja su posebno važna za MCP ekosustav, koji pruža standardizirani način da aplikacije dostave kontekst LLM-ovima.

Perspektiva putovanja konteksta

Jedan od načina da se vizualizira context engineering je praćenje puta koji informacije prolaze kroz MCP sustav:

graph LR
    A[User Input] --> B[Context Assembly]
    B --> C[Model Processing]
    C --> D[Response Generation]
    D --> E[State Management]
    E -->|Next Interaction| A
    
    style A fill:#A8D5BA,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style B fill:#7FB3D5,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style D fill:#C39BD3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style E fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold

Ključne faze u putovanju konteksta:

Unos korisnika: Sirove informacije od korisnika (tekst, slike, dokumenti)
Sastavljanje konteksta: Kombiniranje korisničkog unosa sa sustavnim kontekstom, poviješću razgovora i drugim dohvaćenim informacijama
Obrada modela: AI model obrađuje sastavljeni kontekst
Generiranje odgovora: Model proizvodi izlaze na temelju danog konteksta
Upravljanje stanjem: Sustav ažurira svoj interni status na temelju interakcije

Ova perspektiva ističe dinamičnu prirodu konteksta u AI sustavima i postavlja važna pitanja o tome kako najbolje upravljati informacijama u svakoj fazi.

Novi principi u Context Engineeringu

Kako se područje context engineeringa razvija, neki rani principi počinju izlaziti iz prakse. Ti principi mogu pomoći u oblikovanju MCP implementacija:

Princip 1: Dijelite kontekst u potpunosti

Kontekst bi trebao biti u potpunosti dijeljen između svih komponenti sustava, a ne fragmentiran između više agenata ili procesa. Kada je kontekst razdijeljen, odluke donesene u jednom dijelu sustava mogu biti u sukobu s onima u drugom.

graph TD
    subgraph "Fragmented Context Approach"
    A1[Agent 1] --- C1[Context 1]
    A2[Agent 2] --- C2[Context 2]
    A3[Agent 3] --- C3[Context 3]
    end
    
    subgraph "Unified Context Approach"
    B1[Agent] --- D1[Shared Complete Context]
    end
    
    style A1 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style A2 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style A3 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style B1 fill:#A9DFBF,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C1 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C2 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C3 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style D1 fill:#D7BDE2,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold

U MCP aplikacijama to sugerira dizajniranje sustava u kojima kontekst neometano teče kroz cijeli proces, a ne da bude podijeljen u zasebne dijelove.

Princip 2: Prepoznajte da akcije nose implicitne odluke

Svaka akcija koju model poduzme sadrži implicitne odluke o tome kako interpretirati kontekst. Kada više komponenti djeluje na različitim kontekstima, te implicitne odluke mogu biti u sukobu, što dovodi do nekonzistentnih rezultata.

Ovaj princip ima važne implikacije za MCP aplikacije:

Preferirati linearno procesiranje složenih zadataka umjesto paralelnog izvođenja s fragmentiranim kontekstom
Osigurati da svi odlučujući dijelovi imaju pristup istim informacijama o kontekstu
Dizajnirati sustave u kojima kasniji koraci mogu vidjeti puni kontekst ranijih odluka

Princip 3: Uravnotežite dubinu konteksta s ograničenjima prozora

Kako razgovori i procesi traju dulje, kontekstni prozori se na kraju prepunjavaju. Učinkovit context engineering istražuje pristupe za upravljanje ovim napetostima između sveobuhvatnog konteksta i tehničkih ograničenja.

Mogući pristupi uključuju:

Kompresiju konteksta koja zadržava bitne informacije uz smanjenje broja tokena
Postupno učitavanje konteksta prema relevantnosti za trenutne potrebe
Sažimanje prethodnih interakcija uz očuvanje ključnih odluka i činjenica

Izazovi konteksta i dizajn MCP protokola

Model Context Protocol (MCP) dizajniran je s osviještenošću o jedinstvenim izazovima upravljanja kontekstom. Razumijevanje tih izazova pomaže objasniti ključne aspekte dizajna MCP protokola:

Izazov 1: Ograničenja kontekstnog prozora

Većina AI modela ima fiksnu veličinu kontekstnog prozora, što ograničava količinu informacija koje mogu obraditi odjednom.

Odgovor MCP dizajna:

Protokol podržava strukturirani, resursno bazirani kontekst koji se može učinkovito referencirati
Resursi se mogu paginirati i učitavati postupno

Izazov 2: Određivanje relevantnosti

Teško je odrediti koje su informacije najvažnije za uključivanje u kontekst.

Odgovor MCP dizajna:

Fleksibilni alati omogućuju dinamičko dohvaćanje informacija prema potrebi
Strukturirani promptovi omogućuju dosljednu organizaciju konteksta

Izazov 3: Očuvanje konteksta

Upravljanje stanjem kroz interakcije zahtijeva pažljivo praćenje konteksta.

Odgovor MCP dizajna:

Standardizirano upravljanje sesijama
Jasno definirani obrasci interakcije za evoluciju konteksta

Izazov 4: Višestruki modaliteti konteksta

Različite vrste podataka (tekst, slike, strukturirani podaci) zahtijevaju različite pristupe.

Odgovor MCP dizajna:

Dizajn protokola podržava različite tipove sadržaja
Standardizirana reprezentacija višemodalnih informacija

Izazov 5: Sigurnost i privatnost

Kontekst često sadrži osjetljive informacije koje treba zaštititi.

Odgovor MCP dizajna:

Jasne granice između odgovornosti klijenta i servera
Opcije lokalne obrade za minimiziranje izloženosti podataka

Razumijevanje ovih izazova i načina na koji ih MCP rješava pruža temelj za istraživanje naprednijih tehnika context engineeringa.

Novi pristupi u Context Engineeringu

Kako se područje context engineeringa razvija, pojavljuju se nekoliko obećavajućih pristupa. Oni predstavljaju trenutačne ideje, a ne uspostavljene najbolje prakse, i vjerojatno će se razvijati s iskustvom u MCP implementacijama.

1. Linearno procesiranje u jednom nizu

Za razliku od višestrukih agenata koji dijele kontekst, neki praktičari otkrivaju da linearno procesiranje u jednom nizu daje konzistentnije rezultate. To je u skladu s principom održavanja jedinstvenog konteksta.

graph TD
    A[Task Start] --> B[Process Step 1]
    B --> C[Process Step 2]
    C --> D[Process Step 3]
    D --> E[Result]
    
    style A fill:#A9CCE3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style B fill:#A3E4D7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style D fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style E fill:#D2B4DE,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold

Iako ovaj pristup može izgledati manje učinkovit od paralelnog procesiranja, često daje koherentnije i pouzdanije rezultate jer svaki korak gradi na potpunom razumijevanju prethodnih odluka.

2. Dijeljenje i prioritizacija konteksta

Razbijanje velikih konteksta na upravljive dijelove i davanje prioriteta najvažnijim informacijama.

# Conceptual Example: Context Chunking and Prioritization
def process_with_chunked_context(documents, query):
    # 1. Break documents into smaller chunks
    chunks = chunk_documents(documents)
    
    # 2. Calculate relevance scores for each chunk
    scored_chunks = [(chunk, calculate_relevance(chunk, query)) for chunk in chunks]
    
    # 3. Sort chunks by relevance score
    sorted_chunks = sorted(scored_chunks, key=lambda x: x[1], reverse=True)
    
    # 4. Use the most relevant chunks as context
    context = create_context_from_chunks([chunk for chunk, score in sorted_chunks[:5]])
    
    # 5. Process with the prioritized context
    return generate_response(context, query)

Gornji koncept ilustrira kako možemo razbiti velike dokumente na manje dijelove i odabrati samo najrelevantnije za kontekst. Ovaj pristup pomaže raditi unutar ograničenja kontekstnog prozora, a istovremeno koristi velike baze znanja.

3. Postupno učitavanje konteksta

Učitavanje konteksta postupno, prema potrebi, umjesto odjednom.

sequenceDiagram
    participant User
    participant App
    participant MCP Server
    participant AI Model

    User->>App: Ask Question
    App->>MCP Server: Initial Request
    MCP Server->>AI Model: Minimal Context
    AI Model->>MCP Server: Initial Response
    
    alt Needs More Context
        MCP Server->>MCP Server: Identify Missing Context
        MCP Server->>MCP Server: Load Additional Context
        MCP Server->>AI Model: Enhanced Context
        AI Model->>MCP Server: Final Response
    end
    
    MCP Server->>App: Response
    App->>User: Answer

Postupno učitavanje konteksta počinje s minimalnim kontekstom i širi se samo kad je potrebno. To može značajno smanjiti broj tokena za jednostavne upite, a zadržati sposobnost rješavanja složenih pitanja.

4. Kompresija i sažimanje konteksta

Smanjivanje veličine konteksta uz očuvanje bitnih informacija.

graph TD
    A[Full Context] --> B[Compression Model]
    B --> C[Compressed Context]
    C --> D[Main Processing Model]
    D --> E[Response]
    
    style A fill:#A9CCE3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style B fill:#A3E4D7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style D fill:#D2B4DE,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style E fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold

Kompresija konteksta fokusira se na:

Uklanjanje suvišnih informacija
Sažimanje dugog sadržaja
Izvlačenje ključnih činjenica i detalja
Očuvanje kritičnih elemenata konteksta
Optimizaciju za učinkovitost tokena

Ovaj pristup je posebno vrijedan za održavanje dugih razgovora unutar kontekstnih prozora ili za učinkovitu obradu velikih dokumenata. Neki praktičari koriste specijalizirane modele posebno za kompresiju i sažimanje povijesti razgovora.

Razmatranja u istraživanju Context Engineeringa

Dok istražujemo novo područje context engineeringa, nekoliko razmatranja vrijedi imati na umu pri radu s MCP implementacijama. Ovo nisu propisane najbolje prakse, već područja istraživanja koja mogu donijeti poboljšanja u vašem specifičnom slučaju.

Razmotrite svoje ciljeve konteksta

Prije implementacije složenih rješenja za upravljanje kontekstom, jasno definirajte što želite postići:

Koje specifične informacije model treba za uspjeh?
Koje su informacije ključne, a koje dodatne?
Koja su vaša ograničenja u performansama (kašnjenje, ograničenja tokena, troškovi)?

Istražite slojevite pristupe kontekstu

Neki praktičari uspješno koriste kontekst organiziran u konceptualne slojeve:

Temeljni sloj: Ključne informacije koje model uvijek treba
Situacijski sloj: Kontekst specifičan za trenutnu interakciju
Pomoćni sloj: Dodatne informacije koje mogu biti korisne
Rezervni sloj: Informacije dostupne samo po potrebi

Istražite strategije dohvaćanja

Učinkovitost vašeg konteksta često ovisi o načinu dohvaćanja informacija:

Semantičko pretraživanje i embeddings za pronalazak konceptualno relevantnih informacija
Pretraživanje po ključnim riječima za specifične činjenice
Hibridni pristupi koji kombiniraju više metoda dohvaćanja
Filtriranje metapodataka za sužavanje opsega prema kategorijama, datumima ili izvorima

Eksperimentirajte s koherentnošću konteksta

Struktura i tok vašeg konteksta mogu utjecati na razumijevanje modela:

Grupiranje povezanih informacija
Korištenje dosljednog formatiranja i organizacije
Održavanje logičnog ili kronološkog reda gdje je prikladno
Izbjegavanje kontradiktornih informacija

Procijenite kompromise višestrukih agenata

Iako su višestruki agenti popularni u mnogim AI okvirima, oni donose značajne izazove u upravljanju kontekstom:

Fragmentacija konteksta može dovesti do nekonzistentnih odluka među agentima
Paralelno procesiranje može uzrokovati sukobe koje je teško uskladiti
Troškovi komunikacije između agenata mogu poništiti dobitke u performansama
Potrebno je složeno upravljanje stanjem za održavanje koherentnosti

U mnogim slučajevima, pristup s jednim agentom i sveobuhvatnim upravljanjem kontekstom može dati pouzdanije rezultate od više specijaliziranih agenata s fragmentiranim kontekstom.

Razvijajte metode evaluacije

Za poboljšanje context engineeringa tijekom vremena, razmotrite kako ćete mjeriti uspjeh:

A/B testiranje različitih struktura konteksta
Praćenje korištenja tokena i vremena odgovora
Praćenje zadovoljstva korisnika i stope dovršetka zadataka
Analiza kada i zašto strategije konteksta ne uspijevaju

Ova razmatranja predstavljaju aktivna područja istraživanja u prostoru context engineeringa. Kako se područje razvija, vjerojatno će se pojaviti jasniji obrasci i prakse.

Mjerenje učinkovitosti konteksta: Razvijajući okvir

Kako context engineering postaje koncept, praktičari počinju istraživati kako bismo mogli mjeriti njegovu učinkovitost. Još ne postoji uspostavljeni okvir, ali razmatraju se različite metrike koje bi mogle usmjeriti budući rad.

Potencijalne dimenzije mjerenja

1. Razmatranja učinkovitosti unosa

Omjer konteksta i odgovora: Koliko je konteksta potrebno u odnosu na veličinu odgovora?
Iskorištenost tokena: Koliki postotak tokena iz konteksta utječe na odgovor?
Smanjenje konteksta: Koliko učinkovito možemo komprimirati sirove informacije?

2. Razmatranja performansi

Utjecaj na kašnjenje: Kako upravljanje kontekstom utječe na vrijeme odgovora?
Ekonomija tokena: Optimiziramo li korištenje tokena?
Preciznost dohvaćanja: Koliko su relevantne dohvaćene informacije?
Korištenje resursa: Koji su zahtjevi za računalnim resursima?

3. Razmatranja kvalitete

Relevantnost odgovora: Koliko dobro odgovor zadovoljava upit?
Činjenična točnost: Poboljšava li upravljanje kontekstom točnost činjenica?
Dosljednost: Jesu li odgovori dosljedni za slične upite?
Stopa halucinacija: Smanjuje li bolji kontekst halucinacije modela?

4. Razmatranja korisničkog iskustva

Stopa dodatnih pitanja: Koliko često korisnici traže pojašnjenja?
Dovršetak zadataka: Ostvaruju li korisnici svoje ciljeve?
Pokazatelji zadovoljstva: Kako korisnici ocjenjuju svoje iskustvo?

Istraživački pristupi mjerenju

Prilikom eksperimentiranja s context engineeringom u MCP implementacijama, razmotrite ove pristupe:

Usporedbe s osnovnom linijom: Uspostavite osnovu s jednostavnim pristupima prije testiranja složenijih metoda
Postupne promjene: Mijenjajte jedan aspekt upravljanja kontekstom u jednom trenutku kako biste izolirali učinke
Evaluacija usmjerena na korisnika: Kombinirajte kvantitativne metrike s kvalitativnim povratnim informacijama korisnika
Analiza neuspjeha: Istražite slučajeve kada strategije konteksta ne uspijevaju kako biste razumjeli moguće poboljšanja
Višedimenzionalna procjena: Razmotrite kompromise između učinkovitosti, kvalitete i korisničkog iskustva

Ovaj eksperimentalni, višestruki pristup mjerenju usklađen je s novom prirodom context engineeringa.

Završne misli

Context engineering je novo područje istraživanja koje bi moglo postati ključno za učinkovite MCP aplikacije. Pažljivim razmatranjem protoka informacija kroz vaš sustav možete stvoriti AI iskustva koja su učinkovitija, točnija i korisnija za korisnike.

Tehnike

Model Context Protocol Website
Model Context Protocol Specification
MCP Documentation
MCP C# SDK
MCP Python SDK
MCP TypeScript SDK
MCP Inspector - Vizualni alat za testiranje MCP servera

Članci o Context Engineeringu

Nemojte graditi višestruke agente: principi Context Engineeringa - Walden Yanovi uvidi o principima Context Engineeringa
Praktični vodič za izgradnju agenata - OpenAI vodič za učinkoviti dizajn agenata
Izgradnja učinkovitih agenata - Anthropicov pristup razvoju agenata

Povezana istraživanja

Dinamičko poboljšanje pretraživanja za velike jezične modele - Istraživanje o dinamičkim pristupima pretraživanju
Izgubljeni u sredini: kako jezični modeli koriste dugi kontekst - Važno istraživanje o obrascima obrade konteksta
Hijerarhijska generacija slika uvjetovana tekstom s CLIP latentima - DALL-E 2 rad s uvidima u strukturiranje konteksta
Istraživanje uloge konteksta u arhitekturama velikih jezičnih modela - Najnovije istraživanje o upravljanju kontekstom
Suradnja višestrukih agenata: pregled - Istraživanje o sustavima višestrukih agenata i njihovim izazovima

Dodatni resursi

Što slijedi

6. Doprinosi zajednice

Odricanje od odgovornosti:
Ovaj dokument je preveden korištenjem AI usluge za prevođenje Co-op Translator. Iako težimo točnosti, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati autoritativnim izvorom. Za kritične informacije preporučuje se profesionalni ljudski prijevod. Ne snosimo odgovornost za bilo kakva nesporazuma ili pogrešna tumačenja koja proizlaze iz korištenja ovog prijevoda.

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Context Engineering: Novi koncept u MCP ekosustavu

Pregled

Ciljevi učenja

Uvod u Context Engineering

Perspektiva putovanja konteksta

Ključne faze u putovanju konteksta:

Novi principi u Context Engineeringu

Princip 1: Dijelite kontekst u potpunosti

Princip 2: Prepoznajte da akcije nose implicitne odluke

Princip 3: Uravnotežite dubinu konteksta s ograničenjima prozora

Izazovi konteksta i dizajn MCP protokola

Izazov 1: Ograničenja kontekstnog prozora

Izazov 2: Određivanje relevantnosti

Izazov 3: Očuvanje konteksta

Izazov 4: Višestruki modaliteti konteksta

Izazov 5: Sigurnost i privatnost

Novi pristupi u Context Engineeringu

1. Linearno procesiranje u jednom nizu

2. Dijeljenje i prioritizacija konteksta

3. Postupno učitavanje konteksta

4. Kompresija i sažimanje konteksta

Razmatranja u istraživanju Context Engineeringa

Razmotrite svoje ciljeve konteksta

Istražite slojevite pristupe kontekstu

Istražite strategije dohvaćanja

Eksperimentirajte s koherentnošću konteksta

Procijenite kompromise višestrukih agenata

Razvijajte metode evaluacije

Mjerenje učinkovitosti konteksta: Razvijajući okvir

Potencijalne dimenzije mjerenja

1. Razmatranja učinkovitosti unosa

2. Razmatranja performansi

3. Razmatranja kvalitete

4. Razmatranja korisničkog iskustva

Istraživački pristupi mjerenju

Završne misli

Članci o Context Engineeringu

Povezana istraživanja

Dodatni resursi

Što slijedi