Uzorkovanje - delegiranje značajki klijentu

Ponekad je potrebno da MCP klijent i MCP server surađuju kako bi postigli zajednički cilj. Možda imate situaciju u kojoj server treba pomoć LLM-a koji se nalazi na klijentu. Za tu situaciju, uzorkovanje je ono što biste trebali koristiti.

Istražimo neke primjere uporabe i kako izgraditi rješenje koje uključuje uzorkovanje.

Pregled

U ovoj lekciji fokusiramo se na objašnjenje kada i gdje koristiti uzorkovanje i kako ga konfigurirati.

Ciljevi učenja

U ovom poglavlju ćemo:

Objasniti što je uzorkovanje i kada ga koristiti.
Prikazati kako konfigurirati uzorkovanje u MCP-u.
Pružiti primjere uzorkovanja u praksi.

Što je uzorkovanje i zašto ga koristiti?

Uzorkovanje je napredna značajka koja radi na sljedeći način:

sequenceDiagram
    participant User
    participant MCP Client
    participant LLM
    participant MCP Server

    User->>MCP Client: Napiši blog post
    MCP Client->>MCP Server: Poziv alata (skica blog posta)
    MCP Server->>MCP Client: Zahtjev za uzorkovanjem (izradi sažetak)
    MCP Client->>LLM: Generiraj sažetak blog posta
    LLM->>MCP Client: Rezultat sažetka
    MCP Client->>MCP Server: Odgovor na uzorkovanje (sažetak)
    MCP Server->>MCP Client: Gotov blog post (skica + sažetak)
    MCP Client->>User: Blog post spreman

Zahtjev za uzorkovanje

Ok, sada imamo pregled vjerodostojnog scenarija, razgovarajmo o zahtjevu za uzorkovanje koji server šalje natrag klijentu. Evo kako takav zahtjev može izgledati u JSON-RPC formatu:

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "sampling/createMessage",
  "params": {
    "messages": [
      {
        "role": "user",
        "content": {
          "type": "text",
          "text": "Create a blog post summary of the following blog post: <BLOG POST>"
        }
      }
    ],
    "modelPreferences": {
      "hints": [
        {
          "name": "claude-3-sonnet"
        }
      ],
      "intelligencePriority": 0.8,
      "speedPriority": 0.5
    },
    "systemPrompt": "You are a helpful assistant.",
    "maxTokens": 100
  }
}

Ovdje ima nekoliko stvari koje vrijedi istaknuti:

Prompt, pod content -> text, je naš prompt koji je uputa LLM-u da sažme sadržaj blog posta.
modelPreferences. Ovaj odjeljak je upravo to, preferencija, preporuka o kojoj konfiguraciji koristiti s LLM-om. Korisnik može odlučiti hoće li se držati tih preporuka ili ih promijeniti. U ovom slučaju postoje preporuke o modelu, brzini i prioritetu inteligencije.
systemPrompt, ovo je vaš uobičajeni sistemski prompt koji daje vašem LLM-u osobnost i sadrži smjernice za upute.
maxTokens, ovo je još jedna svojina koja govori koliko tokena se preporučuje koristiti za ovaj zadatak.

Odgovor na uzorkovanje

Ovaj odgovor je ono što MCP klijent na kraju šalje natrag MCP serveru i rezultat je poziva klijentskog LLM-a, čekanja tog odgovora i zatim konstruiranja ove poruke. Evo kako može izgledati u JSON-RPC-u:

{
  "jsonrpc": "2.0",
  "id": 1,
  "result": {
    "role": "assistant",
    "content": {
      "type": "text",
      "text": "Here's your abstract <ABSTRACT>"
    },
    "model": "gpt-5",
    "stopReason": "endTurn"
  }
}

Primijetite kako je odgovor sažetak blog posta kao što smo tražili. Također primijetite kako korišteni model nije onaj koji smo tražili nego "gpt-5" umjesto "claude-3-sonnet". Ovo ilustrira da korisnik može promijeniti mišljenje o tome što želi koristiti i da je vaš zahtjev za uzorkovanje preporuka.

Ok, sada kada razumijemo glavni tijek i korisnu svrhu "kreiranje blog posta + sažetak", pogledajmo što trebamo napraviti da bismo to omogućili.

Tipovi poruka

Poruke uzorkovanja nisu ograničene samo na tekst, već možete slati i slike i zvuk. Evo kako JSON-RPC izgleda drugačije:

Tekst

{
  "type": "text",
  "text": "The message content"
}

Sadržaj slike

{
  "type": "image",
  "data": "base64-encoded-image-data",
  "mimeType": "image/jpeg"
}

Sadržaj zvuka

{
  "type": "audio",
  "data": "base64-encoded-audio-data",
  "mimeType": "audio/wav"
}

NAPOMENA: za detaljnije informacije o uzorkovanju, pogledajte službenu dokumentaciju

Kako konfigurirati uzorkovanje na klijentu

Napomena: ako gradite samo server, ovdje ne trebate puno raditi.

Na klijentu morate specificirati sljedeću značajku ovako:

{
  "capabilities": {
    "sampling": {}
  }
}

Ovo će se zatim prepoznati kada vaš odabrani klijent inicijalizira vezu sa serverom.

Primjer uzorkovanja u praksi - Izrada blog posta

Napravimo zajedno sampling server, trebamo učiniti sljedeće:

Napraviti alat na serveru.
Taj alat treba kreirati zahtjev za uzorkovanje.
Alat treba čekati da klijent odgovori na zahtjev za uzorkovanje.
Zatim treba proizvesti rezultat alata.

Pogledajmo kod korak po korak:

-1- Napravite alat

python

@mcp.tool()
async def create_blog(title: str, content: str, ctx: Context[ServerSession, None]) -> str:
    """Create a blog post and generate a summary"""

-2- Kreirajte zahtjev za uzorkovanje

Proširite svoj alat sljedećim kodom:

python

post = BlogPost(
        id=len(posts) + 1,
        title=title,
        content=content,
        abstract=""
    )

prompt = f"Create an abstract of the following blog post: title: {title} and draft: {content} "

result = await ctx.session.create_message(
        messages=[
            SamplingMessage(
                role="user",
                content=TextContent(type="text", text=prompt),
            )
        ],
        max_tokens=100,
)

-3- Pričekajte odgovor i vratite odgovor

python

post.abstract = result.content.text

posts.append(post)

# vrati kompletan proizvod
return json.dumps({
    "id": post.title,
    "abstract": post.abstract
})

-4- Cijeli kod

python

from starlette.applications import Starlette
from starlette.routing import Mount, Host

from mcp.server.fastmcp import Context, FastMCP

from mcp.server.session import ServerSession
from mcp.types import SamplingMessage, TextContent

import json


from uuid import uuid4
from typing import List
from pydantic import BaseModel


mcp = FastMCP("Blog post generator")

# app = FastAPI()

posts = []

class BlogPost(BaseModel):
    id: int
    title: str
    content: str
    abstract: str

posts: List[BlogPost] = []

@mcp.tool()
async def create_blog(title: str, content: str, ctx: Context[ServerSession, None]) -> str:
    """Create a blog post and generate a summary"""

    post = BlogPost(
        id=len(posts) + 1,
        title=title,
        content=content,
        abstract=""
    )

    prompt = f"Create an abstract of the following blog post: title: {title} and draft: {content} "

    result = await ctx.session.create_message(
        messages=[
            SamplingMessage(
                role="user",
                content=TextContent(type="text", text=prompt),
            )
        ],
        max_tokens=100,
    )

    post.abstract = result.content.text

    posts.append(post)

    # vrati cijeli blog post
    return json.dumps({
        "id": post.title,
        "abstract": post.abstract
    })

if __name__ == "__main__":
    print("Starting server...")
    # mcp.run()
    mcp.run(transport="streamable-http")

# pokreni aplikaciju s: python server.py

-5- Testiranje u Visual Studio Code

Da biste testirali ovo u Visual Studio Codeu, učinite sljedeće:

Pokrenite server u terminalu

Dodajte ga u mcp.json (i provjerite da je pokrenut) npr. ovako:

"servers": {
   "blog-server": {
     "type": "http",
     "url": "http://localhost:8000/mcp"
   }
}

Unesite prompt:

create a blog post named "Where Python comes from", the content is "Python is actually named after Monty Python Flying Circus"

Dopustite da se dogodi uzorkovanje. Prvi put kada to testirate, prikazat će vam se dodatni dijalog koji morate prihvatiti, a zatim ćete vidjeti uobičajeni dijalog s pitanjem da pokrenete alat.
Pregledajte rezultate. Vidjet ćete rezultate lijepo prikazane u GitHub Copilot Chatu, ali također možete pregledati i sirovi JSON odgovor.

Bonus. Visual Studio Code alati imaju izvrsnu podršku za uzorkovanje. Možete konfigurirati pristup uzorkovanju na vašem instaliranom serveru navigacijom ovako:

Idite u dio za proširenja.
Odaberite ikonu zupčanika za vaš instalirani server u odjeljku "MCP SERVERS - INSTALLED".
Odaberite "Configure Model Access", ovdje možete odabrati koje modele GitHub Copilot smije koristiti prilikom uzorkovanja. Također možete vidjeti sve nedavne zahtjeve za uzorkovanje odabirom "Show Sampling requests".

Zadatak

U ovom zadatku izgradit ćete malo drugačiju implementaciju uzorkovanja, a to je integracija uzorkovanja koja podržava generiranje opisa proizvoda. Evo vašeg scenarija:

Scenarij: Radnik u back officeu e-trgovine treba pomoć jer mu generiranje opisa proizvoda oduzima previše vremena. Stoga trebate napraviti rješenje u kojem pozivate alat "create_product" s argumentima "title" i "keywords" koji bi trebao proizvesti kompletan proizvod uključujući polje "description" koje će biti popunjeno LLM-om klijenta.

SAVJET: iskoristite ono što ste ranije naučili o konstrukciji servera i njegovog alata koristeći zahtjev za uzorkovanje.

Rješenje

Ključne spoznaje

Uzorkovanje je moćna značajka koja omogućuje serveru da delegira zadatke klijentu kada mu treba pomoć LLM-a.

Što slijedi

Poglavlje 4 - Praktična implementacija

Odricanje od odgovornosti: Ovaj je dokument preveden korištenjem AI usluge za prevođenje Co-op Translator. Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati službenim i autoritativnim izvorom. Za važne informacije preporučuje se profesionalni ljudski prijevod. Nismo odgovorni za bilo kakva nerazumijevanja ili pogrešna tumačenja koja proizlaze iz korištenja ovog prijevoda.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uzorkovanje - delegiranje značajki klijentu

Pregled

Ciljevi učenja

Što je uzorkovanje i zašto ga koristiti?

Zahtjev za uzorkovanje

Odgovor na uzorkovanje

Tipovi poruka

Kako konfigurirati uzorkovanje na klijentu

Primjer uzorkovanja u praksi - Izrada blog posta

-1- Napravite alat

-2- Kreirajte zahtjev za uzorkovanje

-3- Pričekajte odgovor i vratite odgovor

-4- Cijeli kod

-5- Testiranje u Visual Studio Code

Zadatak

Rješenje

Ključne spoznaje

Što slijedi

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Uzorkovanje - delegiranje značajki klijentu

Pregled

Ciljevi učenja

Što je uzorkovanje i zašto ga koristiti?

Zahtjev za uzorkovanje

Odgovor na uzorkovanje

Tipovi poruka

Kako konfigurirati uzorkovanje na klijentu

Primjer uzorkovanja u praksi - Izrada blog posta

-1- Napravite alat

-2- Kreirajte zahtjev za uzorkovanje

-3- Pričekajte odgovor i vratite odgovor

-4- Cijeli kod

-5- Testiranje u Visual Studio Code

Zadatak

Rješenje

Ključne spoznaje

Što slijedi