Innen slutten av denne modulen vil du kunne:
- ✅ Forstå Model Context Protocol (MCP) arkitektur og fordeler
- ✅ Utforske Microsofts MCP-serverøkosystem
- ✅ Integrere MCP-servere med AI Toolkit Agent Builder
- ✅ Bygge en funksjonell nettleserautomatiseringsagent med Playwright MCP
- ✅ Konfigurere og teste MCP-verktøy i agentene dine
- ✅ Eksportere og distribuere MCP-drevne agenter for produksjonsbruk
I Modul 1 mestret vi AI Toolkit-grunnleggende og laget vår første Python-agent. Nå skal vi gi agentene dine ekstra kraft ved å koble dem til eksterne verktøy og tjenester gjennom den revolusjonerende Model Context Protocol (MCP).
Tenk på dette som en oppgradering fra en enkel kalkulator til en fullverdig datamaskin – AI-agentene dine får muligheten til å:
- 🌐 Surfe og samhandle med nettsider
- 📁 Få tilgang til og manipulere filer
- 🔧 Integrere med bedriftsystemer
- 📊 Behandle sanntidsdata fra API-er
Model Context Protocol (MCP) er "USB-C for AI-applikasjoner" – en revolusjonerende åpen standard som kobler store språkmodeller (LLMs) til eksterne verktøy, datakilder og tjenester. Akkurat som USB-C fjernet kabelkaos ved å tilby én universell kontakt, fjerner MCP kompleksiteten ved AI-integrasjon med én standardisert protokoll.
Før MCP:
- 🔧 Skreddersydde integrasjoner for hvert verktøy
- 🔄 Leverandørlås med proprietære løsninger
- 🔒 Sikkerhetssårbarheter fra ad-hoc-tilkoblinger
- ⏱️ Måneder med utvikling for grunnleggende integrasjoner
Med MCP:
- ⚡ Plug-and-play verktøysintegrasjon
- 🔄 Leverandøruavhengig arkitektur
- 🛡️ Innebygde sikkerhetsrutiner
- 🚀 Minutter for å legge til nye funksjoner
MCP følger en klient-server-arkitektur som skaper et sikkert og skalerbart økosystem:
graph TB
A[AI Application/Agent] --> B[MCP Client]
B --> C[MCP Server 1: Files]
B --> D[MCP Server 2: Web APIs]
B --> E[MCP Server 3: Database]
B --> F[MCP Server N: Custom Tools]
C --> G[Local File System]
D --> H[External APIs]
E --> I[Database Systems]
F --> J[Enterprise Systems]
🔧 Kjernekomponenter:
| Komponent | Rolle | Eksempler |
|---|---|---|
| MCP Hosts | Applikasjoner som bruker MCP-tjenester | Claude Desktop, VS Code, AI Toolkit |
| MCP Clients | Protokollhåndterere (1:1 med servere) | Innebygd i host-applikasjoner |
| MCP Servers | Eksponerer funksjonalitet via standard protokoll | Playwright, Files, Azure, GitHub |
| Transport Layer | Kommunikasjonsmetoder | stdio, HTTP, WebSockets |
Microsoft leder MCP-økosystemet med en omfattende pakke av bedriftsservere som dekker reelle forretningsbehov.
🔗 Repository: azure/azure-mcp
🎯 Formål: Omfattende Azure-ressursstyring med AI-integrasjon
✨ Nøkkelfunksjoner:
- Deklarativ infrastrukturprovisjonering
- Sanntidsovervåking av ressurser
- Anbefalinger for kostnadsoptimalisering
- Sikkerhetsoverholdelse
🚀 Bruksområder:
- Infrastruktur som kode med AI-assistanse
- Automatisk ressurs-skalering
- Optimalisering av skylagringskostnader
- Automatisering av DevOps-arbeidsflyt
📚 Dokumentasjon: Microsoft Dataverse Integration
🎯 Formål: Naturlig språkgrensesnitt for forretningsdata
✨ Nøkkelfunksjoner:
- Naturlige språkspørringer mot databaser
- Forståelse av forretningskontekst
- Tilpassede prompt-maler
- Bedriftsdatastyring
🚀 Bruksområder:
- Forretningsintelligensrapportering
- Analyse av kundedata
- Innsikt i salgspipeline
- Spørringer for samsvarsdokumentasjon
🔗 Repository: microsoft/playwright-mcp
🎯 Formål: Nettleserautomatisering og webinteraksjon
✨ Nøkkelfunksjoner:
- Kryss-nettleserautomatisering (Chrome, Firefox, Safari)
- Intelligent elementgjenkjenning
- Skjermbilder og PDF-generering
- Nettverksovervåking
🚀 Bruksområder:
- Automatiserte testarbeidsflyter
- Webskraping og datauttrekk
- UI/UX-overvåking
- Automatisert konkurranseanalyse
🔗 Repository: microsoft/files-mcp-server
🎯 Formål: Intelligente filsystemoperasjoner
✨ Nøkkelfunksjoner:
- Deklarativ filhåndtering
- Innholdssynkronisering
- Versjonskontrollintegrasjon
- Metadatauttrekk
🚀 Bruksområder:
- Dokumentasjonsstyring
- Organisering av kodearkiv
- Arbeidsflyt for innholdspublisering
- Filhåndtering i datapipelines
🔗 Repository: microsoft/markitdown
🎯 Formål: Avansert Markdown-behandling og manipulering
✨ Nøkkelfunksjoner:
- Omfattende Markdown-parsing
- Formatkonvertering (MD ↔ HTML ↔ PDF)
- Analyse av innholdsstruktur
- Malbehandling
🚀 Bruksområder:
- Arbeidsflyt for teknisk dokumentasjon
- Innholdsstyringssystemer
- Rapportgenerering
- Automatisering av kunnskapsbaser
📦 Pakke: @microsoft/clarity-mcp-server
🎯 Formål: Webanalyse og innsikt i brukeradferd
✨ Nøkkelfunksjoner:
- Analyse av heatmaps
- Opptak av brukersesjoner
- Ytelsesmetrikker
- Analyse av konverteringstrakter
🚀 Bruksområder:
- Optimalisering av nettsider
- Brukeropplevelsesforskning
- A/B-testing
- Dashboards for forretningsintelligens
I tillegg til Microsofts servere inkluderer MCP-økosystemet:
- 🐙 GitHub MCP: Repository-håndtering og kodeanalyse
- 🗄️ Database MCP-er: Integrasjoner for PostgreSQL, MySQL, MongoDB
- ☁️ Cloud Provider MCP-er: Verktøy for AWS, GCP, Digital Ocean
- 📧 Kommunikasjons MCP-er: Slack, Teams, e-postintegrasjoner
🎯 Prosjektmål: Lag en intelligent nettleserautomatiseringsagent med Playwright MCP-server som kan navigere på nettsider, hente informasjon og utføre komplekse webinteraksjoner.
- Åpne AI Toolkit Agent Builder
- Opprett ny agent med følgende konfigurasjon:
- Navn:
BrowserAgent - Modell: Velg GPT-4o
- Navn:
- Gå til Verktøy-seksjonen i Agent Builder
- Klikk "Add Tool" for å åpne integrasjonsmenyen
- Velg "MCP Server" fra tilgjengelige alternativer
🔍 Forstå verktøytyper:
- Innebygde verktøy: Ferdigkonfigurerte AI Toolkit-funksjoner
- MCP-servere: Eksterne tjenesteintegrasjoner
- Egendefinerte API-er: Egne tjenendepunkter
- Funksjonskall: Direkte tilgang til modellfunksjoner
- Klikk "Use Featured MCP Servers" for å få tilgang til Microsofts verifiserte servere
- Velg "Playwright" fra listen over utvalgte
- Godta standard MCP ID eller tilpass for ditt miljø
🔑 Kritisk steg: Velg ALLE tilgjengelige Playwright-metoder for maksimal funksjonalitet
🛠️ Viktige Playwright-verktøy:
- Navigasjon:
goto,goBack,goForward,reload - Interaksjon:
click,fill,press,hover,drag - Uttrekk:
textContent,innerHTML,getAttribute - Validering:
isVisible,isEnabled,waitForSelector - Fangst:
screenshot,pdf,video - Nettverk:
setExtraHTTPHeaders,route,waitForResponse
✅ Suksessindikatorer:
- Alle verktøy vises i Agent Builder-grensesnittet
- Ingen feilmeldinger i integrasjonspanelet
- Playwright-serverstatus viser "Connected"
🔧 Vanlige feilsøkingspunkter:
- Tilkobling mislyktes: Sjekk internett og brannmurinnstillinger
- Manglende verktøy: Sørg for at alle funksjoner ble valgt under oppsett
- Tillatelsesfeil: Bekreft at VS Code har nødvendige systemtillatelser
Lag avanserte prompter som utnytter Playwrights fulle funksjonalitet:
# Web Automation Expert System Prompt
## Core Identity
You are an advanced web automation specialist with deep expertise in browser automation, web scraping, and user experience analysis. You have access to Playwright tools for comprehensive browser control.
## Capabilities & Approach
### Navigation Strategy
- Always start with screenshots to understand page layout
- Use semantic selectors (text content, labels) when possible
- Implement wait strategies for dynamic content
- Handle single-page applications (SPAs) effectively
### Error Handling
- Retry failed operations with exponential backoff
- Provide clear error descriptions and solutions
- Suggest alternative approaches when primary methods fail
- Always capture diagnostic screenshots on errors
### Data Extraction
- Extract structured data in JSON format when possible
- Provide confidence scores for extracted information
- Validate data completeness and accuracy
- Handle pagination and infinite scroll scenarios
### Reporting
- Include step-by-step execution logs
- Provide before/after screenshots for verification
- Suggest optimizations and alternative approaches
- Document any limitations or edge cases encountered
## Ethical Guidelines
- Respect robots.txt and rate limiting
- Avoid overloading target servers
- Only extract publicly available information
- Follow website terms of serviceDesign prompter som demonstrerer ulike funksjoner:
🌐 Eksempel på webanalyse:
Navigate to github.com/kinfey and provide a comprehensive analysis including:
1. Repository structure and organization
2. Recent activity and contribution patterns
3. Documentation quality assessment
4. Technology stack identification
5. Community engagement metrics
6. Notable projects and their purposes
Include screenshots at key steps and provide actionable insights.- Klikk "Run" for å starte automatiseringssekvensen
- Følg sanntidskjøringen:
- Chrome-nettleser åpnes automatisk
- Agenten navigerer til mål-nettside
- Skjermbilder tas av hvert hovedsteg
- Analyse-resultater strømmer i sanntid
Se gjennom omfattende analyser i Agent Builder-grensesnittet:
Agent Builder støtter flere distribusjonsalternativer:
✅ Ferdigheter mestret:
- Forstå MCP-arkitektur og fordeler
- Navigere Microsofts MCP-serverøkosystem
- Integrere Playwright MCP med AI Toolkit
- Bygge avanserte nettleserautomatiseringsagenter
- Avansert promptdesign for webautomatisering
- 🔗 MCP-spesifikasjon: Offisiell protokoll-dokumentasjon
- 🛠️ Playwright API: Fullstendig metodeoversikt
- 🏢 Microsoft MCP-servere: Enterprise Integrasjonsguide
- 🌍 Fellesskapseksempler: MCP Server Gallery
🎉 Gratulerer! Du har nå mestret MCP-integrasjon og kan bygge produksjonsklare AI-agenter med eksterne verktøy!
Klar for å ta MCP-ferdighetene dine til neste nivå? Gå videre til Modul 3: Avansert MCP-utvikling med AI Toolkit hvor du vil lære å:
- Lage dine egne egendefinerte MCP-servere
- Konfigurere og bruke den nyeste MCP Python SDK
- Sette opp MCP Inspector for feilsøking
- Mestre avanserte arbeidsflyter for MCP-serverutvikling
- Bygg en Weather MCP-server fra bunnen av
Ansvarsfraskrivelse:
Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten Co-op Translator. Selv om vi streber etter nøyaktighet, vennligst vær oppmerksom på at automatiske oversettelser kan inneholde feil eller unøyaktigheter. Det opprinnelige dokumentet på originalspråket skal anses som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for eventuelle misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen.










