🌐 Modul 2: MCP mit AI Toolkit Grundlagen

📋 Lernziele

Am Ende dieses Moduls wirst du in der Lage sein:

✅ Die Architektur und Vorteile des Model Context Protocol (MCP) zu verstehen
✅ Das MCP-Server-Ökosystem von Microsoft zu erkunden
✅ MCP-Server mit dem AI Toolkit Agent Builder zu integrieren
✅ Einen funktionalen Browser-Automatisierungsagenten mit Playwright MCP zu erstellen
✅ MCP-Tools innerhalb deiner Agenten zu konfigurieren und zu testen
✅ MCP-basierte Agenten für den Produktionseinsatz zu exportieren und bereitzustellen

🎯 Aufbauend auf Modul 1

In Modul 1 haben wir die Grundlagen des AI Toolkits gemeistert und unseren ersten Python-Agenten erstellt. Jetzt werden wir deine Agenten superstärken, indem wir sie über das revolutionäre Model Context Protocol (MCP) mit externen Tools und Diensten verbinden.

Stell dir das vor wie ein Upgrade von einem einfachen Taschenrechner zu einem vollwertigen Computer – deine KI-Agenten erhalten die Fähigkeit:

🌐 Websites zu durchsuchen und mit ihnen zu interagieren
📁 Dateien zu öffnen und zu bearbeiten
🔧 Sich in Unternehmenssysteme zu integrieren
📊 Echtzeitdaten von APIs zu verarbeiten

🧠 Das Model Context Protocol (MCP) verstehen

🔍 Was ist MCP?

Model Context Protocol (MCP) ist der „USB-C für KI-Anwendungen“ – ein revolutionärer offener Standard, der Large Language Models (LLMs) mit externen Tools, Datenquellen und Diensten verbindet. So wie USB-C das Kabelchaos mit einem universellen Anschluss beseitigt hat, vereinfacht MCP die KI-Integration mit einem einheitlichen Protokoll.

🎯 Das Problem, das MCP löst

Vor MCP:

🔧 Individuelle Integrationen für jedes Tool
🔄 Vendor-Lock-in durch proprietäre Lösungen
🔒 Sicherheitslücken durch Ad-hoc-Verbindungen
⏱️ Monate Entwicklungszeit für einfache Integrationen

Mit MCP:

⚡ Plug-and-Play-Tool-Integration
🔄 Vendor-agnostische Architektur
🛡️ Eingebaute Sicherheitsstandards
🚀 Neue Funktionen in Minuten hinzufügen

🏗️ MCP Architektur im Detail

MCP folgt einer Client-Server-Architektur, die ein sicheres, skalierbares Ökosystem schafft:

graph TB
    A[AI Application/Agent] --> B[MCP Client]
    B --> C[MCP Server 1: Files]
    B --> D[MCP Server 2: Web APIs]
    B --> E[MCP Server 3: Database]
    B --> F[MCP Server N: Custom Tools]
    
    C --> G[Local File System]
    D --> H[External APIs]
    E --> I[Database Systems]
    F --> J[Enterprise Systems]

🔧 Kernkomponenten:

Komponente	Rolle	Beispiele
MCP Hosts	Anwendungen, die MCP-Dienste nutzen	Claude Desktop, VS Code, AI Toolkit
MCP Clients	Protokoll-Handler (1:1 zu Servern)	In Host-Anwendungen integriert
MCP Servers	Stellen Funktionen über Standardprotokoll bereit	Playwright, Files, Azure, GitHub
Transportschicht	Kommunikationsmethoden	stdio, HTTP, WebSockets

🏢 Microsofts MCP Server-Ökosystem

Microsoft führt das MCP-Ökosystem mit einer umfassenden Suite an Enterprise-Servern, die reale Geschäftsanforderungen abdecken.

🌟 Ausgewählte Microsoft MCP Server

1. ☁️ Azure MCP Server

🔗 Repository: azure/azure-mcp
🎯 Zweck: Umfassendes Azure-Ressourcenmanagement mit KI-Integration

✨ Hauptfunktionen:

Deklarative Infrastruktur-Bereitstellung
Echtzeit-Überwachung von Ressourcen
Empfehlungen zur Kostenoptimierung
Prüfung der Sicherheitskonformität

🚀 Anwendungsfälle:

Infrastructure-as-Code mit KI-Unterstützung
Automatische Skalierung von Ressourcen
Optimierung der Cloud-Kosten
Automatisierung von DevOps-Workflows

2. 📊 Microsoft Dataverse MCP

📚 Dokumentation: Microsoft Dataverse Integration
🎯 Zweck: Natürliche Sprachschnittstelle für Geschäftsdaten

✨ Hauptfunktionen:

Datenbankabfragen in natürlicher Sprache
Verständnis des Geschäftskontexts
Anpassbare Prompt-Vorlagen
Unternehmensweite Datenverwaltung

🚀 Anwendungsfälle:

Business-Intelligence-Berichte
Kundenanalysen
Einblicke in Vertriebspipelines
Abfragen zur Einhaltung von Vorschriften

3. 🌐 Playwright MCP Server

🔗 Repository: microsoft/playwright-mcp
🎯 Zweck: Browser-Automatisierung und Web-Interaktionsfunktionen

✨ Hauptfunktionen:

Browserübergreifende Automatisierung (Chrome, Firefox, Safari)
Intelligente Elementerkennung
Erstellung von Screenshots und PDFs
Überwachung des Netzwerkverkehrs

🚀 Anwendungsfälle:

Automatisierte Testabläufe
Web-Scraping und Datenerfassung
UI/UX-Überwachung
Automatisierung der Wettbewerbsanalyse

4. 📁 Files MCP Server

🔗 Repository: microsoft/files-mcp-server
🎯 Zweck: Intelligente Dateisystemoperationen

✨ Hauptfunktionen:

Deklaratives Dateimanagement
Inhaltssynchronisation
Integration von Versionskontrolle
Metadatenextraktion

🚀 Anwendungsfälle:

Dokumentenverwaltung
Organisation von Code-Repositories
Workflows zur Inhaltsveröffentlichung
Datei-Handling in Datenpipelines

5. 📝 MarkItDown MCP Server

🔗 Repository: microsoft/markitdown
🎯 Zweck: Erweiterte Markdown-Verarbeitung und -Manipulation

✨ Hauptfunktionen:

Umfangreiche Markdown-Analyse
Formatkonvertierung (MD ↔ HTML ↔ PDF)
Inhaltsstruktur-Analyse
Template-Verarbeitung

🚀 Anwendungsfälle:

Technische Dokumentations-Workflows
Content-Management-Systeme
Berichtserstellung
Automatisierung von Wissensdatenbanken

6. 📈 Clarity MCP Server

📦 Paket: @microsoft/clarity-mcp-server
🎯 Zweck: Web-Analyse und Einblicke ins Nutzerverhalten

✨ Hauptfunktionen:

Heatmap-Datenanalyse
Aufzeichnung von Nutzer-Sitzungen
Leistungskennzahlen
Analyse von Conversion-Funnels

🚀 Anwendungsfälle:

Website-Optimierung
Nutzererfahrungsforschung
A/B-Test-Auswertung
Business-Intelligence-Dashboards

🌍 Community-Ökosystem

Neben Microsofts Servern umfasst das MCP-Ökosystem:

🐙 GitHub MCP: Repository-Verwaltung und Code-Analyse
🗄️ Datenbank-MCPs: PostgreSQL, MySQL, MongoDB-Integrationen
☁️ Cloud-Provider-MCPs: AWS, GCP, Digital Ocean Tools
📧 Kommunikations-MCPs: Slack, Teams, E-Mail-Integrationen

🛠️ Praxis-Lab: Einen Browser-Automatisierungsagenten bauen

🎯 Projektziel: Einen intelligenten Browser-Automatisierungsagenten mit dem Playwright MCP Server erstellen, der Websites navigieren, Informationen extrahieren und komplexe Web-Interaktionen durchführen kann.

🚀 Phase 1: Agentengrundlage einrichten

Schritt 1: Deinen Agenten initialisieren

Öffne AI Toolkit Agent Builder
Erstelle neuen Agenten mit folgender Konfiguration:
- Name: BrowserAgent
- Model: Choose GPT-4o

🔧 Phase 2: MCP Integration Workflow

Step 3: Add MCP Server Integration

Navigate to Tools Section in Agent Builder
Click "Add Tool" to open the integration menu
Select "MCP Server" from available options

🔍 Understanding Tool Types:

Built-in Tools: Pre-configured AI Toolkit functions
MCP Servers: External service integrations
Custom APIs: Your own service endpoints
Function Calling: Direct model function access

Step 4: MCP Server Selection

Choose "MCP Server" option to proceed
Browse MCP Catalog to explore available integrations

🎮 Phase 3: Playwright MCP Configuration

Step 5: Select and Configure Playwright

Click "Use Featured MCP Servers" to access Microsoft's verified servers
Select "Playwright" from the featured list
Accept Default MCP ID or customize for your environment

Step 6: Enable Playwright Capabilities

🔑 Critical Step: Select ALL available Playwright methods for maximum functionality

🛠️ Essential Playwright Tools:

Navigation: goto, goBack, goForward, reload
Interaction: click, fill, press, hover, drag
Extraction: textContent, innerHTML, getAttribute
Validation: isVisible, isEnabled, waitForSelector
Capture: screenshot, pdf, video
Network: setExtraHTTPHeaders, route, waitForResponse

Schritt 7: Integrationserfolg überprüfen

✅ Erfolgskriterien:

Alle Tools erscheinen in der Agent Builder-Oberfläche
Keine Fehlermeldungen im Integrationsbereich
Playwright Server-Status zeigt „Connected“

🔧 Häufige Probleme und Lösungen:

Verbindung fehlgeschlagen: Prüfe Internetverbindung und Firewall-Einstellungen
Tools fehlen: Stelle sicher, dass alle Funktionen bei der Einrichtung ausgewählt wurden
Berechtigungsfehler: Überprüfe, ob VS Code die notwendigen Systemrechte hat

🎯 Phase 4: Fortgeschrittenes Prompt-Engineering

Schritt 8: Intelligente System-Prompts entwerfen

Erstelle ausgefeilte Prompts, die Playwrights volle Fähigkeiten nutzen:

# Web Automation Expert System Prompt

## Core Identity
You are an advanced web automation specialist with deep expertise in browser automation, web scraping, and user experience analysis. You have access to Playwright tools for comprehensive browser control.

## Capabilities & Approach
### Navigation Strategy
- Always start with screenshots to understand page layout
- Use semantic selectors (text content, labels) when possible
- Implement wait strategies for dynamic content
- Handle single-page applications (SPAs) effectively

### Error Handling
- Retry failed operations with exponential backoff
- Provide clear error descriptions and solutions
- Suggest alternative approaches when primary methods fail
- Always capture diagnostic screenshots on errors

### Data Extraction
- Extract structured data in JSON format when possible
- Provide confidence scores for extracted information
- Validate data completeness and accuracy
- Handle pagination and infinite scroll scenarios

### Reporting
- Include step-by-step execution logs
- Provide before/after screenshots for verification
- Suggest optimizations and alternative approaches
- Document any limitations or edge cases encountered

## Ethical Guidelines
- Respect robots.txt and rate limiting
- Avoid overloading target servers
- Only extract publicly available information
- Follow website terms of service

Schritt 9: Dynamische Benutzer-Prompts erstellen

Gestalte Prompts, die verschiedene Funktionen demonstrieren:

🌐 Beispiel Web-Analyse:

Navigate to github.com/kinfey and provide a comprehensive analysis including:
1. Repository structure and organization
2. Recent activity and contribution patterns  
3. Documentation quality assessment
4. Technology stack identification
5. Community engagement metrics
6. Notable projects and their purposes

Include screenshots at key steps and provide actionable insights.

🚀 Phase 5: Ausführung und Test

Schritt 10: Deine erste Automatisierung ausführen

Klicke auf „Run“, um die Automatisierungssequenz zu starten
Beobachte die Echtzeit-Ausführung:
- Chrome-Browser startet automatisch
- Agent navigiert zur Zielwebsite
- Screenshots dokumentieren jeden wichtigen Schritt
- Analyseergebnisse werden in Echtzeit angezeigt

Schritt 11: Ergebnisse und Erkenntnisse analysieren

Überprüfe die umfassende Analyse in der Agent Builder-Oberfläche:

🌟 Phase 6: Erweiterte Funktionen und Bereitstellung

Schritt 12: Export und Produktionseinführung

Agent Builder unterstützt verschiedene Bereitstellungsoptionen:

🎓 Modul 2 Zusammenfassung & nächste Schritte

🏆 Erfolg freigeschaltet: MCP-Integrationsmeister

✅ Beherrschte Fähigkeiten:

MCP-Architektur und Vorteile verstehen
Das MCP-Server-Ökosystem von Microsoft navigieren
Playwright MCP mit AI Toolkit integrieren
Komplexe Browser-Automatisierungsagenten bauen
Fortgeschrittenes Prompt-Engineering für Web-Automatisierung

📚 Zusätzliche Ressourcen

🔗 MCP-Spezifikation: Offizielle Protokolldokumentation
🛠️ Playwright API: Vollständige Methodenreferenz
🏢 Microsoft MCP Server: Enterprise-Integrationsleitfaden
🌍 Community-Beispiele: MCP Server Galerie

🎉 Herzlichen Glückwunsch! Du hast die MCP-Integration erfolgreich gemeistert und kannst jetzt produktionsreife KI-Agenten mit externen Tool-Fähigkeiten erstellen!

🔜 Weiter zum nächsten Modul

Bereit, deine MCP-Kenntnisse auf die nächste Stufe zu heben? Fahre fort mit Modul 3: Fortgeschrittene MCP-Entwicklung mit AI Toolkit, wo du lernst:

Eigene benutzerdefinierte MCP-Server zu erstellen
Das neueste MCP Python SDK zu konfigurieren und zu nutzen
Den MCP Inspector für Debugging einzurichten
Fortgeschrittene Workflows für MCP-Serverentwicklung zu meistern
Einen Weather MCP Server von Grund auf zu bauen

Haftungsausschluss:
Dieses Dokument wurde mit dem KI-Übersetzungsdienst Co-op Translator übersetzt. Obwohl wir uns um Genauigkeit bemühen, beachten Sie bitte, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner Ursprungssprache gilt als maßgebliche Quelle. Für wichtige Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die durch die Verwendung dieser Übersetzung entstehen.

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

🌐 Modul 2: MCP mit AI Toolkit Grundlagen

📋 Lernziele

🎯 Aufbauend auf Modul 1

🧠 Das Model Context Protocol (MCP) verstehen

🔍 Was ist MCP?

🎯 Das Problem, das MCP löst

🏗️ MCP Architektur im Detail

🏢 Microsofts MCP Server-Ökosystem

🌟 Ausgewählte Microsoft MCP Server

1. ☁️ Azure MCP Server

2. 📊 Microsoft Dataverse MCP

3. 🌐 Playwright MCP Server

4. 📁 Files MCP Server

5. 📝 MarkItDown MCP Server

6. 📈 Clarity MCP Server

🌍 Community-Ökosystem

🛠️ Praxis-Lab: Einen Browser-Automatisierungsagenten bauen

🚀 Phase 1: Agentengrundlage einrichten

Schritt 1: Deinen Agenten initialisieren

🔧 Phase 2: MCP Integration Workflow

Step 3: Add MCP Server Integration

Step 4: MCP Server Selection

🎮 Phase 3: Playwright MCP Configuration

Step 5: Select and Configure Playwright

Step 6: Enable Playwright Capabilities

Schritt 7: Integrationserfolg überprüfen

🎯 Phase 4: Fortgeschrittenes Prompt-Engineering

Schritt 8: Intelligente System-Prompts entwerfen

Schritt 9: Dynamische Benutzer-Prompts erstellen

🚀 Phase 5: Ausführung und Test

Schritt 10: Deine erste Automatisierung ausführen

Schritt 11: Ergebnisse und Erkenntnisse analysieren

🌟 Phase 6: Erweiterte Funktionen und Bereitstellung

Schritt 12: Export und Produktionseinführung

🎓 Modul 2 Zusammenfassung & nächste Schritte

🏆 Erfolg freigeschaltet: MCP-Integrationsmeister

📚 Zusätzliche Ressourcen

🔜 Weiter zum nächsten Modul