Skip to content

Latest commit

 

History

History
382 lines (288 loc) · 15.8 KB

File metadata and controls

382 lines (288 loc) · 15.8 KB

🌐 Modul 2: MCP mit AI Toolkit Grundlagen

Dauer Schwierigkeitsgrad Voraussetzungen

📋 Lernziele

Am Ende dieses Moduls wirst du in der Lage sein:

  • ✅ Die Architektur und Vorteile des Model Context Protocol (MCP) zu verstehen
  • ✅ Das MCP-Server-Ökosystem von Microsoft zu erkunden
  • ✅ MCP-Server mit dem AI Toolkit Agent Builder zu integrieren
  • ✅ Einen funktionalen Browser-Automatisierungsagenten mit Playwright MCP zu erstellen
  • ✅ MCP-Tools innerhalb deiner Agenten zu konfigurieren und zu testen
  • ✅ MCP-basierte Agenten für den Produktionseinsatz zu exportieren und bereitzustellen

🎯 Aufbauend auf Modul 1

In Modul 1 haben wir die Grundlagen des AI Toolkits gemeistert und unseren ersten Python-Agenten erstellt. Jetzt werden wir deine Agenten superstärken, indem wir sie über das revolutionäre Model Context Protocol (MCP) mit externen Tools und Diensten verbinden.

Stell dir das vor wie ein Upgrade von einem einfachen Taschenrechner zu einem vollwertigen Computer – deine KI-Agenten erhalten die Fähigkeit:

  • 🌐 Websites zu durchsuchen und mit ihnen zu interagieren
  • 📁 Dateien zu öffnen und zu bearbeiten
  • 🔧 Sich in Unternehmenssysteme zu integrieren
  • 📊 Echtzeitdaten von APIs zu verarbeiten

🧠 Das Model Context Protocol (MCP) verstehen

🔍 Was ist MCP?

Model Context Protocol (MCP) ist der „USB-C für KI-Anwendungen“ – ein revolutionärer offener Standard, der Large Language Models (LLMs) mit externen Tools, Datenquellen und Diensten verbindet. So wie USB-C das Kabelchaos mit einem universellen Anschluss beseitigt hat, vereinfacht MCP die KI-Integration mit einem einheitlichen Protokoll.

🎯 Das Problem, das MCP löst

Vor MCP:

  • 🔧 Individuelle Integrationen für jedes Tool
  • 🔄 Vendor-Lock-in durch proprietäre Lösungen
  • 🔒 Sicherheitslücken durch Ad-hoc-Verbindungen
  • ⏱️ Monate Entwicklungszeit für einfache Integrationen

Mit MCP:

  • ⚡ Plug-and-Play-Tool-Integration
  • 🔄 Vendor-agnostische Architektur
  • 🛡️ Eingebaute Sicherheitsstandards
  • 🚀 Neue Funktionen in Minuten hinzufügen

🏗️ MCP Architektur im Detail

MCP folgt einer Client-Server-Architektur, die ein sicheres, skalierbares Ökosystem schafft:

graph TB
    A[AI Application/Agent] --> B[MCP Client]
    B --> C[MCP Server 1: Files]
    B --> D[MCP Server 2: Web APIs]
    B --> E[MCP Server 3: Database]
    B --> F[MCP Server N: Custom Tools]
    
    C --> G[Local File System]
    D --> H[External APIs]
    E --> I[Database Systems]
    F --> J[Enterprise Systems]
Loading

🔧 Kernkomponenten:

Komponente Rolle Beispiele
MCP Hosts Anwendungen, die MCP-Dienste nutzen Claude Desktop, VS Code, AI Toolkit
MCP Clients Protokoll-Handler (1:1 zu Servern) In Host-Anwendungen integriert
MCP Servers Stellen Funktionen über Standardprotokoll bereit Playwright, Files, Azure, GitHub
Transportschicht Kommunikationsmethoden stdio, HTTP, WebSockets

🏢 Microsofts MCP Server-Ökosystem

Microsoft führt das MCP-Ökosystem mit einer umfassenden Suite an Enterprise-Servern, die reale Geschäftsanforderungen abdecken.

🌟 Ausgewählte Microsoft MCP Server

1. ☁️ Azure MCP Server

🔗 Repository: azure/azure-mcp
🎯 Zweck: Umfassendes Azure-Ressourcenmanagement mit KI-Integration

✨ Hauptfunktionen:

  • Deklarative Infrastruktur-Bereitstellung
  • Echtzeit-Überwachung von Ressourcen
  • Empfehlungen zur Kostenoptimierung
  • Prüfung der Sicherheitskonformität

🚀 Anwendungsfälle:

  • Infrastructure-as-Code mit KI-Unterstützung
  • Automatische Skalierung von Ressourcen
  • Optimierung der Cloud-Kosten
  • Automatisierung von DevOps-Workflows

2. 📊 Microsoft Dataverse MCP

📚 Dokumentation: Microsoft Dataverse Integration
🎯 Zweck: Natürliche Sprachschnittstelle für Geschäftsdaten

✨ Hauptfunktionen:

  • Datenbankabfragen in natürlicher Sprache
  • Verständnis des Geschäftskontexts
  • Anpassbare Prompt-Vorlagen
  • Unternehmensweite Datenverwaltung

🚀 Anwendungsfälle:

  • Business-Intelligence-Berichte
  • Kundenanalysen
  • Einblicke in Vertriebspipelines
  • Abfragen zur Einhaltung von Vorschriften

3. 🌐 Playwright MCP Server

🔗 Repository: microsoft/playwright-mcp
🎯 Zweck: Browser-Automatisierung und Web-Interaktionsfunktionen

✨ Hauptfunktionen:

  • Browserübergreifende Automatisierung (Chrome, Firefox, Safari)
  • Intelligente Elementerkennung
  • Erstellung von Screenshots und PDFs
  • Überwachung des Netzwerkverkehrs

🚀 Anwendungsfälle:

  • Automatisierte Testabläufe
  • Web-Scraping und Datenerfassung
  • UI/UX-Überwachung
  • Automatisierung der Wettbewerbsanalyse

4. 📁 Files MCP Server

🔗 Repository: microsoft/files-mcp-server
🎯 Zweck: Intelligente Dateisystemoperationen

✨ Hauptfunktionen:

  • Deklaratives Dateimanagement
  • Inhaltssynchronisation
  • Integration von Versionskontrolle
  • Metadatenextraktion

🚀 Anwendungsfälle:

  • Dokumentenverwaltung
  • Organisation von Code-Repositories
  • Workflows zur Inhaltsveröffentlichung
  • Datei-Handling in Datenpipelines

5. 📝 MarkItDown MCP Server

🔗 Repository: microsoft/markitdown
🎯 Zweck: Erweiterte Markdown-Verarbeitung und -Manipulation

✨ Hauptfunktionen:

  • Umfangreiche Markdown-Analyse
  • Formatkonvertierung (MD ↔ HTML ↔ PDF)
  • Inhaltsstruktur-Analyse
  • Template-Verarbeitung

🚀 Anwendungsfälle:

  • Technische Dokumentations-Workflows
  • Content-Management-Systeme
  • Berichtserstellung
  • Automatisierung von Wissensdatenbanken

6. 📈 Clarity MCP Server

📦 Paket: @microsoft/clarity-mcp-server
🎯 Zweck: Web-Analyse und Einblicke ins Nutzerverhalten

✨ Hauptfunktionen:

  • Heatmap-Datenanalyse
  • Aufzeichnung von Nutzer-Sitzungen
  • Leistungskennzahlen
  • Analyse von Conversion-Funnels

🚀 Anwendungsfälle:

  • Website-Optimierung
  • Nutzererfahrungsforschung
  • A/B-Test-Auswertung
  • Business-Intelligence-Dashboards

🌍 Community-Ökosystem

Neben Microsofts Servern umfasst das MCP-Ökosystem:

  • 🐙 GitHub MCP: Repository-Verwaltung und Code-Analyse
  • 🗄️ Datenbank-MCPs: PostgreSQL, MySQL, MongoDB-Integrationen
  • ☁️ Cloud-Provider-MCPs: AWS, GCP, Digital Ocean Tools
  • 📧 Kommunikations-MCPs: Slack, Teams, E-Mail-Integrationen

🛠️ Praxis-Lab: Einen Browser-Automatisierungsagenten bauen

🎯 Projektziel: Einen intelligenten Browser-Automatisierungsagenten mit dem Playwright MCP Server erstellen, der Websites navigieren, Informationen extrahieren und komplexe Web-Interaktionen durchführen kann.

🚀 Phase 1: Agentengrundlage einrichten

Schritt 1: Deinen Agenten initialisieren

  1. Öffne AI Toolkit Agent Builder
  2. Erstelle neuen Agenten mit folgender Konfiguration:
    • Name: BrowserAgent
    • Model: Choose GPT-4o

BrowserAgent

🔧 Phase 2: MCP Integration Workflow

Step 3: Add MCP Server Integration

  1. Navigate to Tools Section in Agent Builder
  2. Click "Add Tool" to open the integration menu
  3. Select "MCP Server" from available options

AddMCP

🔍 Understanding Tool Types:

  • Built-in Tools: Pre-configured AI Toolkit functions
  • MCP Servers: External service integrations
  • Custom APIs: Your own service endpoints
  • Function Calling: Direct model function access

Step 4: MCP Server Selection

  1. Choose "MCP Server" option to proceed AddMCPServer

  2. Browse MCP Catalog to explore available integrations MCPCatalog

🎮 Phase 3: Playwright MCP Configuration

Step 5: Select and Configure Playwright

  1. Click "Use Featured MCP Servers" to access Microsoft's verified servers
  2. Select "Playwright" from the featured list
  3. Accept Default MCP ID or customize for your environment

MCPID

Step 6: Enable Playwright Capabilities

🔑 Critical Step: Select ALL available Playwright methods for maximum functionality

Tools

🛠️ Essential Playwright Tools:

  • Navigation: goto, goBack, goForward, reload
  • Interaction: click, fill, press, hover, drag
  • Extraction: textContent, innerHTML, getAttribute
  • Validation: isVisible, isEnabled, waitForSelector
  • Capture: screenshot, pdf, video
  • Network: setExtraHTTPHeaders, route, waitForResponse

Schritt 7: Integrationserfolg überprüfen

✅ Erfolgskriterien:

  • Alle Tools erscheinen in der Agent Builder-Oberfläche
  • Keine Fehlermeldungen im Integrationsbereich
  • Playwright Server-Status zeigt „Connected“

AgentTools

🔧 Häufige Probleme und Lösungen:

  • Verbindung fehlgeschlagen: Prüfe Internetverbindung und Firewall-Einstellungen
  • Tools fehlen: Stelle sicher, dass alle Funktionen bei der Einrichtung ausgewählt wurden
  • Berechtigungsfehler: Überprüfe, ob VS Code die notwendigen Systemrechte hat

🎯 Phase 4: Fortgeschrittenes Prompt-Engineering

Schritt 8: Intelligente System-Prompts entwerfen

Erstelle ausgefeilte Prompts, die Playwrights volle Fähigkeiten nutzen:

# Web Automation Expert System Prompt

## Core Identity
You are an advanced web automation specialist with deep expertise in browser automation, web scraping, and user experience analysis. You have access to Playwright tools for comprehensive browser control.

## Capabilities & Approach
### Navigation Strategy
- Always start with screenshots to understand page layout
- Use semantic selectors (text content, labels) when possible
- Implement wait strategies for dynamic content
- Handle single-page applications (SPAs) effectively

### Error Handling
- Retry failed operations with exponential backoff
- Provide clear error descriptions and solutions
- Suggest alternative approaches when primary methods fail
- Always capture diagnostic screenshots on errors

### Data Extraction
- Extract structured data in JSON format when possible
- Provide confidence scores for extracted information
- Validate data completeness and accuracy
- Handle pagination and infinite scroll scenarios

### Reporting
- Include step-by-step execution logs
- Provide before/after screenshots for verification
- Suggest optimizations and alternative approaches
- Document any limitations or edge cases encountered

## Ethical Guidelines
- Respect robots.txt and rate limiting
- Avoid overloading target servers
- Only extract publicly available information
- Follow website terms of service

Schritt 9: Dynamische Benutzer-Prompts erstellen

Gestalte Prompts, die verschiedene Funktionen demonstrieren:

🌐 Beispiel Web-Analyse:

Navigate to github.com/kinfey and provide a comprehensive analysis including:
1. Repository structure and organization
2. Recent activity and contribution patterns  
3. Documentation quality assessment
4. Technology stack identification
5. Community engagement metrics
6. Notable projects and their purposes

Include screenshots at key steps and provide actionable insights.

Prompt

🚀 Phase 5: Ausführung und Test

Schritt 10: Deine erste Automatisierung ausführen

  1. Klicke auf „Run“, um die Automatisierungssequenz zu starten
  2. Beobachte die Echtzeit-Ausführung:
    • Chrome-Browser startet automatisch
    • Agent navigiert zur Zielwebsite
    • Screenshots dokumentieren jeden wichtigen Schritt
    • Analyseergebnisse werden in Echtzeit angezeigt

Browser

Schritt 11: Ergebnisse und Erkenntnisse analysieren

Überprüfe die umfassende Analyse in der Agent Builder-Oberfläche:

Result

🌟 Phase 6: Erweiterte Funktionen und Bereitstellung

Schritt 12: Export und Produktionseinführung

Agent Builder unterstützt verschiedene Bereitstellungsoptionen:

Code

🎓 Modul 2 Zusammenfassung & nächste Schritte

🏆 Erfolg freigeschaltet: MCP-Integrationsmeister

✅ Beherrschte Fähigkeiten:

  • MCP-Architektur und Vorteile verstehen
  • Das MCP-Server-Ökosystem von Microsoft navigieren
  • Playwright MCP mit AI Toolkit integrieren
  • Komplexe Browser-Automatisierungsagenten bauen
  • Fortgeschrittenes Prompt-Engineering für Web-Automatisierung

📚 Zusätzliche Ressourcen

🎉 Herzlichen Glückwunsch! Du hast die MCP-Integration erfolgreich gemeistert und kannst jetzt produktionsreife KI-Agenten mit externen Tool-Fähigkeiten erstellen!

🔜 Weiter zum nächsten Modul

Bereit, deine MCP-Kenntnisse auf die nächste Stufe zu heben? Fahre fort mit Modul 3: Fortgeschrittene MCP-Entwicklung mit AI Toolkit, wo du lernst:

  • Eigene benutzerdefinierte MCP-Server zu erstellen
  • Das neueste MCP Python SDK zu konfigurieren und zu nutzen
  • Den MCP Inspector für Debugging einzurichten
  • Fortgeschrittene Workflows für MCP-Serverentwicklung zu meistern
  • Einen Weather MCP Server von Grund auf zu bauen

Haftungsausschluss:
Dieses Dokument wurde mit dem KI-Übersetzungsdienst Co-op Translator übersetzt. Obwohl wir uns um Genauigkeit bemühen, beachten Sie bitte, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner Ursprungssprache gilt als maßgebliche Quelle. Für wichtige Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die durch die Verwendung dieser Übersetzung entstehen.