Po ukończeniu tego modułu będziesz potrafił:
- ✅ Zrozumieć architekturę i korzyści Model Context Protocol (MCP)
- ✅ Poznać ekosystem serwerów MCP Microsoftu
- ✅ Zintegrować serwery MCP z AI Toolkit Agent Builder
- ✅ Zbudować funkcjonalnego agenta automatyzacji przeglądarki z użyciem Playwright MCP
- ✅ Skonfigurować i przetestować narzędzia MCP w swoich agentach
- ✅ Eksportować i wdrażać agentów zasilanych MCP do użytku produkcyjnego
W Moduł 1 opanowaliśmy podstawy AI Toolkit i stworzyliśmy naszego pierwszego agenta w Pythonie. Teraz wzbogacimy twoich agentów, łącząc ich z zewnętrznymi narzędziami i usługami dzięki rewolucyjnemu Model Context Protocol (MCP).
Pomyśl o tym jak o przejściu z prostego kalkulatora do pełnoprawnego komputera – twoi agenci AI zyskają możliwość:
- 🌐 Przeglądania i interakcji ze stronami internetowymi
- 📁 Dostępu i manipulacji plikami
- 🔧 Integracji z systemami korporacyjnymi
- 📊 Przetwarzania danych w czasie rzeczywistym z API
Model Context Protocol (MCP) to „USB-C dla aplikacji AI” – rewolucyjny, otwarty standard łączący duże modele językowe (LLM) z zewnętrznymi narzędziami, źródłami danych i usługami. Tak jak USB-C wyeliminowało chaos kabli, oferując jeden uniwersalny port, tak MCP upraszcza integrację AI, stosując jeden ustandaryzowany protokół.
Przed MCP:
- 🔧 Indywidualne integracje dla każdego narzędzia
- 🔄 Uzależnienie od dostawców i ich rozwiązań
- 🔒 Luki bezpieczeństwa wynikające z ad-hoc połączeń
- ⏱️ Miesiące pracy nad podstawowymi integracjami
Z MCP:
- ⚡ Integracja narzędzi typu plug-and-play
- 🔄 Architektura niezależna od dostawcy
- 🛡️ Wbudowane najlepsze praktyki bezpieczeństwa
- 🚀 Dodanie nowych funkcji w kilka minut
MCP opiera się na architekturze klient-serwer, tworząc bezpieczny i skalowalny ekosystem:
graph TB
A[AI Application/Agent] --> B[MCP Client]
B --> C[MCP Server 1: Files]
B --> D[MCP Server 2: Web APIs]
B --> E[MCP Server 3: Database]
B --> F[MCP Server N: Custom Tools]
C --> G[Local File System]
D --> H[External APIs]
E --> I[Database Systems]
F --> J[Enterprise Systems]
🔧 Kluczowe komponenty:
| Komponent | Rola | Przykłady |
|---|---|---|
| MCP Hosts | Aplikacje korzystające z usług MCP | Claude Desktop, VS Code, AI Toolkit |
| MCP Clients | Obsługa protokołu (1:1 z serwerami) | Wbudowane w aplikacje hosta |
| MCP Servers | Udostępniają funkcje przez standardowy protokół | Playwright, Files, Azure, GitHub |
| Warstwa transportowa | Metody komunikacji | stdio, HTTP, WebSockets |
Microsoft przewodzi ekosystemowi MCP, oferując kompleksowy zestaw serwerów klasy korporacyjnej, które odpowiadają na rzeczywiste potrzeby biznesowe.
🔗 Repozytorium: azure/azure-mcp
🎯 Cel: Kompleksowe zarządzanie zasobami Azure z integracją AI
✨ Kluczowe funkcje:
- Deklaratywne provisionowanie infrastruktury
- Monitorowanie zasobów w czasie rzeczywistym
- Rekomendacje optymalizacji kosztów
- Sprawdzanie zgodności z wymogami bezpieczeństwa
🚀 Przykłady zastosowań:
- Infrastructure-as-Code z pomocą AI
- Automatyczne skalowanie zasobów
- Optymalizacja kosztów chmury
- Automatyzacja procesów DevOps
📚 Dokumentacja: Microsoft Dataverse Integration
🎯 Cel: Interfejs w języku naturalnym do danych biznesowych
✨ Kluczowe funkcje:
- Zapytania do bazy danych w języku naturalnym
- Rozumienie kontekstu biznesowego
- Własne szablony promptów
- Zarządzanie danymi korporacyjnymi
🚀 Przykłady zastosowań:
- Raportowanie BI
- Analiza danych klientów
- Wgląd w lejki sprzedażowe
- Zapytania dotyczące zgodności
🔗 Repozytorium: microsoft/playwright-mcp
🎯 Cel: Automatyzacja przeglądarki i interakcje webowe
✨ Kluczowe funkcje:
- Automatyzacja międzyprzeglądarkowa (Chrome, Firefox, Safari)
- Inteligentne wykrywanie elementów
- Generowanie zrzutów ekranu i PDF
- Monitorowanie ruchu sieciowego
🚀 Przykłady zastosowań:
- Automatyczne testy
- Web scraping i ekstrakcja danych
- Monitorowanie UI/UX
- Automatyzacja analiz konkurencji
🔗 Repozytorium: microsoft/files-mcp-server
🎯 Cel: Inteligentne operacje na systemie plików
✨ Kluczowe funkcje:
- Deklaratywne zarządzanie plikami
- Synchronizacja zawartości
- Integracja z systemami kontroli wersji
- Ekstrakcja metadanych
🚀 Przykłady zastosowań:
- Zarządzanie dokumentacją
- Organizacja repozytoriów kodu
- Workflow publikacji treści
- Obsługa plików w pipeline danych
🔗 Repozytorium: microsoft/markitdown
🎯 Cel: Zaawansowane przetwarzanie i manipulacja Markdown
✨ Kluczowe funkcje:
- Bogate parsowanie Markdown
- Konwersja formatów (MD ↔ HTML ↔ PDF)
- Analiza struktury treści
- Przetwarzanie szablonów
🚀 Przykłady zastosowań:
- Workflow dokumentacji technicznej
- Systemy zarządzania treścią
- Generowanie raportów
- Automatyzacja baz wiedzy
📦 Pakiet: @microsoft/clarity-mcp-server
🎯 Cel: Analiza webowa i zachowania użytkowników
✨ Kluczowe funkcje:
- Analiza danych heatmap
- Nagrania sesji użytkowników
- Metryki wydajności
- Analiza lejków konwersji
🚀 Przykłady zastosowań:
- Optymalizacja stron internetowych
- Badania UX
- Analiza testów A/B
- Dashboardy BI
Poza serwerami Microsoftu, ekosystem MCP obejmuje:
- 🐙 GitHub MCP: Zarządzanie repozytoriami i analiza kodu
- 🗄️ MCP dla baz danych: Integracje PostgreSQL, MySQL, MongoDB
- ☁️ MCP dostawców chmury: Narzędzia AWS, GCP, Digital Ocean
- 📧 MCP komunikacji: Integracje Slack, Teams, Email
🎯 Cel projektu: Stwórz inteligentnego agenta automatyzacji przeglądarki z użyciem serwera Playwright MCP, który potrafi nawigować po stronach, wyciągać informacje i wykonywać złożone interakcje webowe.
- Otwórz AI Toolkit Agent Builder
- Utwórz nowego agenta z następującą konfiguracją:
- Nazwa:
BrowserAgent - Model: Wybierz GPT-4o
- Nazwa:
- Przejdź do sekcji Narzędzia w Agent Builder
- Kliknij "Add Tool", aby otworzyć menu integracji
- Wybierz "MCP Server" z dostępnych opcji
🔍 Rodzaje narzędzi:
- Narzędzia wbudowane: Prekonfigurowane funkcje AI Toolkit
- Serwery MCP: Integracje z usługami zewnętrznymi
- Własne API: Twoje własne punkty końcowe usług
- Wywołania funkcji: Bezpośredni dostęp do funkcji modelu
- Kliknij "Use Featured MCP Servers", aby uzyskać dostęp do zweryfikowanych serwerów Microsoftu
- Wybierz "Playwright" z listy
- Zaakceptuj domyślne MCP ID lub dostosuj do swojego środowiska
🔑 Kluczowy krok: Zaznacz WSZYSTKIE dostępne metody Playwright, aby uzyskać maksymalną funkcjonalność
🛠️ Podstawowe narzędzia Playwright:
- Nawigacja:
goto,goBack,goForward,reload - Interakcja:
click,fill,press,hover,drag - Ekstrakcja:
textContent,innerHTML,getAttribute - Walidacja:
isVisible,isEnabled,waitForSelector - Zrzuty:
screenshot,pdf,video - Sieć:
setExtraHTTPHeaders,route,waitForResponse
✅ Wskaźniki sukcesu:
- Wszystkie narzędzia widoczne w interfejsie Agent Builder
- Brak komunikatów o błędach w panelu integracji
- Status serwera Playwright pokazuje „Connected”
🔧 Rozwiązywanie typowych problemów:
- Brak połączenia: Sprawdź połączenie internetowe i ustawienia zapory
- Brak narzędzi: Upewnij się, że wszystkie funkcje zostały wybrane podczas konfiguracji
- Błędy uprawnień: Zweryfikuj, czy VS Code ma odpowiednie uprawnienia systemowe
Stwórz zaawansowane prompt’y wykorzystujące pełne możliwości Playwright:
# Web Automation Expert System Prompt
## Core Identity
You are an advanced web automation specialist with deep expertise in browser automation, web scraping, and user experience analysis. You have access to Playwright tools for comprehensive browser control.
## Capabilities & Approach
### Navigation Strategy
- Always start with screenshots to understand page layout
- Use semantic selectors (text content, labels) when possible
- Implement wait strategies for dynamic content
- Handle single-page applications (SPAs) effectively
### Error Handling
- Retry failed operations with exponential backoff
- Provide clear error descriptions and solutions
- Suggest alternative approaches when primary methods fail
- Always capture diagnostic screenshots on errors
### Data Extraction
- Extract structured data in JSON format when possible
- Provide confidence scores for extracted information
- Validate data completeness and accuracy
- Handle pagination and infinite scroll scenarios
### Reporting
- Include step-by-step execution logs
- Provide before/after screenshots for verification
- Suggest optimizations and alternative approaches
- Document any limitations or edge cases encountered
## Ethical Guidelines
- Respect robots.txt and rate limiting
- Avoid overloading target servers
- Only extract publicly available information
- Follow website terms of serviceZaprojektuj prompt’y demonstrujące różne funkcje:
🌐 Przykład analizy stron:
Navigate to github.com/kinfey and provide a comprehensive analysis including:
1. Repository structure and organization
2. Recent activity and contribution patterns
3. Documentation quality assessment
4. Technology stack identification
5. Community engagement metrics
6. Notable projects and their purposes
Include screenshots at key steps and provide actionable insights.- Kliknij "Run", aby rozpocząć sekwencję automatyzacji
- Monitoruj wykonanie w czasie rzeczywistym:
- Automatyczne uruchomienie przeglądarki Chrome
- Agent nawigujący do docelowej strony
- Zrzuty ekranu dokumentujące każdy ważny krok
- Wyniki analizy przesyłane na bieżąco
Przejrzyj szczegółową analizę w interfejsie Agent Builder:
Agent Builder oferuje różne opcje wdrożenia:
✅ Opanowane umiejętności:
- Zrozumienie architektury i korzyści MCP
- Poruszanie się po ekosystemie serwerów MCP Microsoftu
- Integracja Playwright MCP z AI Toolkit
- Budowa zaawansowanych agentów automatyzacji przeglądarki
- Zaawansowane tworzenie promptów do automatyzacji webowej
- 🔗 Specyfikacja MCP: Oficjalna dokumentacja protokołu
- 🛠️ Playwright API: Pełna referencja metod
- 🏢 Serwery MCP Microsoftu: Przewodnik integracji korporacyjnej
- 🌍 Przykłady społeczności: Galeria serwerów MCP
🎉 Gratulacje! Opanowałeś integrację MCP i możesz teraz tworzyć produkcyjne agentów AI z funkcjami zewnętrznych narzędzi!
Chcesz rozwinąć swoje umiejętności MCP? Przejdź do Moduł 3: Zaawansowany rozwój MCP z AI Toolkit, gdzie nauczysz się:
- Tworzyć własne niestandardowe serwery MCP
- Konfigurować i korzystać z najnowszego MCP Python SDK
- Ustawiać MCP Inspector do debugowania
- Opanować zaawansowane workflowy rozwoju serwerów MCP
- Zbuduj serwer Weather MCP od podstaw
Zastrzeżenie:
Niniejszy dokument został przetłumaczony za pomocą usługi tłumaczenia AI Co-op Translator. Mimo że dokładamy starań, aby tłumaczenie było jak najbardziej precyzyjne, prosimy mieć na uwadze, że automatyczne tłumaczenia mogą zawierać błędy lub nieścisłości. Oryginalny dokument w języku źródłowym powinien być uznawany za źródło autorytatywne. W przypadku informacji o kluczowym znaczeniu zalecane jest skorzystanie z profesjonalnego tłumaczenia wykonanego przez człowieka. Nie ponosimy odpowiedzialności za jakiekolwiek nieporozumienia lub błędne interpretacje wynikające z korzystania z tego tłumaczenia.










