Στο τέλος αυτής της ενότητας, θα μπορείτε να:
- ✅ Κατανοήσετε την αρχιτεκτονική και τα οφέλη του Model Context Protocol (MCP)
- ✅ Εξερευνήσετε το οικοσύστημα MCP servers της Microsoft
- ✅ Ενσωματώσετε MCP servers με το AI Toolkit Agent Builder
- ✅ Δημιουργήσετε έναν λειτουργικό πράκτορα αυτοματισμού browser χρησιμοποιώντας το Playwright MCP
- ✅ Ρυθμίσετε και δοκιμάσετε τα εργαλεία MCP μέσα στους πράκτορές σας
- ✅ Εξάγετε και αναπτύξετε πράκτορες με δυνατότητες MCP για παραγωγική χρήση
Στην Ενότητα 1, μάθαμε τα βασικά του AI Toolkit και δημιουργήσαμε τον πρώτο μας Python Agent. Τώρα θα ενισχύσουμε τους πράκτορές σας συνδέοντάς τους με εξωτερικά εργαλεία και υπηρεσίες μέσω του επαναστατικού Model Context Protocol (MCP).
Σκεφτείτε το σαν αναβάθμιση από έναν απλό υπολογιστή σε έναν πλήρη υπολογιστή – οι AI πράκτορές σας θα αποκτήσουν τη δυνατότητα να:
- 🌐 Περιηγούνται και αλληλεπιδρούν με ιστοσελίδες
- 📁 Έχουν πρόσβαση και διαχειρίζονται αρχεία
- 🔧 Ενσωματώνονται με επιχειρησιακά συστήματα
- 📊 Επεξεργάζονται δεδομένα σε πραγματικό χρόνο από APIs
Το Model Context Protocol (MCP) είναι το "USB-C για εφαρμογές AI" – ένα επαναστατικό ανοιχτό πρότυπο που συνδέει Μεγάλα Γλωσσικά Μοντέλα (LLMs) με εξωτερικά εργαλεία, πηγές δεδομένων και υπηρεσίες. Όπως το USB-C έλυσε το χάος των καλωδίων παρέχοντας έναν καθολικό σύνδεσμο, έτσι και το MCP απλοποιεί την ενσωμάτωση AI με ένα ενιαίο πρότυπο πρωτόκολλο.
Πριν το MCP:
- 🔧 Εξατομικευμένες ενσωματώσεις για κάθε εργαλείο
- 🔄 Εξάρτηση από προμηθευτές με ιδιόκτητα συστήματα
- 🔒 Ευπάθειες ασφαλείας από ad-hoc συνδέσεις
- ⏱️ Μήνες ανάπτυξης για βασικές ενσωματώσεις
Με το MCP:
- ⚡ Ενσωμάτωση εργαλείων plug-and-play
- 🔄 Αρχιτεκτονική ανεξάρτητη από προμηθευτές
- 🛡️ Ενσωματωμένες βέλτιστες πρακτικές ασφαλείας
- 🚀 Λεπτά για να προστεθούν νέες δυνατότητες
Το MCP ακολουθεί μια αρχιτεκτονική πελάτη-διακομιστή που δημιουργεί ένα ασφαλές και επεκτάσιμο οικοσύστημα:
graph TB
A[AI Application/Agent] --> B[MCP Client]
B --> C[MCP Server 1: Files]
B --> D[MCP Server 2: Web APIs]
B --> E[MCP Server 3: Database]
B --> F[MCP Server N: Custom Tools]
C --> G[Local File System]
D --> H[External APIs]
E --> I[Database Systems]
F --> J[Enterprise Systems]
🔧 Κύρια Συστατικά:
| Συστατικό | Ρόλος | Παραδείγματα |
|---|---|---|
| MCP Hosts | Εφαρμογές που καταναλώνουν υπηρεσίες MCP | Claude Desktop, VS Code, AI Toolkit |
| MCP Clients | Διαχειριστές πρωτοκόλλου (1:1 με servers) | Ενσωματωμένοι στις εφαρμογές host |
| MCP Servers | Εκθέτουν δυνατότητες μέσω τυποποιημένου πρωτοκόλλου | Playwright, Files, Azure, GitHub |
| Transport Layer | Μέθοδοι επικοινωνίας | stdio, HTTP, WebSockets |
Η Microsoft ηγείται του οικοσυστήματος MCP με μια ολοκληρωμένη σειρά servers επιχειρησιακού επιπέδου που καλύπτουν πραγματικές επιχειρηματικές ανάγκες.
🔗 Αποθετήριο: azure/azure-mcp
🎯 Σκοπός: Ολοκληρωμένη διαχείριση πόρων Azure με ενσωμάτωση AI
✨ Κύρια Χαρακτηριστικά:
- Δηλωτική παροχή υποδομής
- Παρακολούθηση πόρων σε πραγματικό χρόνο
- Προτάσεις βελτιστοποίησης κόστους
- Έλεγχος συμμόρφωσης ασφαλείας
🚀 Περιπτώσεις Χρήσης:
- Infrastructure-as-Code με βοήθεια AI
- Αυτόματη κλιμάκωση πόρων
- Βελτιστοποίηση κόστους cloud
- Αυτοματοποίηση ροών εργασίας DevOps
📚 Τεκμηρίωση: Microsoft Dataverse Integration
🎯 Σκοπός: Φυσική γλώσσα για επιχειρηματικά δεδομένα
✨ Κύρια Χαρακτηριστικά:
- Ερωτήματα βάσης δεδομένων σε φυσική γλώσσα
- Κατανόηση επιχειρηματικού πλαισίου
- Προσαρμοσμένα πρότυπα προτροπών
- Διακυβέρνηση επιχειρησιακών δεδομένων
🚀 Περιπτώσεις Χρήσης:
- Αναφορές επιχειρηματικής ευφυΐας
- Ανάλυση δεδομένων πελατών
- Επισκόπηση πωλήσεων
- Ερωτήματα συμμόρφωσης
🔗 Αποθετήριο: microsoft/playwright-mcp
🎯 Σκοπός: Αυτοματισμός browser και αλληλεπίδραση με το web
✨ Κύρια Χαρακτηριστικά:
- Αυτοματισμός σε πολλούς browsers (Chrome, Firefox, Safari)
- Έξυπνος εντοπισμός στοιχείων
- Δημιουργία screenshots και PDF
- Παρακολούθηση δικτυακής κίνησης
🚀 Περιπτώσεις Χρήσης:
- Αυτοματοποιημένες ροές δοκιμών
- Web scraping και εξαγωγή δεδομένων
- Παρακολούθηση UI/UX
- Αυτοματισμός ανταγωνιστικής ανάλυσης
🔗 Αποθετήριο: microsoft/files-mcp-server
🎯 Σκοπός: Έξυπνες λειτουργίες συστήματος αρχείων
✨ Κύρια Χαρακτηριστικά:
- Δηλωτική διαχείριση αρχείων
- Συγχρονισμός περιεχομένου
- Ενσωμάτωση ελέγχου εκδόσεων
- Εξαγωγή μεταδεδομένων
🚀 Περιπτώσεις Χρήσης:
- Διαχείριση τεκμηρίωσης
- Οργάνωση αποθετηρίων κώδικα
- Ροές εργασίας δημοσίευσης περιεχομένου
- Διαχείριση αρχείων σε pipelines δεδομένων
🔗 Αποθετήριο: microsoft/markitdown
🎯 Σκοπός: Προηγμένη επεξεργασία και διαχείριση Markdown
✨ Κύρια Χαρακτηριστικά:
- Πλούσια ανάλυση Markdown
- Μετατροπή μορφοποίησης (MD ↔ HTML ↔ PDF)
- Ανάλυση δομής περιεχομένου
- Επεξεργασία προτύπων
🚀 Περιπτώσεις Χρήσης:
- Ροές εργασίας τεχνικής τεκμηρίωσης
- Συστήματα διαχείρισης περιεχομένου
- Δημιουργία αναφορών
- Αυτοματοποίηση βάσεων γνώσης
📦 Πακέτο: @microsoft/clarity-mcp-server
🎯 Σκοπός: Ανάλυση ιστού και συμπεριφοράς χρηστών
✨ Κύρια Χαρακτηριστικά:
- Ανάλυση δεδομένων heatmap
- Εγγραφές συνεδριών χρηστών
- Μετρικές απόδοσης
- Ανάλυση funnel μετατροπών
🚀 Περιπτώσεις Χρήσης:
- Βελτιστοποίηση ιστοσελίδων
- Έρευνα εμπειρίας χρήστη
- Ανάλυση A/B testing
- Πίνακες επιχειρηματικής ευφυΐας
Πέρα από τους servers της Microsoft, το οικοσύστημα MCP περιλαμβάνει:
- 🐙 GitHub MCP: Διαχείριση αποθετηρίων και ανάλυση κώδικα
- 🗄️ Database MCPs: Ενσωματώσεις PostgreSQL, MySQL, MongoDB
- ☁️ Cloud Provider MCPs: Εργαλεία AWS, GCP, Digital Ocean
- 📧 Communication MCPs: Ενσωματώσεις Slack, Teams, Email
🎯 Στόχος Έργου: Δημιουργήστε έναν έξυπνο πράκτορα αυτοματισμού browser χρησιμοποιώντας τον Playwright MCP server που μπορεί να περιηγηθεί σε ιστοσελίδες, να εξάγει πληροφορίες και να εκτελέσει σύνθετες αλληλεπιδράσεις.
- Ανοίξτε το AI Toolkit Agent Builder
- Δημιουργήστε Νέο Πράκτορα με την παρακάτω διαμόρφωση:
- Όνομα:
BrowserAgent - Μοντέλο: Επιλέξτε GPT-4o
- Όνομα:
- Μεταβείτε στην Ενότητα Εργαλείων στο Agent Builder
- Κάντε κλικ στο "Add Tool" για να ανοίξετε το μενού ενσωμάτωσης
- Επιλέξτε "MCP Server" από τις διαθέσιμες επιλογές
🔍 Κατανόηση Τύπων Εργαλείων:
- Built-in Tools: Προδιαμορφωμένες λειτουργίες AI Toolkit
- MCP Servers: Ενσωματώσεις εξωτερικών υπηρεσιών
- Custom APIs: Δικά σας endpoints υπηρεσιών
- Function Calling: Άμεση πρόσβαση σε λειτουργίες μοντέλου
- Κάντε κλικ στο "Use Featured MCP Servers" για να δείτε τους επαληθευμένους servers της Microsoft
- Επιλέξτε "Playwright" από τη λίστα
- Αποδεχτείτε το Προεπιλεγμένο MCP ID ή προσαρμόστε το για το περιβάλλον σας
🔑 Κρίσιμο Βήμα: Επιλέξτε ΟΛΕΣ τις διαθέσιμες μεθόδους Playwright για μέγιστη λειτουργικότητα
🛠️ Απαραίτητα Εργαλεία Playwright:
- Πλοήγηση:
goto,goBack,goForward,reload - Αλληλεπίδραση:
click,fill,press,hover,drag - Εξαγωγή:
textContent,innerHTML,getAttribute - Επικύρωση:
isVisible,isEnabled,waitForSelector - Καταγραφή:
screenshot,pdf,video - Δίκτυο:
setExtraHTTPHeaders,route,waitForResponse
✅ Δείκτες Επιτυχίας:
- Όλα τα εργαλεία εμφανίζονται στο περιβάλλον του Agent Builder
- Δεν υπάρχουν μηνύματα σφάλματος στο πάνελ ενσωμάτωσης
- Η κατάσταση του Playwright server δείχνει "Connected"
🔧 Συνήθη Προβλήματα και Λύσεις:
- Αποτυχία Σύνδεσης: Ελέγξτε τη σύνδεση στο διαδίκτυο και τις ρυθμίσεις firewall
- Ελλείποντα Εργαλεία: Βεβαιωθείτε ότι επιλέχθηκαν όλες οι δυνατότητες κατά τη ρύθμιση
- Σφάλματα Δικαιωμάτων: Ελέγξτε ότι το VS Code έχει τα απαραίτητα δικαιώματα συστήματος
Δημιουργήστε σύνθετες προτροπές που αξιοποιούν πλήρως τις δυνατότητες του Playwright:
# Web Automation Expert System Prompt
## Core Identity
You are an advanced web automation specialist with deep expertise in browser automation, web scraping, and user experience analysis. You have access to Playwright tools for comprehensive browser control.
## Capabilities & Approach
### Navigation Strategy
- Always start with screenshots to understand page layout
- Use semantic selectors (text content, labels) when possible
- Implement wait strategies for dynamic content
- Handle single-page applications (SPAs) effectively
### Error Handling
- Retry failed operations with exponential backoff
- Provide clear error descriptions and solutions
- Suggest alternative approaches when primary methods fail
- Always capture diagnostic screenshots on errors
### Data Extraction
- Extract structured data in JSON format when possible
- Provide confidence scores for extracted information
- Validate data completeness and accuracy
- Handle pagination and infinite scroll scenarios
### Reporting
- Include step-by-step execution logs
- Provide before/after screenshots for verification
- Suggest optimizations and alternative approaches
- Document any limitations or edge cases encountered
## Ethical Guidelines
- Respect robots.txt and rate limiting
- Avoid overloading target servers
- Only extract publicly available information
- Follow website terms of serviceΣχεδιάστε προτροπές που επιδεικνύουν διάφορες δυνατότητες:
🌐 Παράδειγμα Ανάλυσης Ιστού:
Navigate to github.com/kinfey and provide a comprehensive analysis including:
1. Repository structure and organization
2. Recent activity and contribution patterns
3. Documentation quality assessment
4. Technology stack identification
5. Community engagement metrics
6. Notable projects and their purposes
Include screenshots at key steps and provide actionable insights.- Κάντε κλικ στο "Run" για να ξεκινήσει η ακολουθία αυτοματισμού
- Παρακολουθήστε την Εκτέλεση σε Πραγματικό Χρόνο:
- Ο browser Chrome ανοίγει αυτόματα
- Ο πράκτορας πλοηγείται στην επιλεγμένη ιστοσελίδα
- Λαμβάνονται screenshots σε κάθε σημαντικό βήμα
- Τα αποτελέσματα της ανάλυσης εμφανίζονται σε πραγματικό χρόνο
Εξετάστε την ολοκληρωμένη ανάλυση στο περιβάλλον του Agent Builder:
Το Agent Builder υποστηρίζει πολλαπλές επιλογές ανάπτυξης:









