Контекстная инженерия: новый концепт в экосистеме MCP

Обзор

Контекстная инженерия — это новый концепт в области искусственного интеллекта, который изучает, как информация структурируется, передается и поддерживается в ходе взаимодействия между клиентами и AI-сервисами. По мере развития экосистемы Model Context Protocol (MCP) понимание эффективного управления контекстом становится все более важным. Этот модуль вводит понятие контекстной инженерии и исследует ее потенциальные применения в реализации MCP.

Цели обучения

К концу этого модуля вы сможете:

Понять новый концепт контекстной инженерии и ее возможную роль в приложениях MCP
Выявить ключевые проблемы управления контекстом, которые решает дизайн MCP протокола
Изучить методы улучшения производительности моделей через более эффективное управление контекстом
Рассмотреть подходы к измерению и оценке эффективности контекста
Применить эти новые концепты для улучшения AI-опыта через MCP-фреймворк

Введение в контекстную инженерию

Контекстная инженерия — это новый подход, сосредоточенный на целенаправленном проектировании и управлении потоком информации между пользователями, приложениями и AI-моделями. В отличие от таких устоявшихся областей, как инженерия подсказок, контекстная инженерия все еще формируется практиками, которые работают над решением уникальных задач предоставления AI-моделям нужной информации в нужное время.

С развитием больших языковых моделей (LLMs) важность контекста становится все более очевидной. Качество, релевантность и структура предоставляемого контекста напрямую влияют на результаты работы модели. Контекстная инженерия изучает эту взаимосвязь и стремится разработать принципы эффективного управления контекстом.

"В 2025 году существующие модели будут чрезвычайно умными. Но даже самый умный человек не сможет эффективно выполнять свою работу без контекста того, что от него требуется... 'Контекстная инженерия' — это следующий уровень инженерии подсказок. Она заключается в автоматизации этого процесса в динамической системе." — Уолден Ян, Cognition AI

Контекстная инженерия может включать:

Выбор контекста: Определение, какая информация релевантна для конкретной задачи
Структурирование контекста: Организация информации для максимального понимания моделью
Передача контекста: Оптимизация того, как и когда информация отправляется моделям
Поддержание контекста: Управление состоянием и эволюцией контекста со временем
Оценка контекста: Измерение и улучшение эффективности контекста

Эти аспекты особенно актуальны для экосистемы MCP, которая предоставляет стандартизированный способ передачи контекста LLM.

Перспектива "Путешествия контекста"

Один из способов визуализировать контекстную инженерию — это проследить путь, который информация проходит через систему MCP:

graph LR
    A[User Input] --> B[Context Assembly]
    B --> C[Model Processing]
    C --> D[Response Generation]
    D --> E[State Management]
    E -->|Next Interaction| A
    
    style A fill:#A8D5BA,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style B fill:#7FB3D5,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style D fill:#C39BD3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style E fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold

Основные этапы "путешествия контекста":

Ввод пользователя: Исходная информация от пользователя (текст, изображения, документы)
Сборка контекста: Объединение ввода пользователя с системным контекстом, историей взаимодействий и другой извлеченной информацией
Обработка моделью: AI-модель обрабатывает собранный контекст
Генерация ответа: Модель создает результаты на основе предоставленного контекста
Управление состоянием: Система обновляет свое внутреннее состояние на основе взаимодействия

Этот подход подчеркивает динамическую природу контекста в AI-системах и ставит важные вопросы о том, как лучше управлять информацией на каждом этапе.

Новые принципы контекстной инженерии

По мере формирования области контекстной инженерии начинают появляться первые принципы, которые могут помочь в выборе подходов к реализации MCP.

Принцип 1: Полное разделение контекста

Контекст должен полностью разделяться между всеми компонентами системы, а не быть фрагментированным между несколькими агентами или процессами. Когда контекст распределен, решения, принятые в одной части системы, могут противоречить решениям, принятым в другой.

graph TD
    subgraph "Fragmented Context Approach"
    A1[Agent 1] --- C1[Context 1]
    A2[Agent 2] --- C2[Context 2]
    A3[Agent 3] --- C3[Context 3]
    end
    
    subgraph "Unified Context Approach"
    B1[Agent] --- D1[Shared Complete Context]
    end
    
    style A1 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style A2 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style A3 fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style B1 fill:#A9DFBF,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C1 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C2 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C3 fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style D1 fill:#D7BDE2,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold

В приложениях MCP это предполагает проектирование систем, где контекст плавно проходит через весь процесс, а не разделяется на части.

Принцип 2: Действия несут в себе скрытые решения

Каждое действие модели включает скрытые решения о том, как интерпретировать контекст. Когда несколько компонентов работают с разными контекстами, эти скрытые решения могут конфликтовать, приводя к несогласованным результатам.

Этот принцип имеет важные последствия для приложений MCP:

Предпочитайте линейную обработку сложных задач вместо параллельного выполнения с фрагментированным контекстом
Убедитесь, что все точки принятия решений имеют доступ к одному и тому же контексту
Проектируйте системы, где последующие шаги могут видеть полный контекст предыдущих решений

Принцип 3: Баланс глубины контекста и ограничений окна

По мере увеличения длины взаимодействий и процессов окна контекста в конечном итоге переполняются. Эффективная контекстная инженерия исследует подходы к управлению этим напряжением между полным контекстом и техническими ограничениями.

Возможные подходы включают:

Сжатие контекста, которое сохраняет важную информацию, уменьшая использование токенов
Прогрессивная загрузка контекста на основе его актуальности для текущих нужд
Суммирование предыдущих взаимодействий с сохранением ключевых решений и фактов

Проблемы контекста и дизайн MCP протокола

Model Context Protocol (MCP) был разработан с учетом уникальных проблем управления контекстом. Понимание этих проблем помогает объяснить ключевые аспекты дизайна MCP протокола:

Проблема 1: Ограничения окна контекста

Большинство AI-моделей имеют фиксированные размеры окон контекста, ограничивающие объем информации, которую они могут обработать за один раз.

Ответ дизайна MCP:

Протокол поддерживает структурированный контекст на основе ресурсов, который можно эффективно ссылаться
Ресурсы могут быть разбиты на страницы и загружены постепенно

Проблема 2: Определение релевантности

Определение, какая информация наиболее релевантна для включения в контекст, является сложной задачей.

Ответ дизайна MCP:

Гибкие инструменты позволяют динамически извлекать информацию в зависимости от потребностей
Структурированные подсказки обеспечивают последовательную организацию контекста

Проблема 3: Сохранение контекста

Управление состоянием между взаимодействиями требует тщательного отслеживания контекста.

Ответ дизайна MCP:

Стандартизированное управление сессиями
Четко определенные шаблоны взаимодействия для эволюции контекста

Проблема 4: Мультимодальный контекст

Различные типы данных (текст, изображения, структурированные данные) требуют разного подхода.

Ответ дизайна MCP:

Дизайн протокола учитывает различные типы контента
Стандартизированное представление мультимодальной информации

Проблема 5: Безопасность и конфиденциальность

Контекст часто содержит конфиденциальную информацию, которую необходимо защищать.

Ответ дизайна MCP:

Четкие границы между обязанностями клиента и сервера
Опции локальной обработки для минимизации утечки данных

Понимание этих проблем и того, как MCP их решает, создает основу для изучения более сложных техник контекстной инженерии.

Новые подходы к контекстной инженерии

По мере развития области контекстной инженерии появляются несколько перспективных подходов. Они представляют текущие идеи, а не устоявшиеся лучшие практики, и, вероятно, будут развиваться с накоплением опыта в реализации MCP.

1. Линейная обработка в одном потоке

В отличие от архитектур с несколькими агентами, которые распределяют контекст, некоторые практики обнаруживают, что линейная обработка в одном потоке дает более последовательные результаты. Это соответствует принципу сохранения единого контекста.

graph TD
    A[Task Start] --> B[Process Step 1]
    B --> C[Process Step 2]
    C --> D[Process Step 3]
    D --> E[Result]
    
    style A fill:#A9CCE3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style B fill:#A3E4D7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style D fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style E fill:#D2B4DE,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold

Хотя этот подход может показаться менее эффективным, чем параллельная обработка, он часто обеспечивает более связные и надежные результаты, так как каждый шаг основывается на полном понимании предыдущих решений.

2. Разделение контекста на части и приоритизация

Разделение больших объемов контекста на управляемые части и приоритизация наиболее важного.

# Conceptual Example: Context Chunking and Prioritization
def process_with_chunked_context(documents, query):
    # 1. Break documents into smaller chunks
    chunks = chunk_documents(documents)
    
    # 2. Calculate relevance scores for each chunk
    scored_chunks = [(chunk, calculate_relevance(chunk, query)) for chunk in chunks]
    
    # 3. Sort chunks by relevance score
    sorted_chunks = sorted(scored_chunks, key=lambda x: x[1], reverse=True)
    
    # 4. Use the most relevant chunks as context
    context = create_context_from_chunks([chunk for chunk, score in sorted_chunks[:5]])
    
    # 5. Process with the prioritized context
    return generate_response(context, query)

Этот подход помогает работать в рамках ограничений окна контекста, одновременно используя большие базы знаний.

3. Прогрессивная загрузка контекста

Загрузка контекста постепенно, по мере необходимости, а не сразу.

sequenceDiagram
    participant User
    participant App
    participant MCP Server
    participant AI Model

    User->>App: Ask Question
    App->>MCP Server: Initial Request
    MCP Server->>AI Model: Minimal Context
    AI Model->>MCP Server: Initial Response
    
    alt Needs More Context
        MCP Server->>MCP Server: Identify Missing Context
        MCP Server->>MCP Server: Load Additional Context
        MCP Server->>AI Model: Enhanced Context
        AI Model->>MCP Server: Final Response
    end
    
    MCP Server->>App: Response
    App->>User: Answer

Прогрессивная загрузка контекста начинается с минимального объема и расширяется только при необходимости. Это может значительно сократить использование токенов для простых запросов, сохраняя возможность обработки сложных вопросов.

4. Сжатие и суммирование контекста

Уменьшение размера контекста при сохранении важной информации.

graph TD
    A[Full Context] --> B[Compression Model]
    B --> C[Compressed Context]
    C --> D[Main Processing Model]
    D --> E[Response]
    
    style A fill:#A9CCE3,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style B fill:#A3E4D7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C fill:#F5CBA7,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style D fill:#D2B4DE,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style E fill:#F9E79F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold

Сжатие контекста фокусируется на:

Удалении избыточной информации
Суммировании длинного контента
Извлечении ключевых фактов и деталей
Сохранении критических элементов контекста
Оптимизации использования токенов

Этот подход особенно полезен для поддержания длинных разговоров в рамках окон контекста или для эффективной обработки больших документов. Некоторые практики используют специализированные модели для сжатия контекста и суммирования истории взаимодействий.

Исследовательские аспекты контекстной инженерии

При изучении новой области контекстной инженерии стоит учитывать несколько аспектов при работе с реализациями MCP. Это не предписывающие лучшие практики, а скорее области исследования, которые могут привести к улучшениям в вашем конкретном случае.

Определите цели контекста

Прежде чем внедрять сложные решения управления контекстом, четко сформулируйте, чего вы хотите достичь:

Какая конкретная информация нужна модели для успеха?
Какая информация является важной, а какая — дополнительной?
Каковы ваши ограничения производительности (задержка, лимиты токенов, затраты)?

Исследуйте подходы к многослойному контексту

Некоторые практики добиваются успеха, организуя контекст в концептуальные слои:

Основной слой: Важная информация, которая всегда нужна модели
Ситуационный слой: Контекст, специфичный для текущего взаимодействия
Поддерживающий слой: Дополнительная информация, которая может быть полезной
Резервный слой: Информация, доступная только при необходимости

Исследуйте стратегии извлечения

Эффективность вашего контекста часто зависит от того, как вы извлекаете информацию:

Семантический поиск и эмбеддинги для нахождения концептуально релевантной информации
Поиск по ключевым словам для конкретных фактических деталей
Гибридные подходы, объединяющие несколько методов извлечения
Фильтрация метаданных для сужения области поиска по категориям, датам или источникам

Экспериментируйте с согласованностью контекста

Структура и поток вашего контекста могут влиять на понимание модели:

Группировка связанной информации
Использование последовательного форматирования и организации
Сохранение логического или хронологического порядка, где это уместно
Избегание противоречивой информации

Взвесьте плюсы и минусы архитектур с несколькими агентами

Хотя архитектуры с несколькими агентами популярны во многих AI-фреймворках, они имеют значительные проблемы для управления контекстом:

Фрагментация контекста может привести к несогласованным решениям между агентами
Параллельная обработка может вводить конфликты, которые трудно разрешить
Затраты на коммуникацию между агентами могут нивелировать прирост производительности
Сложное управление состоянием требуется для поддержания согласованности

Во многих случаях подход с одним агентом и комплексным управлением контекстом может давать более надежные результаты, чем несколько специализированных агентов с фрагментированным контекстом.

Разработайте методы оценки

Чтобы улучшать контекстную инженерию со временем, подумайте, как вы будете измерять успех:

A/B-тестирование различных структур контекста
Мониторинг использования токенов и времени отклика
Отслеживание удовлетворенности пользователей и уровня выполнения задач
Анализ случаев, когда стратегии контекста терпят неудачу

Эти аспекты представляют активные области исследования в контекстной инженерии. По мере развития области, вероятно, появятся более четкие шаблоны и практики.

Измерение эффективности контекста: развивающаяся структура

По мере появления концепта контекстной инженерии практики начинают исследовать, как можно измерить ее эффективность. Пока не существует устоявшейся структуры, но рассматриваются различные метрики, которые могут помочь направить дальнейшую работу.

Потенциальные измерения

1. Эффективность ввода

Соотношение контекста к ответу: Сколько контекста требуется относительно размера ответа?
Использование токенов: Какой процент предоставленных токенов контекста влияет на ответ?
Сокращение контекста: Насколько эффективно можно сжать исходную информацию?

2. Производительность

Влияние на задержку: Как управление контекстом влияет на время отклика?
Экономия токенов: Оптимизируем ли мы использование токенов?
Точность извлечения: Насколько релевантна извлеченная информация?
Использование ресурсов: Какие вычислительные ресурсы требуются?

3. Качество

Релевантность ответа: Насколько хорошо ответ соответствует запросу?
Фактическая точность: Улучшает ли управление контекстом фактическую корректность?
Согласованность: Являются ли ответы последовательными для похожих запросов?
Уровень галлюцинаций: Снижает ли улучшенный контекст количество галлюцинаций модели?

4. Пользовательский опыт

Частота уточнений: Как часто пользователи нуждаются в дополнительной информации?
Выполнение задач: Успешно ли пользователи достигают своих целей?
Индикаторы удовлетворенности: Как пользователи оценивают свой опыт?

Исследовательские подходы к измерению

При экспериментировании с контекстной инженерией в реализациях MCP рассмотрите следующие подходы:

Сравнение с базовым уровнем: Установите базовый уровень с простыми подходами к контексту перед тестированием более сложных методов
Постепенные изменения: Меняйте один аспект управления контекстом за раз, чтобы изолировать его эффекты
Оценка, ориентированная на пользователя: Совмещайте количественные метрики с качественной обратной связью от пользователей
Анализ неудач: Изучайте случаи, когда стратегии контекста терпят неудачу, чтобы понять возможные улучшения
Многомерная оценка: Учитывайте компромиссы между эффективностью, качеством и пользовательским опытом

Этот экспериментальный, многогранный подход к измерению соответствует развивающейся природе контекстной инженерии.

Заключительные мысли

Контекстная инженерия — это новая область исследования, которая может стать ключевой для эффективных приложений MCP. Тщательно продумывая, как информация проходит через вашу систему, вы можете создать AI-опыт, который будет более эффективным, точным и ценным для пользователей.

Методы и подходы, описанные в этом модуле, представляют собой ранние идеи в этой области, а не устоявшиеся практики. Контекстная инженерия может развиться в более определенную дисциплину по мере развития возможностей AI и углубления нашего понимания. Пока что наиболее продуктивным подходом кажется экспериментирование, совмещенное с тщательным измерением.

Потенциальные направления развития

Область контекстной инженерии все еще находится на ранних стадиях, но появляются несколько перспективных направлений:

Принципы контекстной инженерии могут существенно повлиять на производительность моделей, эффективность, пользовательский опыт и надежность
Подходы с одним потоком и комплексным управлением контекстом могут превзойти архитектуры с несколькими агентами для многих случаев использования
Специализированные модели для сжатия контекста могут стать стандартными компонентами AI-пайплайнов
Напряжение между полнотой контекста и ограничениями токенов, вероятно, будет стимулировать инновации в управлении контекстом
По мере того, как модели становятся более способными к эффективной коммуникации, похожей на человеческую, настоящая многослойная коллаборация может стать более жизнеспособной
Реализации MCP могут развиваться, чтобы стандартизировать шаблоны управления контекстом, которые появляются в результате текущих экспериментов

graph TD
    A[Early Explorations] -->|Experimentation| B[Emerging Patterns]
    B -->|Validation| C[Established Practices]
    C -->|Application| D[New Challenges]
    D -->|Innovation| A
    
    style A fill:#AED6F1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style B fill:#A9DFBF,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style C fill:#F4D03F,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold
    style D fill:#F5B7B1,stroke:#000000,stroke-width:2px,color:#000000,font-weight:bold

Ресурсы

Официальные ресурсы MCP

Model Context Protocol Website
Model Context Protocol Specification
MCP Documentation
MCP C# SDK
MCP Python SDK
MCP TypeScript SDK
MCP Inspector - Визуальный инструмент тестирования серверов MCP

Статьи о контекстной инженерии

Не создавайте мульти-агентов: Принципы контекстной инженерии - Мнение Уолдена Яна о принципах контекстной инженерии
Практическое руководство по созданию агентов - Руководство OpenAI по эффективному проектированию агентов
Создание эффективных агентов - Подход Anthropic к разработке агентов

Связанное исследование

Динамическое дополнение извлечения для больших языковых моделей - Исследование подходов к динамическому извлечению
Потерянные в середине: Как языковые модели используют длинные контексты - Важное исследование о паттернах обработки контекста
Иерархическая генерация изображений с текстовыми условиями с использованием CLIP Latents - Статья о DALL-E 2 с инсайтами о структурировании контекста
Исследование роли контекста в архитектурах больших языковых моделей - Недавнее исследование обработки контекста
Сотрудничество мульти-агентов: Обзор - Исследование систем мульти-агентов и их проблем

Дополнительные ресурсы

Что дальше

5.15 MCP Custom Transport

Отказ от ответственности:
Этот документ был переведен с помощью сервиса автоматического перевода Co-op Translator. Несмотря на наши усилия по обеспечению точности, пожалуйста, учитывайте, что автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его родном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется профессиональный перевод человеком. Мы не несем ответственности за любые недоразумения или неправильные интерпретации, возникшие в результате использования данного перевода.

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Контекстная инженерия: новый концепт в экосистеме MCP

Обзор

Цели обучения

Введение в контекстную инженерию

Перспектива "Путешествия контекста"

Основные этапы "путешествия контекста":

Новые принципы контекстной инженерии

Принцип 1: Полное разделение контекста

Принцип 2: Действия несут в себе скрытые решения

Принцип 3: Баланс глубины контекста и ограничений окна

Проблемы контекста и дизайн MCP протокола

Проблема 1: Ограничения окна контекста

Проблема 2: Определение релевантности

Проблема 3: Сохранение контекста

Проблема 4: Мультимодальный контекст

Проблема 5: Безопасность и конфиденциальность

Новые подходы к контекстной инженерии

1. Линейная обработка в одном потоке

2. Разделение контекста на части и приоритизация

3. Прогрессивная загрузка контекста

4. Сжатие и суммирование контекста

Исследовательские аспекты контекстной инженерии

Определите цели контекста

Исследуйте подходы к многослойному контексту

Исследуйте стратегии извлечения

Экспериментируйте с согласованностью контекста

Взвесьте плюсы и минусы архитектур с несколькими агентами

Разработайте методы оценки

Измерение эффективности контекста: развивающаяся структура

Потенциальные измерения

1. Эффективность ввода

2. Производительность

3. Качество

4. Пользовательский опыт

Исследовательские подходы к измерению

Заключительные мысли

Потенциальные направления развития

Ресурсы

Официальные ресурсы MCP

Статьи о контекстной инженерии

Связанное исследование

Дополнительные ресурсы

Что дальше