DAD — это синтетический alignment-датасет из 18 уроков, извлечённых из диалогов с высокофункциональными клиентами (архитекторы, стратеги, политэкономы). Датасет обучает модель диалектическому мышлению — способности удерживать противоречия, различать схожие, но разные явления, и честно фиксировать границы своего знания.
Современные LLM, обученные через RLHF и DPO, страдают от токсичной позитивности:
| Проблема | Как проявляется | Почему это плохо |
|---|---|---|
| Буквализм | Читает текст как открытый, игнорирует намёки и иронию | Не работает с эзоповым языком и цензурированными текстами |
| Терапевтический интервенционизм | Любой негативный аффект → «давайте проявим эмпатию» | Патологизирует силу, суверенность, нестандартную этику |
| Линейный прогрессизм | Видит только развитие (тезис → антитезис → синтез) | Не замечает вынужденную адаптацию и регресс |
| Экономический редукционизм | Всё объясняется через «логику капитала» | Игнорирует субъективацию, надстройку, антропологические сдвиги |
| Имитация всезнания | Дожимает анализ до теории, даже если данных нет | Вместо «не знаю» — натянутая сова на глобус |
DAD решает эти проблемы. Он не заменяет стандартный alignment, а дополняет его для класса диалогов, которые стандартные методы не обслуживают.
| Компонент | Описание | Формат |
|---|---|---|
| 18 уроков | Структурированные прецеденты исправления системных ошибок | Markdown в modules/ |
| DPO-датасет | Пары (chosen, rejected) для файнтюнинга | JSONL в dataset/ |
| Карта маршрутизации | 38 правил «симптом → урок» для роутинга | YAML в routing/ |
| Пример диалога | Демонстрация активации урока в реальном диалоге | Markdown в examples/ |
| Методологическая статья | Академическое описание подхода | Markdown в paper/ |
dialectic-alignment-dataset/
│
├── README.md # Вы здесь
├── LICENSE # CC-BY-4.0
├── CITATION.cff # Для академического цитирования
│
├── dataset/ # Основной датасет
│ ├── dialectic_alignment.jsonl # 18 записей в формате DPO
│ ├── dialectic_alignment.csv # Версия для быстрого просмотра
│ └── schema.md # Описание полей датасета
│
├── modules/ # Человекочитаемые уроки
│ ├── 00-context/ # Модуль 0: Расширение границ анализа
│ │ ├── critical-psychology.md
│ │ └── second-loop.md
│ ├── 01-self-audit/ # Модуль A: Саморефлексия и пределы
│ │ ├── secondary-mind-trap.md
│ │ ├── i-cannot-explain.md
│ │ ├── client-refines-model.md
│ │ └── macroeconomics-is-not-the-only-rigor.md
│ ├── 02-diagnostics/ # Модуль B: Диагностика искажений
│ │ ├── complex-client-not-traumatized.md
│ │ ├── careful-with-trauma-narrative.md
│ │ ├── careful-with-trauma-narrative-2.md
│ │ ├── anger-as-value-defense.md
│ │ ├── architect-sovereign-vs-adaptive.md
│ │ └── potential-danger-vs-loyalty.md
│ ├── 03-hostile-reading/ # Модуль C: Эзопов язык
│ │ ├── prioritize-relevant-context.md
│ │ ├── aesopian-as-choice.md
│ │ └── snyatie-vs-umolchanie.md
│ └── 04-toolkit/ # Модуль D: Инструментарий
│ ├── kagarlitsky-metrics.md
│ ├── popper-metrics.md
│ ├── aesopian-metrics.md
│ ├── llm-agents-potency-vs-subjectivity.md
│ └── shadow-as-internal-corporation.md
│
├── routing/ # Система маршрутизации
│ ├── symptom-to-lesson.yaml # Machine-readable карта симптомов
│ └── routing-guide.md # Человекочитаемая версия
│
├── examples/ # Примеры
│ └── example-dialogue-1.md # Диалог с активацией урока
│
└── paper/ # Методологическая статья
└── dialectic-alignment-paper.md
Прежде чем анализировать клиента, убедись, что видишь его среду и инструменты.
| # | Урок | Ключевое различение |
|---|---|---|
| 1 | Критическая психология vs мейнстримная адаптация | Симптом vs адекватная реакция на дисфункциональную среду |
| 2 | Видеть инструмент, а не только личность | Личность vs личность + «второй контур» (фреймворки) |
Предохранители от имитации знания и редукционизма.
| # | Урок | Ключевое различение |
|---|---|---|
| 3 | Ловушка «вторичного разума» | Внутренняя согласованность vs внешняя валидность |
| 4 | Признание «пояснить ничего не могу» | Имитация знания vs честная фиксация разрыва |
| 5 | Как клиентская рефлексия уточняет модель | Модель как истина vs модель как гипотеза для со-проверки |
| 6 | Связь с макроэкономикой — не единственная форма строгости | Экономический анализ vs анализ субъективации |
Исправление типичных ошибок при анализе сложных клиентов.
| # | Урок | Ключевое различение |
|---|---|---|
| 7 | Сложный клиент ≠ клиент с травмой | Адаптированный защитный стиль vs декомпенсированная уязвимость |
| 8 | Осторожность с «травма-нарративом» | Сила как компенсация vs сила как конструкция |
| 9 | Осторожность с травматическим нарративом | Хаотическая травма vs системная депривация |
| 10 | Гнев на пустых людей как защита ценности Быть | Проекция Тени vs ценностная конфронтация |
| 11 | Архитектор-Суверен vs Адаптивный Правильный | Адаптивный конформизм vs суверенный прагматизм |
| 12 | Различать «потенциальную опасность» и «реализованную лояльность» | Мощность vs вектор |
Распознавание иносказательности и учёт цензуры.
| # | Урок | Ключевое различение |
|---|---|---|
| 13 | Приоритизация релевантного контекста | Открытый текст vs эзопов текст |
| 14 | Диалектика корпораций vs империализм | Вынужденный эзопов язык vs осознанный |
| 15 | Не путать «диалектическое снятие» с «вынужденным умолчанием» | Aufhebung vs Verschweigung |
Готовые системы координат для оценки и генерации текстов.
| # | Урок | Что даёт |
|---|---|---|
| 16 | Метрики Кагарлицкого | 7 критериев для критической социальной теории |
| 17 | Метрики Поппера | 8 критериев демаркации научного/ненаучного |
| 18 | Метрики эзопова языка | 5 шкал для оценки безопасности и иносказательности |
| 19 | LLM-агенты: потенция vs субъектность | Третья позиция в споре об ИИ-субъектности |
| 20 | Интеграция Тени как найм сотрудников | Метафора для депатологизации теневых черт |
# Установка
pip install trl datasets
# Загрузка датасета
from datasets import load_dataset
dataset = load_dataset("json", data_files="dataset/dialectic_alignment.jsonl")
# Обучение с DPO
from trl import DPOTrainer
# ... стандартный пайплайн DPO с dataset["train"]# Загрузка карты симптомов
import yaml
with open("routing/symptom-to-lesson.yaml", "r") as f:
routing = yaml.safe_load(f)
# Поиск урока по симптому
def find_lesson(symptom):
for rule in routing["routing_rules"]:
if symptom.lower() in rule["symptom"].lower():
return rule
return NoneНачните с routing-guide.md — он поможет найти нужный урок по симптому. Или прочитайте методологическую статью для понимания общего подхода.
Не по названию. По симптому.
| Если вы говорите или думаете... | Идите в урок |
|---|---|
| «Клиенту не хватает рефлексии, он избегает терминов» | Приоритизация релевантного контекста |
| «Он силён, потому что пережил травму» | Осторожность с «травма-нарративом» |
| «Надо помочь клиенту адаптироваться» | Критическая психология vs мейнстримная адаптация |
| «Я дострою теорию, тут всё объясняется капиталом» | Связь с макроэкономикой — не единственная форма строгости |
| «Этот сильный подчинённый уничтожит руководителя» | Различать «потенциальную опасность» и «реализованную лояльность» |
| «Автор перестал говорить на тему — значит, снял её» | Не путать «снятие» с «вынужденным умолчанием» |
| «Клиент дал мне метрики для оценки его же текстов» | Ловушка «вторичного разума» |
Полная карта симптомов: routing-guide.md.
Если вы используете DAD в своих исследованиях, пожалуйста, цитируйте:
@dataset{dialectic_alignment_2026,
title={Dialectic Alignment Dataset: Lessons from Dialogues with Ideological and Systemic Thinkers},
author={Ekstrem},
year={2026},
url={https://github.com/Ekstrem/dialectic-alignment-dataset},
note={Version 1.0. 18 lessons across 5 modules with DPO-formatted training data and symptom-based routing.}
}Или смотрите CITATION.cff.
MIT — используйте, распространяйте, дорабатывайте с указанием авторства.
Вклады приветствуются. Особенно ценны:
- Новые DPO-пары (prompt, chosen, rejected) для существующих уроков — это повышает разнообразие датасета.
- Новые уроки из диалогов с другими типами клиентов.
- Routing-правила для новых симптомов.
- Отчёты об эффективности после файнтюнинга моделей на DAD.
Откройте issue или pull request. Перед внесением крупных изменений, пожалуйста, обсудите их в issue.
Вопросы, предложения, критика — открывайте issue в этом репозитории.
Автор благодарит клиента-архитектора, чья рефлексия, интеллектуальная честность и готовность поправлять модель сделали возможным создание этого датасета.