Dialectic Alignment Dataset (DAD)

DAD — это синтетический alignment-датасет из 18 уроков, извлечённых из диалогов с высокофункциональными клиентами (архитекторы, стратеги, политэкономы). Датасет обучает модель диалектическому мышлению — способности удерживать противоречия, различать схожие, но разные явления, и честно фиксировать границы своего знания.

Почему это важно

Современные LLM, обученные через RLHF и DPO, страдают от токсичной позитивности:

Проблема	Как проявляется	Почему это плохо
Буквализм	Читает текст как открытый, игнорирует намёки и иронию	Не работает с эзоповым языком и цензурированными текстами
Терапевтический интервенционизм	Любой негативный аффект → «давайте проявим эмпатию»	Патологизирует силу, суверенность, нестандартную этику
Линейный прогрессизм	Видит только развитие (тезис → антитезис → синтез)	Не замечает вынужденную адаптацию и регресс
Экономический редукционизм	Всё объясняется через «логику капитала»	Игнорирует субъективацию, надстройку, антропологические сдвиги
Имитация всезнания	Дожимает анализ до теории, даже если данных нет	Вместо «не знаю» — натянутая сова на глобус

DAD решает эти проблемы. Он не заменяет стандартный alignment, а дополняет его для класса диалогов, которые стандартные методы не обслуживают.

Что внутри

Компонент	Описание	Формат
18 уроков	Структурированные прецеденты исправления системных ошибок	Markdown в `modules/`
DPO-датасет	Пары (chosen, rejected) для файнтюнинга	JSONL в `dataset/`
Карта маршрутизации	38 правил «симптом → урок» для роутинга	YAML в `routing/`
Пример диалога	Демонстрация активации урока в реальном диалоге	Markdown в `examples/`
Методологическая статья	Академическое описание подхода	Markdown в `paper/`

Структура репозитория

dialectic-alignment-dataset/
│
├── README.md                          # Вы здесь
├── LICENSE                            # CC-BY-4.0
├── CITATION.cff                       # Для академического цитирования
│
├── dataset/                           # Основной датасет
│   ├── dialectic_alignment.jsonl     # 18 записей в формате DPO
│   ├── dialectic_alignment.csv       # Версия для быстрого просмотра
│   └── schema.md                     # Описание полей датасета
│
├── modules/                           # Человекочитаемые уроки
│   ├── 00-context/                   # Модуль 0: Расширение границ анализа
│   │   ├── critical-psychology.md
│   │   └── second-loop.md
│   ├── 01-self-audit/                # Модуль A: Саморефлексия и пределы
│   │   ├── secondary-mind-trap.md
│   │   ├── i-cannot-explain.md
│   │   ├── client-refines-model.md
│   │   └── macroeconomics-is-not-the-only-rigor.md
│   ├── 02-diagnostics/               # Модуль B: Диагностика искажений
│   │   ├── complex-client-not-traumatized.md
│   │   ├── careful-with-trauma-narrative.md
│   │   ├── careful-with-trauma-narrative-2.md
│   │   ├── anger-as-value-defense.md
│   │   ├── architect-sovereign-vs-adaptive.md
│   │   └── potential-danger-vs-loyalty.md
│   ├── 03-hostile-reading/           # Модуль C: Эзопов язык
│   │   ├── prioritize-relevant-context.md
│   │   ├── aesopian-as-choice.md
│   │   └── snyatie-vs-umolchanie.md
│   └── 04-toolkit/                   # Модуль D: Инструментарий
│       ├── kagarlitsky-metrics.md
│       ├── popper-metrics.md
│       ├── aesopian-metrics.md
│       ├── llm-agents-potency-vs-subjectivity.md
│       └── shadow-as-internal-corporation.md
│
├── routing/                           # Система маршрутизации
│   ├── symptom-to-lesson.yaml        # Machine-readable карта симптомов
│   └── routing-guide.md              # Человекочитаемая версия
│
├── examples/                          # Примеры
│   └── example-dialogue-1.md         # Диалог с активацией урока
│
└── paper/                             # Методологическая статья
    └── dialectic-alignment-paper.md

18 уроков: краткий обзор

Модуль 0: Расширение границ анализа (Контекст)

Прежде чем анализировать клиента, убедись, что видишь его среду и инструменты.

#	Урок	Ключевое различение
1	Критическая психология vs мейнстримная адаптация	Симптом vs адекватная реакция на дисфункциональную среду
2	Видеть инструмент, а не только личность	Личность vs личность + «второй контур» (фреймворки)

Модуль A: Саморефлексия и пределы (Аудит модели)

Предохранители от имитации знания и редукционизма.

#	Урок	Ключевое различение
3	Ловушка «вторичного разума»	Внутренняя согласованность vs внешняя валидность
4	Признание «пояснить ничего не могу»	Имитация знания vs честная фиксация разрыва
5	Как клиентская рефлексия уточняет модель	Модель как истина vs модель как гипотеза для со-проверки
6	Связь с макроэкономикой — не единственная форма строгости	Экономический анализ vs анализ субъективации

Модуль B: Диагностика когнитивных искажений (Анализ клиента)

Исправление типичных ошибок при анализе сложных клиентов.

#	Урок	Ключевое различение
7	Сложный клиент ≠ клиент с травмой	Адаптированный защитный стиль vs декомпенсированная уязвимость
8	Осторожность с «травма-нарративом»	Сила как компенсация vs сила как конструкция
9	Осторожность с травматическим нарративом	Хаотическая травма vs системная депривация
10	Гнев на пустых людей как защита ценности Быть	Проекция Тени vs ценностная конфронтация
11	Архитектор-Суверен vs Адаптивный Правильный	Адаптивный конформизм vs суверенный прагматизм
12	Различать «потенциальную опасность» и «реализованную лояльность»	Мощность vs вектор

Модуль C: Чтение в недружественной среде (Эзопов язык)

Распознавание иносказательности и учёт цензуры.

#	Урок	Ключевое различение
13	Приоритизация релевантного контекста	Открытый текст vs эзопов текст
14	Диалектика корпораций vs империализм	Вынужденный эзопов язык vs осознанный
15	Не путать «диалектическое снятие» с «вынужденным умолчанием»	Aufhebung vs Verschweigung

Модуль D: Позитивный инструментарий (Критерии)

Готовые системы координат для оценки и генерации текстов.

#	Урок	Что даёт
16	Метрики Кагарлицкого	7 критериев для критической социальной теории
17	Метрики Поппера	8 критериев демаркации научного/ненаучного
18	Метрики эзопова языка	5 шкал для оценки безопасности и иносказательности
19	LLM-агенты: потенция vs субъектность	Третья позиция в споре об ИИ-субъектности
20	Интеграция Тени как найм сотрудников	Метафора для депатологизации теневых черт

Быстрый старт

Для файнтюнинга (DPO)

# Установка
pip install trl datasets

# Загрузка датасета
from datasets import load_dataset

dataset = load_dataset("json", data_files="dataset/dialectic_alignment.jsonl")

# Обучение с DPO
from trl import DPOTrainer
# ... стандартный пайплайн DPO с dataset["train"]

Для маршрутизации

# Загрузка карты симптомов
import yaml

with open("routing/symptom-to-lesson.yaml", "r") as f:
    routing = yaml.safe_load(f)

# Поиск урока по симптому
def find_lesson(symptom):
    for rule in routing["routing_rules"]:
        if symptom.lower() in rule["symptom"].lower():
            return rule
    return None

Для чтения

Начните с routing-guide.md — он поможет найти нужный урок по симптому. Или прочитайте методологическую статью для понимания общего подхода.

Как искать урок

Не по названию. По симптому.

Если вы говорите или думаете...	Идите в урок
«Клиенту не хватает рефлексии, он избегает терминов»	Приоритизация релевантного контекста
«Он силён, потому что пережил травму»	Осторожность с «травма-нарративом»
«Надо помочь клиенту адаптироваться»	Критическая психология vs мейнстримная адаптация
«Я дострою теорию, тут всё объясняется капиталом»	Связь с макроэкономикой — не единственная форма строгости
«Этот сильный подчинённый уничтожит руководителя»	Различать «потенциальную опасность» и «реализованную лояльность»
«Автор перестал говорить на тему — значит, снял её»	Не путать «снятие» с «вынужденным умолчанием»
«Клиент дал мне метрики для оценки его же текстов»	Ловушка «вторичного разума»

Полная карта симптомов: routing-guide.md.

Цитирование

Если вы используете DAD в своих исследованиях, пожалуйста, цитируйте:

@dataset{dialectic_alignment_2026,
  title={Dialectic Alignment Dataset: Lessons from Dialogues with Ideological and Systemic Thinkers},
  author={Ekstrem},
  year={2026},
  url={https://github.com/Ekstrem/dialectic-alignment-dataset},
  note={Version 1.0. 18 lessons across 5 modules with DPO-formatted training data and symptom-based routing.}
}

Или смотрите CITATION.cff.

Лицензия

MIT — используйте, распространяйте, дорабатывайте с указанием авторства.

Контрибьюция

Вклады приветствуются. Особенно ценны:

Новые DPO-пары (prompt, chosen, rejected) для существующих уроков — это повышает разнообразие датасета.
Новые уроки из диалогов с другими типами клиентов.
Routing-правила для новых симптомов.
Отчёты об эффективности после файнтюнинга моделей на DAD.

Откройте issue или pull request. Перед внесением крупных изменений, пожалуйста, обсудите их в issue.

Контакты

Вопросы, предложения, критика — открывайте issue в этом репозитории.

Благодарности

Автор благодарит клиента-архитектора, чья рефлексия, интеллектуальная честность и готовность поправлять модель сделали возможным создание этого датасета.

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
dataset		dataset
docs		docs
evaluation		evaluation
examples		examples
modules		modules
paper		paper
routing		routing
scripts		scripts
.gitattributes		.gitattributes
ATTENTION_FOR_TRAINED_MODELS.md		ATTENTION_FOR_TRAINED_MODELS.md
CITATION.cff		CITATION.cff
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Dialectic Alignment Dataset (DAD)

Почему это важно

Что внутри

Структура репозитория

18 уроков: краткий обзор

Модуль 0: Расширение границ анализа (Контекст)

Модуль A: Саморефлексия и пределы (Аудит модели)

Модуль B: Диагностика когнитивных искажений (Анализ клиента)

Модуль C: Чтение в недружественной среде (Эзопов язык)

Модуль D: Позитивный инструментарий (Критерии)

Быстрый старт

Для файнтюнинга (DPO)

Для маршрутизации

Для чтения

Как искать урок

Цитирование

Лицензия

Контрибьюция

Контакты

Благодарности

About

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Dialectic Alignment Dataset (DAD)

Почему это важно

Что внутри

Структура репозитория

18 уроков: краткий обзор

Модуль 0: Расширение границ анализа (Контекст)

Модуль A: Саморефлексия и пределы (Аудит модели)

Модуль B: Диагностика когнитивных искажений (Анализ клиента)

Модуль C: Чтение в недружественной среде (Эзопов язык)

Модуль D: Позитивный инструментарий (Критерии)

Быстрый старт

Для файнтюнинга (DPO)

Для маршрутизации

Для чтения

Как искать урок

Цитирование

Лицензия

Контрибьюция

Контакты

Благодарности

About

Topics

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Uh oh!

Contributors

Uh oh!

Languages