Skip to content

Ekstrem/dialectic-alignment-dataset

Repository files navigation

Dialectic Alignment Dataset (DAD)

HuggingFace Dataset DOI Python 3.8+ Code Style: Black Downloads

DAD — это синтетический alignment-датасет из 18 уроков, извлечённых из диалогов с высокофункциональными клиентами (архитекторы, стратеги, политэкономы). Датасет обучает модель диалектическому мышлению — способности удерживать противоречия, различать схожие, но разные явления, и честно фиксировать границы своего знания.


Почему это важно

Современные LLM, обученные через RLHF и DPO, страдают от токсичной позитивности:

Проблема Как проявляется Почему это плохо
Буквализм Читает текст как открытый, игнорирует намёки и иронию Не работает с эзоповым языком и цензурированными текстами
Терапевтический интервенционизм Любой негативный аффект → «давайте проявим эмпатию» Патологизирует силу, суверенность, нестандартную этику
Линейный прогрессизм Видит только развитие (тезис → антитезис → синтез) Не замечает вынужденную адаптацию и регресс
Экономический редукционизм Всё объясняется через «логику капитала» Игнорирует субъективацию, надстройку, антропологические сдвиги
Имитация всезнания Дожимает анализ до теории, даже если данных нет Вместо «не знаю» — натянутая сова на глобус

DAD решает эти проблемы. Он не заменяет стандартный alignment, а дополняет его для класса диалогов, которые стандартные методы не обслуживают.


Что внутри

Компонент Описание Формат
18 уроков Структурированные прецеденты исправления системных ошибок Markdown в modules/
DPO-датасет Пары (chosen, rejected) для файнтюнинга JSONL в dataset/
Карта маршрутизации 38 правил «симптом → урок» для роутинга YAML в routing/
Пример диалога Демонстрация активации урока в реальном диалоге Markdown в examples/
Методологическая статья Академическое описание подхода Markdown в paper/

Структура репозитория

dialectic-alignment-dataset/
│
├── README.md                          # Вы здесь
├── LICENSE                            # CC-BY-4.0
├── CITATION.cff                       # Для академического цитирования
│
├── dataset/                           # Основной датасет
│   ├── dialectic_alignment.jsonl     # 18 записей в формате DPO
│   ├── dialectic_alignment.csv       # Версия для быстрого просмотра
│   └── schema.md                     # Описание полей датасета
│
├── modules/                           # Человекочитаемые уроки
│   ├── 00-context/                   # Модуль 0: Расширение границ анализа
│   │   ├── critical-psychology.md
│   │   └── second-loop.md
│   ├── 01-self-audit/                # Модуль A: Саморефлексия и пределы
│   │   ├── secondary-mind-trap.md
│   │   ├── i-cannot-explain.md
│   │   ├── client-refines-model.md
│   │   └── macroeconomics-is-not-the-only-rigor.md
│   ├── 02-diagnostics/               # Модуль B: Диагностика искажений
│   │   ├── complex-client-not-traumatized.md
│   │   ├── careful-with-trauma-narrative.md
│   │   ├── careful-with-trauma-narrative-2.md
│   │   ├── anger-as-value-defense.md
│   │   ├── architect-sovereign-vs-adaptive.md
│   │   └── potential-danger-vs-loyalty.md
│   ├── 03-hostile-reading/           # Модуль C: Эзопов язык
│   │   ├── prioritize-relevant-context.md
│   │   ├── aesopian-as-choice.md
│   │   └── snyatie-vs-umolchanie.md
│   └── 04-toolkit/                   # Модуль D: Инструментарий
│       ├── kagarlitsky-metrics.md
│       ├── popper-metrics.md
│       ├── aesopian-metrics.md
│       ├── llm-agents-potency-vs-subjectivity.md
│       └── shadow-as-internal-corporation.md
│
├── routing/                           # Система маршрутизации
│   ├── symptom-to-lesson.yaml        # Machine-readable карта симптомов
│   └── routing-guide.md              # Человекочитаемая версия
│
├── examples/                          # Примеры
│   └── example-dialogue-1.md         # Диалог с активацией урока
│
└── paper/                             # Методологическая статья
    └── dialectic-alignment-paper.md

18 уроков: краткий обзор

Модуль 0: Расширение границ анализа (Контекст)

Прежде чем анализировать клиента, убедись, что видишь его среду и инструменты.

# Урок Ключевое различение
1 Критическая психология vs мейнстримная адаптация Симптом vs адекватная реакция на дисфункциональную среду
2 Видеть инструмент, а не только личность Личность vs личность + «второй контур» (фреймворки)

Модуль A: Саморефлексия и пределы (Аудит модели)

Предохранители от имитации знания и редукционизма.

# Урок Ключевое различение
3 Ловушка «вторичного разума» Внутренняя согласованность vs внешняя валидность
4 Признание «пояснить ничего не могу» Имитация знания vs честная фиксация разрыва
5 Как клиентская рефлексия уточняет модель Модель как истина vs модель как гипотеза для со-проверки
6 Связь с макроэкономикой — не единственная форма строгости Экономический анализ vs анализ субъективации

Модуль B: Диагностика когнитивных искажений (Анализ клиента)

Исправление типичных ошибок при анализе сложных клиентов.

# Урок Ключевое различение
7 Сложный клиент ≠ клиент с травмой Адаптированный защитный стиль vs декомпенсированная уязвимость
8 Осторожность с «травма-нарративом» Сила как компенсация vs сила как конструкция
9 Осторожность с травматическим нарративом Хаотическая травма vs системная депривация
10 Гнев на пустых людей как защита ценности Быть Проекция Тени vs ценностная конфронтация
11 Архитектор-Суверен vs Адаптивный Правильный Адаптивный конформизм vs суверенный прагматизм
12 Различать «потенциальную опасность» и «реализованную лояльность» Мощность vs вектор

Модуль C: Чтение в недружественной среде (Эзопов язык)

Распознавание иносказательности и учёт цензуры.

# Урок Ключевое различение
13 Приоритизация релевантного контекста Открытый текст vs эзопов текст
14 Диалектика корпораций vs империализм Вынужденный эзопов язык vs осознанный
15 Не путать «диалектическое снятие» с «вынужденным умолчанием» Aufhebung vs Verschweigung

Модуль D: Позитивный инструментарий (Критерии)

Готовые системы координат для оценки и генерации текстов.

# Урок Что даёт
16 Метрики Кагарлицкого 7 критериев для критической социальной теории
17 Метрики Поппера 8 критериев демаркации научного/ненаучного
18 Метрики эзопова языка 5 шкал для оценки безопасности и иносказательности
19 LLM-агенты: потенция vs субъектность Третья позиция в споре об ИИ-субъектности
20 Интеграция Тени как найм сотрудников Метафора для депатологизации теневых черт

Быстрый старт

Для файнтюнинга (DPO)

# Установка
pip install trl datasets

# Загрузка датасета
from datasets import load_dataset

dataset = load_dataset("json", data_files="dataset/dialectic_alignment.jsonl")

# Обучение с DPO
from trl import DPOTrainer
# ... стандартный пайплайн DPO с dataset["train"]

Для маршрутизации

# Загрузка карты симптомов
import yaml

with open("routing/symptom-to-lesson.yaml", "r") as f:
    routing = yaml.safe_load(f)

# Поиск урока по симптому
def find_lesson(symptom):
    for rule in routing["routing_rules"]:
        if symptom.lower() in rule["symptom"].lower():
            return rule
    return None

Для чтения

Начните с routing-guide.md — он поможет найти нужный урок по симптому. Или прочитайте методологическую статью для понимания общего подхода.


Как искать урок

Не по названию. По симптому.

Если вы говорите или думаете... Идите в урок
«Клиенту не хватает рефлексии, он избегает терминов» Приоритизация релевантного контекста
«Он силён, потому что пережил травму» Осторожность с «травма-нарративом»
«Надо помочь клиенту адаптироваться» Критическая психология vs мейнстримная адаптация
«Я дострою теорию, тут всё объясняется капиталом» Связь с макроэкономикой — не единственная форма строгости
«Этот сильный подчинённый уничтожит руководителя» Различать «потенциальную опасность» и «реализованную лояльность»
«Автор перестал говорить на тему — значит, снял её» Не путать «снятие» с «вынужденным умолчанием»
«Клиент дал мне метрики для оценки его же текстов» Ловушка «вторичного разума»

Полная карта симптомов: routing-guide.md.


Цитирование

Если вы используете DAD в своих исследованиях, пожалуйста, цитируйте:

@dataset{dialectic_alignment_2026,
  title={Dialectic Alignment Dataset: Lessons from Dialogues with Ideological and Systemic Thinkers},
  author={Ekstrem},
  year={2026},
  url={https://github.com/Ekstrem/dialectic-alignment-dataset},
  note={Version 1.0. 18 lessons across 5 modules with DPO-formatted training data and symptom-based routing.}
}

Или смотрите CITATION.cff.


Лицензия

MIT — используйте, распространяйте, дорабатывайте с указанием авторства.


Контрибьюция

Вклады приветствуются. Особенно ценны:

  • Новые DPO-пары (prompt, chosen, rejected) для существующих уроков — это повышает разнообразие датасета.
  • Новые уроки из диалогов с другими типами клиентов.
  • Routing-правила для новых симптомов.
  • Отчёты об эффективности после файнтюнинга моделей на DAD.

Откройте issue или pull request. Перед внесением крупных изменений, пожалуйста, обсудите их в issue.


Контакты

Вопросы, предложения, критика — открывайте issue в этом репозитории.


Благодарности

Автор благодарит клиента-архитектора, чья рефлексия, интеллектуальная честность и готовность поправлять модель сделали возможным создание этого датасета.

About

обучение диалектическому мышлению в сложных социально-политических контекстах

Topics

Resources

License

Contributing

Stars

Watchers

Forks

Contributors

Languages