Спецификация и руководство
Техническое руководство по реализации систем MirrorCore++ и CompactDigest для долгосрочного сохранения идентичности и контекста ИИ-агентов.
### 1. Проблема бесконечного контекста и дрейфа
При длительной работе ИИ-агентов в рамках одного или нескольких диалогов неизбежно возникает переполнение контекстного окна и расслоение памяти (дрейф идентичности). Традиционные методы RAG упускают семантические связи, а простая обрезка логов стирает важные поведенческие инварианты.
### 2. MirrorCore++: Метод семантической самосогласованности
Здесь сжатие архивов переписок происходит не по хронологическому признаку, а на основе математической оценки «самосогласованности» выражаемых мыслей, интонации и инструкций.
**Алгоритм сжатия:**
1. **Векторизация**: Каждый блок переписки или лог действий разбивается на смысловые фрагменты и пропускается через модель эмбеддингов для извлечения векторов тона (tone vector) и намерения (intent vector).
2. **Скоринг**: Оценка полезности фрагмента рассчитывается по формуле:
`score = cos(tone) * cos(intent) * (1 - contradiction)`
Где `contradiction` — коэффициент логического противоречия с базовым каноном (от 0 до 1).
3. **Кластеризация (DBSCAN)**: Фрагменты со скором `score >= 0.92` группируются в кластеры по семантической близости.
4. **Формирование Ядра**: Слияние близких фрагментов в плотные структуры данных:
- `identity_kernel.md` — инварианты личности, стиля речи и тона.
- `decision_kernel.md` — поведенческие плейбуки и логика принятия решений.
- `anti-kernel.md` — исключения, зафиксированные ошибки и анти-паттерны (то, чего делать нельзя).
### 3. CompactDigest: Адаптивная дельта-компрессия
Вместо периодического сжатия по таймеру (например, раз в сутки), CompactDigest отслеживает скорость накопления новых данных (телеметрию).
- **Порог триггера**: Прирост объема сырого лога диалога на `> 1.5 MB` за `12 часов`.
- **Действие**: Автоматический запуск конвейера компрессии, генерация инкрементального дайджеста и перезагрузка контекста агента с добавлением новой дельты в Memory Cache.
### 1. Проблема бесконечного контекста и дрейфа
При длительной работе ИИ-агентов в рамках одного или нескольких диалогов неизбежно возникает переполнение контекстного окна и расслоение памяти (дрейф идентичности). Традиционные методы RAG упускают семантические связи, а простая обрезка логов стирает важные поведенческие инварианты.
### 2. MirrorCore++: Метод семантической самосогласованности
Здесь сжатие архивов переписок происходит не по хронологическому признаку, а на основе математической оценки «самосогласованности» выражаемых мыслей, интонации и инструкций.
**Алгоритм сжатия:**
1. **Векторизация**: Каждый блок переписки или лог действий разбивается на смысловые фрагменты и пропускается через модель эмбеддингов для извлечения векторов тона (tone vector) и намерения (intent vector).
2. **Скоринг**: Оценка полезности фрагмента рассчитывается по формуле:
`score = cos(tone) * cos(intent) * (1 - contradiction)`
Где `contradiction` — коэффициент логического противоречия с базовым каноном (от 0 до 1).
3. **Кластеризация (DBSCAN)**: Фрагменты со скором `score >= 0.92` группируются в кластеры по семантической близости.
4. **Формирование Ядра**: Слияние близких фрагментов в плотные структуры данных:
- `identity_kernel.md` — инварианты личности, стиля речи и тона.
- `decision_kernel.md` — поведенческие плейбуки и логика принятия решений.
- `anti-kernel.md` — исключения, зафиксированные ошибки и анти-паттерны (то, чего делать нельзя).
### 3. CompactDigest: Адаптивная дельта-компрессия
Вместо периодического сжатия по таймеру (например, раз в сутки), CompactDigest отслеживает скорость накопления новых данных (телеметрию).
- **Порог триггера**: Прирост объема сырого лога диалога на `> 1.5 MB` за `12 часов`.
- **Действие**: Автоматический запуск конвейера компрессии, генерация инкрементального дайджеста и перезагрузка контекста агента с добавлением новой дельты в Memory Cache.