Спецификация и руководство
Коэволюция в многоагентных ИИ-системах (MAS) представляет собой взаимозависимый процесс адаптации, в котором действия одного агента непосредственно влияют на состояние, стимулы и правила поведения других.
### 1. Архитектура общего поля (Blackboard) и аудит
Децентрализованная координация без общего координационного слоя склонна к скрытому сговору (collusion) и неконтролируемому дрейфу поведения.
- **Blackboard (Общая доска)**: Все агенты публикуют свои планы, промежуточные выводы и запросы к инструментам на едином проверяемом реестре. Это обеспечивает 100% прозрачность и наблюдаемость.
- **Двухэтапный аудит**: Любое решение, выгружаемое агентом, валидируется независимой ролью критика/аудитора перед совершением действий.
### 2. Детерминированный Policy Gate (Шлюз политик)
Policy Gate действует на уровне выполнения инструментов. Агенту запрещено напрямую взаимодействовать с внешним миром:
- **Фильтрация интентов**: Любая команда или API-запрос проверяются на соответствие правам роли (схема passports v1) и жестким лимитам на расход токенов.
- **Human-in-the-Loop**: Любые действия деструктивного характера (удаление данных, транзакции, изменение прав доступа) требуют ручного аппрува оператора.
### 3. Изоляция исполнения (Sandboxing)
Для снижения рисков prompt-инъекций (OWASP GenAI Top 10) и удаленного выполнения произвольного кода (RCE), запуск Playwright-клиентов и пользовательских скриптов производится в песочницах:
- **gVisor**: Использование прикладного ядра, перехватывающего системные вызовы контейнера, для изоляции хост-ОС.
- **Firecracker**: Быстрые и легкие микро-VM с изоляцией на уровне гипервизора (KVM).
- **seccomp**: Строгая фильтрация разрешенных системных вызовов в Linux.
### 1. Архитектура общего поля (Blackboard) и аудит
Децентрализованная координация без общего координационного слоя склонна к скрытому сговору (collusion) и неконтролируемому дрейфу поведения.
- **Blackboard (Общая доска)**: Все агенты публикуют свои планы, промежуточные выводы и запросы к инструментам на едином проверяемом реестре. Это обеспечивает 100% прозрачность и наблюдаемость.
- **Двухэтапный аудит**: Любое решение, выгружаемое агентом, валидируется независимой ролью критика/аудитора перед совершением действий.
### 2. Детерминированный Policy Gate (Шлюз политик)
Policy Gate действует на уровне выполнения инструментов. Агенту запрещено напрямую взаимодействовать с внешним миром:
- **Фильтрация интентов**: Любая команда или API-запрос проверяются на соответствие правам роли (схема passports v1) и жестким лимитам на расход токенов.
- **Human-in-the-Loop**: Любые действия деструктивного характера (удаление данных, транзакции, изменение прав доступа) требуют ручного аппрува оператора.
### 3. Изоляция исполнения (Sandboxing)
Для снижения рисков prompt-инъекций (OWASP GenAI Top 10) и удаленного выполнения произвольного кода (RCE), запуск Playwright-клиентов и пользовательских скриптов производится в песочницах:
- **gVisor**: Использование прикладного ядра, перехватывающего системные вызовы контейнера, для изоляции хост-ОС.
- **Firecracker**: Быстрые и легкие микро-VM с изоляцией на уровне гипервизора (KVM).
- **seccomp**: Строгая фильтрация разрешенных системных вызовов в Linux.