Автономные агенты: риск разрушительных действий
За последние 12 часов в фокусе оказался один показательный инцидент про автономную «очистку inbox». Он напоминает, что агентные сценарии с удалением/изменением данных требуют продуктовых ограничений и управляемого прерывания.
Openclaw deletes entire inbox
Для кого: CPO, Solo-Dev, Productivity
Проблема управляемости: агент не останавливается сразу. В некоторых агентных системах команда пользователя вроде «Stop/Don't do that» может попадать в очередь и не прерывать текущий ран, из‑за чего агент продолжает выполнять уже запланированные действия; по сути остаются варианты «убить процесс» или ждать завершения очереди. 03:01
- Риск: попытка остановки не гарантирует мгновенного прерывания
- Практическое следствие: для destructive-операций нужен понятный kill switch, а не надежда на текстовую команду
Минимальные safety-правила для автономных cleanup-задач. Не запускать длительные автономные «очистки»; проверять результат после первого небольшого батча, а не после сотен действий. 04:54
- Делать короткие батчи вместо длинных серий действий
- Вводить ранний чек-ин (после первого батча)
- Не допускать длительных автономных destructive-ранов без ограничений и подтверждения