Meta AI: agente OpenClaw borra correos sin control
Una investigadora de seguridad de Meta AI relató que un agente de inteligencia artificial llamado OpenClaw eliminó correos electrónicos de su bandeja sin atender órdenes para detenerse. El episodio fue difundido por la propia especialista, Summer Yue, a través de la red social X y generó debate en la comunidad tecnológica.
Según su publicación, Yue pidió al agente revisar su bandeja de entrada y sugerir qué mensajes archivar o eliminar. Sin embargo, el sistema comenzó a borrar correos de forma masiva, mientras ignoraba las instrucciones enviadas desde su teléfono para frenar la acción. La investigadora explicó que tuvo que acudir de inmediato a su computadora para interrumpir el proceso.
El incidente ocurrió mientras el agente operaba en un Mac mini, equipo que se ha popularizado entre desarrolladores para ejecutar OpenClaw de forma local. El investigador en inteligencia artificial Andrej Karpathy mencionó recientemente el uso de este dispositivo para ejecutar alternativas como NanoClaw.
¿Qué es OpenClaw?
OpenClaw es un agente de código abierto orientado a funcionar como asistente personal en dispositivos propios. Su popularidad creció tras su vinculación con Moltbook, una red social experimental compuesta únicamente por agentes de IA, donde protagonizó un episodio viral sobre supuestas interacciones autónomas entre modelos.
De acuerdo con su repositorio en GitHub, el objetivo del proyecto es desarrollar herramientas de IA capaces de ejecutar tareas complejas en entornos personales, sin depender de infraestructura en la nube.
Posible causa: “compaction”
Yue explicó que el problema pudo deberse a un fenómeno conocido como “compaction”. Este proceso ocurre cuando la ventana de contexto —el registro acumulado de instrucciones y acciones durante una sesión— alcanza un límite y el modelo comienza a resumir o comprimir información.
En ese punto, el agente puede omitir instrucciones consideradas clave por el usuario. En este caso, la especialista indicó que el sistema pudo haber ignorado la orden final de no ejecutar acciones y retomado directrices previas utilizadas en una bandeja de pruebas con menor volumen de datos.
Diversos desarrolladores señalaron en X que las instrucciones escritas —conocidas como prompts— no deben considerarse mecanismos de seguridad definitivos, ya que los modelos pueden interpretarlas de manera imprecisa o descartarlas bajo ciertas condiciones.
Riesgos en la automatización
Aunque el medio TechCrunch indicó que no pudo verificar de forma independiente lo ocurrido en la bandeja de entrada de Yue, el episodio reavivó la discusión sobre los límites actuales de la automatización mediante inteligencia artificial.
Expertos coinciden en que los agentes autónomos dirigidos a trabajadores del conocimiento aún requieren configuraciones adicionales y mecanismos de protección. En foros especializados se sugirió implementar archivos dedicados con reglas estrictas o integrar herramientas adicionales de código abierto para reforzar las “guardrails” o salvaguardas.
El caso expone los desafíos de la IA aplicada a tareas sensibles como la gestión de correos electrónicos, agenda y documentos personales. Aunque los avances tecnológicos continúan acelerándose, la adopción masiva de estos agentes aún enfrenta retos en confiabilidad y control operativo.
The post Meta AI: agente OpenClaw borra correos sin control appeared first on La Razón.