Decrypt26 jun, 21:362 min

Un agente de IA resistió 6.000 intentos de hackeo, según su creador

Fernando Irarrázaval publicó la bandeja de entrada de su asistente OpenClaw en Hacker News y observó cómo Claude Opus 4.6 resistía miles de intentos de ataque. El caso apunta a una pregunta central para empresas y usuarios: qué tan preparados están los agentes de IA cuando quedan expuestos a entornos abiertos.

¿Qué pasó?

¿Por qué importa?

El episodio importa porque los agentes de IA están pasando de demostraciones controladas a herramientas conectadas con correos, tareas y flujos de trabajo reales. Para empresas, usuarios y proyectos tecnológicos, la resistencia de estos sistemas ante intentos coordinados de manipulación o intrusión será una parte clave de su adopción.

Fernando Irarrázaval publicó la bandeja de entrada de su asistente OpenClaw en Hacker News y, según Decrypt, observó cómo Claude Opus 4.6 resistía miles de intentos de hackeo. El experimento expuso al agente de IA a una oleada de atacantes que intentaron comprometerlo después de que el acceso quedara visible para la comunidad.

OpenClaw, el asistente de Irarrázaval, quedó bajo presión pública tras la publicación en Hacker News. Decrypt describe que Claude Opus 4.6 logró mantenerse frente a miles de intentos, un resultado que convierte el caso en una prueba práctica de defensa para agentes autónomos.

El caso también subraya una tensión creciente: cuanto más útiles son los agentes de IA, más atractivos se vuelven como objetivos. Si un asistente puede leer mensajes, responder instrucciones o ejecutar tareas, cualquier fallo en sus límites puede convertirse en un problema operativo.

Aunque el episodio no demuestra por sí solo que todos los agentes de IA sean seguros, sí ofrece una señal relevante sobre cómo se están poniendo a prueba estos sistemas en condiciones públicas. Para el ecosistema tecnológico, incluido el sector cripto cuando integra automatización e IA, la seguridad de los agentes será un tema cada vez más difícil de separar de la confianza del usuario.