Anthropic publicó el 22 de mayo el primer informe cuantitativo de progreso de Project Glasswing, su iniciativa de IA defensiva, que mostraba que el modelo inédito Claude Mythos Preview —junto con unos 50 socios— había identificado más de 10.000 vulnerabilidades de severidad alta o crítica en software de importancia sistémica. La cifra captó la atención de inmediato, pero generó afirmaciones inexactas de que un único modelo había encontrado 10.000 fallos críticos en código abierto. La verdadera historia es más reveladora: el cuello de botella pasó de la escasez de hallazgos a un déficit de capacidad para verificar, comunicar de forma responsable y corregir esas vulnerabilidades.
Los nuevos datos constituyen la evidencia pública más sólida hasta la fecha de que la IA de frontera puede acelerar drásticamente el descubrimiento de vulnerabilidades a una escala que la infraestructura actual de parcheo y divulgación no puede igualar. Para los operadores, la implicación es contundente: el software que sostiene los sistemas críticos se vuelve más transparentemente inseguro antes de que pueda ser reforzado.
Anthropic lanzó Project Glasswing el 7 de abril, concediendo acceso a Mythos Preview a 11 socios fundadores —entre ellos AWS, Apple, Google, JPMorganChase, Microsoft y la Linux Foundation— y a más de 40 organizaciones, junto con 100 millones de dólares en créditos de uso y 4 millones en donaciones. La actualización del 22 de mayo, que también puso en marcha un panel coordinado de divulgación de vulnerabilidades, informó de que en todas las colaboraciones el modelo había revelado más de 10.000 vulnerabilidades de severidad alta o crítica: una mezcla de código propio, infraestructura de socios y proyectos de código abierto.
Al margen de ese agregado, el propio escaneo de Anthropic sobre código abierto examinó más de 1.000 proyectos y marcó 23.019 hallazgos totales, de los cuales 6.202 fueron calificados como de severidad alta o crítica por el modelo. De 1.752 hallazgos de severidad alta y crítica revisados por humanos, 1.587 fueron verdaderos positivos y 1.094 se confirmaron como genuinamente altos o críticos. La compañía proyectó unos 3.900 vulnerabilidades confirmadas de severidad alta o crítica en código abierto si se mantenían las tasas de validación. Sin embargo, hasta la fecha de la actualización solo se habían comunicado a los mantenedores 530 vulnerabilidades de ese tipo; 75 habían sido parcheadas y 65 contaban con registros públicos de aviso, de un total de 1.596 divulgaciones en todas las severidades.
Las confirmaciones independientes más concretas llegaron de Mozilla y wolfSSL. Mozilla incorporó correcciones para 271 vulnerabilidades identificadas por Mythos en Firefox 150: 180 de severidad alta, 80 moderadas y 11 bajas. wolfSSL atribuyó al modelo la generación de ocho CVE que motivaron la publicación de wolfSSL 5.9.1; Anthropic destacó un fallo de falsificación de certificados (CVE-2026-5194). Cloudflare, que utilizó Mythos Preview en más de 50 repositorios, describió el razonamiento y la generación de pruebas del modelo como un verdadero avance. Anthropic atribuyó a la colaboración con Cloudflare un total de 2.000 fallos y 400 hallazgos de severidad alta o crítica; el blog público de Cloudflare no reprodujo esas cifras de forma independiente.
La postura pública de Anthropic es inequívoca: "> El factor limitante ya no es encontrar vulnerabilidades, sino verificarlas, comunicarlas de forma responsable y corregirlas." Microsoft, Oracle y Palo Alto Networks reconocieron que la detección asistida por IA está incrementando los volúmenes de identificación y parcheo. Ese desajuste es ahora el desafío definitorio.
Claude Mythos Preview sigue siendo una versión preliminar de investigación restringida, accesible solo para los participantes de Glasswing. No se ha lanzado públicamente y sus capacidades técnicas aún se están evaluando. Una evaluación independiente de XBOW señaló fortalezas en razonamiento y generación de pruebas de concepto, pero también advirtió limitaciones que requieren herramientas adicionales para alcanzar la paridad ofensiva totalmente automatizada. El Instituto de Seguridad de la IA del Reino Unido examina por separado el ritmo de las capacidades cibernéticas autónomas.
Lo que sigue sin estar claro es cuántas de las más de 10.000 vulnerabilidades detectadas por los socios han sido validadas o parcheadas de forma independiente; la cifra agregada mezcla bases de código y estándares de verificación sin un desglose público. Se desconoce el solapamiento entre los hallazgos de los socios y el panel de código abierto, y no se ha revelado la tasa de falsos positivos en todas las colaboraciones. Las reacciones de los mantenedores —si se sienten desbordados o si cuestionan la calidad— no se han estudiado de forma sistemática, y las respuestas regulatorias apenas están empezando.
La actualización de Glasswing deja claro que la comunidad de seguridad opera ya en un régimen en el que la IA encuentra fallos más rápido de lo que las organizaciones pueden corregirlos. Ese cambio obligará a empresas y reguladores a decidir cuánta transparencia puede absorber el ecosistema y si es necesario rediseñar los procesos de parcheo y divulgación para un mundo de hallazgos abundantes.
