Claude Mythos Resuelve el 73% de Tareas Cibernéticas Expertas que Ninguna IA Podía Resolver Antes
Resumen
Según evaluaciones del Instituto de Seguridad de IA (AISI) del Reino Unido, el modelo Claude Mythos Preview de Anthropic se ha convertido en la primera IA en completar un ataque simulado completo a una red corporativa. El modelo alcanzó una tasa de éxito del 73% en tareas de nivel experto de captura de banderas (CTF) que antes ninguna IA podía resolver. En una simulación de ataque a red corporativa de 32 pasos, Mythos Preview completó un promedio de 22 pasos, superando significativamente a Claude Opus 4.6. Anthropic también informó que Claude Mythos Preview puede detectar y explotar vulnerabilidades de día cero cuando se le instruye. Debido a sus capacidades avanzadas, Anthropic no está lanzando el modelo públicamente y lo está utilizando para investigación de seguridad. Los hallazgos han provocado discusiones de alto nivel, incluida una reunión entre el Secretario del Tesoro de EE. UU., Scott Bessent, y el Presidente de la Reserva Federal, Jerome Powell, con los principales CEO de bancos sobre los riesgos cibernéticos potenciales. El AISI recomienda que las organizaciones prioricen las medidas fundamentales de ciberseguridad.
(Fuente:BeInCrypto)