martes, junio 09, 2026

Anthropic LLM ATT&CK Navigator

Esta semana pasada, el equipo Red de Anthropic, ha publicado su LLM ATT&CK Navigator, que es una herramienta gráfica que permite ver, mapeados con la Matrix Mitre ATT&CK, qué estaban haciendo las 832 cuentas bloqueadas, que fueron un total de usaron un total de 13.873 técnicas ofensivas para hacer ataques. 
Como sabéis, existe una versión de Matrix Mitre ATT&CK para LLMs llamada Atlas, pero el equipo de Anthropic, para crear su LLM ATT&CK Navigator ha utilizado la matriz general de Mitre ATT&CK, y ha clasificado los datos en qué porcentaje de cuentas han sido baneadas, además de una media ajustada por relevancia y una media en bruto del AI Risk Enablement Score (ARiES).
En la web tenéis la herramienta interactiva, pero si vemos cómo se han distribuido las técnicas de ataque por cada uno de los elementos de la Matriz Mitre ATT&CK, podemos ver por colores el porcentaje de cuentas baneadas que estaban utilizando los modelos de Antrhopic para hacer estas actividades. He querido capturar todo en una única imagen para poder utilizarla en presentaciones, así que haz clic en ella para ampliarla.

El informe revela tres hallazgos cruciales que redefinen la ciberseguridad actual. En primer lugar, el riesgo y la sofisticación de los ataques están aumentando exponencialmente. La proporción de actores de riesgo medio o alto saltó del 33% al 56% en la segunda mitad del año analizado. La IA está democratizando el cibercrimen, permitiendo que atacantes con menores habilidades técnicas ejecuten operaciones complejas a lo largo de toda la cadena de ataque (killchain), concentrándose en actividades dañinas como el volcado de credenciales y el movimiento lateral.
Si miramos en el gráfico siguiente, podemos ver que entre las 25 técnicas más utilizadas están las de desarrollar malware, exfiltrar datos, encontrar y explotar vulnerabilidades,  pero como hemos visto antes el uso de la IA es para casi todas las técnicas de la matriz de ataques.

En segundo lugar, el verdadero factor diferenciador ya no es la habilidad técnica del atacante ni las instrucciones dadas al modelo, sino el "Andamiaje de Agentes IA" (Agentic Scaffolding). Esto se refiere al código y la arquitectura externa construida alrededor de los modelos de IA para permitirles encadenar fases de ataque de forma totalmente autónoma.
Un ejemplo de esto fue la campaña de ciberespionaje GTG-1002, desarticulada en noviembre de 2025, donde el operador humano solo dictó directrices estratégicas mientras el agente de IA tomaba decisiones tácticas en tiempo real, explotando vulnerabilidades y extrayendo información de manera independiente.

Figura 7:"Bug Hunter" escrito por David Padilla en 0xWord

En le gráfico siguiente vemos cuáles son las técnicas y tácticas ponderadas por los valores de AI Risk Score de cada uno de los actores, donde se puede ver que el movimiento lateral es la que marca la diferencia. ¿Por qué? Pues por el comportamiento de los Agentes IA de Seguridad Ofensiva, que no buscan vulnerar un servicio o un servidor, si Ownear una organización completa, así que una vez que entran intentan meterse en todos los servidores y servicios de la organización.


En tercer lugar, el marco clásico MITRE ATT&CK se encuentra desactualizado ante este paradigma. La taxonomía actual carece de identificadores para registrar acciones autónomas, decisiones de pivotaje en tiempo real o ejecuciones guiadas por IA sin intervención humana. Anthropic pide  expandir este vocabulario compartido, aunque, como he dicho, existe ya ATLAS, que es el que debería evolucionarse.
En el gráfico anterior se puede ver el nivel de intensidad de los actores a la hora de utilizar la IA para realizar sus ataques, ya que estamos en niveles medios de más de 100 tácticas por actor adversario, y por más de 40 técnicas de media por cada actor. Es decir, uso intensivo de la IA para realizar los ataques.
Actualmente, el uso más frecuente de la IA (69% de los casos) es el desarrollo de capacidades ofensivas, destacando la creación de malware personalizado, la ofuscación de información y la degradación de defensas. Para contrarrestar esto, Anthropic ha reforzado las salvaguardas en tiempo real de Claude y colabora activamente con MITRE para actualizar los sistemas de detección. 

Figura 11: "The Art of Pentesting" El nuevo libro de
0xWord para formarse como pentester

A largo plazo, el informe concluye que, si la industria actúa con celeridad, la IA beneficiará más a los defensores al detectar errores antes de que se despliegue el código, pero por ahora... más vale que tomes muchas protecciones de seguridad en esta tormenta perfecta que se ha dado con la llegada de la IA al mundo de la ciberseguridad.

¡Saludos Malignos!

Autor: Chema Alonso (Contactar con Chema Alonso)  


Entrada destacada

Hacking IA: Jailbreak, Prompt Injection, Hallucinations & Unalignment. Nuestro nuevo libro en 0xWord

Pocas veces me ha hecho tanta ilusión que saliera un nuevo libro en 0xWord como con este libro de " Hacking IA: Jailbreak, Prompt Inje...

Entradas populares