domingo, julio 05, 2026

"pxpipe" Un proxy para insertar Prompts y Contexto en imágenes y ahorrar (muchos) costes en tokens de Claude [u otros]

Los costes de los Tokens en los últimos modelos de IA empiezan a crear una nueva brecha entre las empresas y ciudadanos que tienen acceso a Tokens de modelos Frontera como Claude Fable sin límites, y aquellos que están sujetos a las limitaciones presupuestarias y tienen que usar modelos más económicos - o menos potentes -, lo que puede ser una diferencia de capacidades y de resultados para las empresas y las personas en el acceso a la Inteligencia Artificial

Para amortiguar este impacto, ya os hablé en el artículo de "Cómo optimizar el gasto en IA con arquitecturas clasificadas, orquestadas y/o destilación. El problema de la Predictibilidad de los Costes de la IA" sobre cómo diseñar arquitecturas de software con orquestación de modelos, elección de algoritmos y destilación de conocimiento en productos y servicios que utilicen LLMs para funcionar. Además, en ese artículo os dejaba algunas recomendaciones en la reducción de Tokens que genera el modelo, para evitar costes innecesarios.
Sin embargo, acceder a estos últimos modelos, sobre todo con la aplicación de MM-LLMs para todo los Agentes IA para el Red Team, o para los servicios más modernos, sigue siendo una necesidad y las ideas para optimizar este consumo sin degradar el servicio siguen apareciendo. Esta última que os cuento es pxpipe, un proxy local que hace algo muy ingenioso.
Convierte tu Prompt y tu contexto en una imagen que se envía a Claude y que hace que los costes del uso de este LLM se reduzcan, gracias a que el coste de procesar las imágenes es fijo en función del tamaño en píxeles de la misma, y se puede lograr un ratio de 3 a 1 metiendo el texto de tu Prompt y tu Contexto de entrada en imágenes. Pero hace lo mismo en la salida, generando imágenes con los tokens de respuesta metidos en una imagen, lo que reduce también el coste.
Así de sencillo, y así de ingenioso. Además, como funciona como Proxy, es una solución perfecta para las apps móviles que usan LLMs con Proxys en el Backend, donde sólo hay que añadir el uso de pxpipe en ese Proxy para conseguir la reducción de costes. 

Figura 5: Imagen hecha con pxpipe con todo el Prompt y Contexto
(Click en la imagen para ver en grande)

En el proyecto, que lo tienes publicado en GitHub, tienes un par de vídeos de ejemplos, donde puedes ver dos sesiones en paralelo. En esta primera comparación, tienes los Tokens de entrada, los Tokens de salida, y el coste del proyecto de una sesión Claude Fable normal.
La misma sesión, utilizando pxpipe, reduce los costes a menos de un tercio, y consigue los mismos resultados, inyectando sólo un poco más de tiempo en el análisis de la imagen con los datos de entrada y procesando los datos de salida en una imagen.

Figura 7: Sin usar pxpipe cuesta 42.21 USD

Y en esta imagen, lo mismo pero con pxpipe de por medio, donde el coste es poco más de seis dólares para hacer el mismo trabajo, lo que es una diferencia muy significativa.

Figura 8: Mismo trabajo con pxpipe

Este "hack" de optimización se salta la política de costes del modelo, pero realmente no está haciendo nada prohibido, sino aprovechar los sistemas de tarificación y las capacidades de los modelos, pero es de suponer que como esta práctica se empiece a extender, simplemente cambiarán la política de tarificación en estos casos.

Figura 9: Demo 2 de pxpipe

En esta segunda demo que tenéis en vídeo, el resultado pasa de 12 USD a menos de 1 USD, lo que también es una reducción significativa. En el GitHub de pxpipe tenéis diferentes tablas y comprobaciones, pero lo puedes hacer tú. Es tan fácil como correr en local el proyecto y usar tu OpenCode a través de él para poder calcular lo que te consume y cómo funciona.
Este es un buen "hack" de IA, pero donde más duele, a la parte económica. No obstante, si lo que quieres controlar en tu empresa el uso y los costes que hacen los usuarios en los modelos, en Cloudflare AI Gateway tienes límites de presupuesto y observabilidad de los costes en todo momento, algo que te va a permitir evitar "sustos" indeseables.
Tienes toda la información sobre cómo funciona Cloudflare AI Gateway para el control de gastos en el artículo: "Your AI bill is out of control. Cloudflare can fix it now."

Como podéis ver, esto va my rápido, pero entender bien todos los detalles, los controles, y los límites de funcionamiento de cada capacidad que te dan los modelos de IA es fundamental. Si tus servicios digitales dejan que tus modelos queden malamente expuestos, podrás ser tú el que pague los costos de otros, como vimos con las apps móviles y con los asistentes digitales inseguros.

¡Saludos Malignos!

Autor: Chema Alonso (Contactar con Chema Alonso)  


sábado, julio 04, 2026

Código de Rebajas de Verano 2026 en 0xWord: Cupón VERANO2026 10% descuento. (más lo que tengas en Tempos)

Ya tenemos activo el Código de Rebajas de Verano: VERANO2026 en 0xWord, que  hasta las 23:59:59 del 15/07/2026 tiene un descuento que da un 10% de reducción de precio en todos los productos de la tienda de 0xWord.com. Es tan sencillo como incluir en el proceso de compra el código VERANO2026 para obtener un 10% de rebaja en el precio, y además, como te cuento en este artículo, tienes también otras formas de conseguir más ahorros utilizando tus Tempos de MyPublicInbox.

Figura 1: Código de Rebajas de Verano 2026 en  0xWord.com.
Cupón 10% descuento: VERANO2026
y descuentos con Tempos de MyPublicInbox

El código descuento, ya está disponible, así que si lo utilizas tendrás un descuento del 10% en todo el material de 0xWord en la tienda. Incluido el merchandising de Cálico Electrónico, los Packs Oferta, los VBOOKs, los cómics de EVIL:ONE en 0xWord Comics, las novelas en 0xWord Pocket o los nuevos de 0xWord Brain.
Pero además, tienes formas de incrementar los descuentos de 0xWord, utilizando tus Tempos de MyPublicInbox, que puedes usar de dos formas diferentes. 
Enviando Tempos a 0xWord y consiguiendo un descuento extra o canjeando un código descuento de 0xWord por Tempos de MyPublicInbox.  Aquí te explico cómo se hace.

Enviar tus Tempos a 0xWord y recibir el descuento

La idea es muy sencilla, hemos creado un Buzón Público de 0xWord en MyPublicInbox y tenemos disponible el módulo de transferencias de Tempos entre cuentas siempre que el destinatario sea un Perfil Público de la plataforma. Para que se puedan hacer estas transferencias, primero debe estar el Perfil Público destinatario de la transferencia en la Agenda.

Figura 4: Perfil de 0xWord en MyPublicInbox. Opción de "Añadir a  la Agenda".
https://MyPublicInbox.com/0xWord

Para dar de alta un Perfil Público en tu agenda, solo debes iniciar sesión en MyPublicInbox, y con la sesión iniciada ir a la web del perfil. En este caso, a la URL del perfil público de 0xWord en MyPublicInbox, - https://MyPublicInbox.com/0xWord - donde te aparecerá la opción de "Añadir a la agenda". Cuando acabe este proceso, podrás ir a la opción Agenda de tu buzón de correo en MyPublicInbox y deberías tener el Perfil Público de 0xWord allí.

Figura 5: Cuando lo agregues estará en tu agenda

Una vez que lo tengas en la agenda, ya será tan fácil como irte a tu perfil - se accede haciendo clic en la imagen redonda con tu foto en la parte superior - y entrar en la Zona de Transferencias. Desde allí seleccionas el Buzón Público de 0xWord, el número de Tempos que quieres transferir, y en el concepto debes poner que es para recibir un código descuento para usar en la tienda de 0xWord.


No te preocupes por el texto concreto, porque los procesamos manualmente como los pedidos de se hacen en la tienda. 

Canjear 500 Tempos por un código descuento de 5 €

La última opción es bastante sencilla. Solo debes irte a la sección de Canjear Tempos -> Vales para Tiendas, y "Comprar" por 500 Tempos y código de 5 €. Es lo mismo que enviar la transferencia pero en un paquete de 500 Tempos y de forma totalmente automatizada, así que solo con que le des a comprar recibirás el código descuento y lo podrás utilizar en la tienda de 0xWord.com

Así que, si quieres conseguir nuestros libros durante este VERANO2026, entre el código de descuento VERANO2026 y los Tempos de MyPublicInbox podrás hacerlo de forma muy sencilla y mucho, mucho, mucho más barata. 

Y así apoyas este proyecto tan chulo que es 0xWord.com, donde como ves, nos esforzamos por tener libros técnicos chulos en Español.

¡Saludos Malignos!

Autor: Chema Alonso (Contactar con Chema Alonso)  

viernes, julio 03, 2026

Cómo sacar partido a la nueva dirección de e-mail de MyPublicInbox protegida con Tempos

En MyPublicInbox la comunicación de valor entre los usuarios es la clave. Conseguir que los mensajes enviados con apreciación del valor del tiempo del receptor - pagados con Tempos - y los que son oportunidades profesionales para los Perfiles Públicos, como entrevistas, conferencias, oportunidades laborales, o demás servicios que se van incorporando en la plataforma, lleguen al buzón es lo que nos hace trabajar. Reducir el ruido y aumentar el valor. Son las dos consignas con las que se construye MyPublicInbox.

En la última actualización de la plataforma hemos metido dos grandes mejoras, que hemos tenido en pruebas durante estas semanas. La primera de ella es la de asociar una dirección de e-mail al buzón público de los perfiles públicos de la plataforma que permite un funcionamiento similar al de la plataforma pero, en lugar de ir vía web o vía app, se puede hacer vía correo electrónico.
Cada Perfil Público está ahora accesible vía una dirección de e-mail construida sobre el domino mypublicinbox.email, que es totalmente funcional, y se puede utilizar en cualquier plataforma que solicite el correo electrónico o en cualquier red social. En mi caso, como podéis ver arriba es chemaalonso@mypublicinbox.email.

Figura 3: Envío de e-mail a la dirección @mypublicinbox.email

Esta dirección, bien puede ser la que vendan las plataformas de Data Enrich, que no hay ningún problema con ello. Si cualquiera usa esa dirección de e-mail para enviar un mensaje, podrá hacerlo perfectamente. Pero el sistema responde de manera automática con el proceso de envío con Tempos.

Figura 4: Respuesta recibida por e-mail

Cuando el remitente quiera enviar el mensaje final al buzón, se irá a la web de uso de Tempos de MyPublicInbox, pero además, si no quiere sacarse una cuenta de MyPublicInbox, podrá hacerlo vía usuario invitado - desde su dirección de e-mail de origen -, pero comprando los Tempos ad-hoc.

Figura 5: Envío de mensaje en myPublicInbox cómo invitado vía e-mail

Pero no sólo eso. Ahora, si tu quieres, puedes tener listas blancas de direcciones de correo electrónico permitidas para que entren sin coste de Tempos vía e-mail en tu buzón, de tal manera que si vas a un hotel, o un evento, o a un sitio donde te piden los datos de dirección de e-mail y tú no quieres que te manden mensajes publicitarios, pues usas tu dirección de e-mail @mypublicinbox.email y listo. Y si quieres recibirlos, pues añades el domino de esa empresa en la lista blanca.

Figura 5: Registrándome con mi e-mail de mypublicinbox.email

Y si el mensaje cumple con tus normas, pues entonces entrará en tu buzón sin ningún coste de Tempos para nadie. Es tu decisión de valor, y si para un Perfil Público tiene valor esa comunicación, la plataforma lo permite configurar.

Figura 6: En Mi Correo -> Configurar Correo puedes configurar el acceso vía e-mail

Hemos bloqueado los dominios generalistas, por ahora, que habilitar un Gmail o un Hotmail, u otros dominos, es abrir la caja de Pandora a phishers, spammers, scammers, y demás gente de mal vivir en el mundo de las ciberestafas, así que si lo intentas, te saldrá una alerta.

Figura 7: No se permiten dominios generalistas completos.

Cuando llegue un mensaje, entonces aparecerá dentro de tu buzón como una Oportunidad, y podrás entrenar el algoritmo con si tiene o no valor para ti ese mensaje. ¿Por qué eso? Pues porque hemos añadido otra opción que está en pruebas, que es el filtrado de oportunidades.

Figura 8: Cuando entre el correo entrará como Oportunidad sin Tempos.
(en este caso la aceptación desde un congreso de nuestro último paper)

En este caso, si llega algún mensaje de alguien que la plataforma identifica en tu buzón como una oportunidad profesional como las que tienes en la plataforma, puede ser que el mensaje entre en tu buzón. Estos mensajes entrarán sin Tempos, por lo que no tienes la obligación de contestarlos, y podrás entrenar el algoritmo marcando si tiene valor para ti o no esa oportunidad en concreto.

No se vayan todavía, aún ahí más...

Este año, que el roadmap es muy agresivo, iremos viendo más cosas para ampliar las capacidades de la plataforma, así que os tendré que contar muchas nuevas cosas de MyPublicInbox

¡Saludos Malignos!

Autor: Chema Alonso (Contactar con Chema Alonso)  


jueves, julio 02, 2026

IA generativa, reglas deterministas e intervención humana: lo que aprendí modelando amenazas con un pipeline híbrido

Cuando uno termina un máster, como el Máster en IA aplicada a la Ciberseguridad del Campus de Cibersegurdiad, lo último que quiere (yo al menos) es que el TFM quede guardado en un cajón, así que contacté con Chema Alonso a través de MyPublicInbox para publicarlo, y aquí lo tienes. Una prueba de concepto de modelado de amenazas con IA local, validación humana y núcleo determinista, como excusa para hablar de dónde conviene poner cada tipo de IA en un proceso y dónde no poner ninguna.

Figura 1: IA generativa, reglas deterministas e intervención humana.
Lo que aprendí modelando amenazas con un pipeline híbrido

Mi aporte en el proyecto está centrado en el modelado de amenazas en sistemas porque está vinculado a la gestión de riesgos, que es un poco a lo que me dedico, pero la pregunta que lo originó es más amplia y, creo, más interesante que el caso concreto: 

"¿Cuándo conviene dejar que un modelo generativo haga el trabajo, cuándo conviene dejarlo trabajar pero con validación humana, y cuándo conviene no usar IA en absoluto?"

El modelado de amenazas resultó ser un buen banco de pruebas para esa pregunta al convivir tareas de naturaleza muy distinta dentro de un mismo flujo. 

Figura 2: Cómo ser un experto en Inteligencia Artificial aplicada a Ciberseguridad.
Fecha de Comienzo - 15 de Octubre 2026 - 12 meses de duración

Algunas tareas le sientan bien a un LLM; otras lo hacen picar el anzuelo y otras, directamente, no necesitan IA. Este artículo cuenta cómo quedó repartido ese trabajo y por qué. La PoC es la anécdota y el reparto (por así decirlo) es la idea.

El problema concreto: el modelado de amenazas no escala

El modelado de amenazas identifica riesgos y propone mitigaciones en fases tempranas del diseño de sistemas, cuando la arquitectura todavía es flexible y cambiar algo cuesta poco. Suena a buena práctica obvia, y lo es. El problema es que cuesta hacerlo de forma sistemática.

Para analizar un sistema con un modelo de clasificación de amenazas como STRIDE hay que partir de un diagrama de arquitectura y convertirlo en un inventario estructurado. En otras palabras, hay que determinar qué componentes hay, de qué tipo es cada uno, cómo fluyen los datos entre ellos, qué límites de confianza se cruzan, si el transporte va cifrado o en claro, etcétera. 

Esa conversión manual del dibujo al inventario lleva tiempo, depende de experiencia especializada y, sobre todo, varía según el analista que la haga. Dos expertos pueden tipificar el mismo diagrama de forma distinta, punto a partir del cual el análisis entero diverge. Si esa traducción no se apoya en reglas explícitas, la reproducibilidad se ve comprometida.

La tentación en 2026 es obvia: que un modelo multimodal lea el diagrama y escupa el análisis completo de punta a punta. Y aquí es donde aparece la primera decisión de diseño importante.

El marco: tres decisiones, no una regla

La respuesta a "¿uso IA o no?" depende de la tarea, de "qué pasa cuando el modelo se equivoca" y de "si el problema ya se puede resolver con reglas estables". Con estos criterios las tareas de mi pipeline se acomodaron en tres enfoques distintos.

Figura 3: El mismo pipeline aplica tres criterios distintos.
IA con supervisión humana y validación (P1), reglas deterministas sin IA (P2-P3)
y la IA como capa auxiliar acotada (P4). Diagrama conceptual del autor.
  • Primer enfoque - delegar en la IA, pero con supervisión y validación humana. 
Interpretar una imagen es justo lo que un modelo de visión hace bien y una regla determinista hace mal. No voy a escribir un parser para reconocer cajas, flechas y etiquetas escritas a mano alzada en cualquier diagrama posible. Para esa tarea, la IA aporta valor real. 
 
El problema no es usarla, es que un error suyo en este punto es silencioso y se propaga. Si tipifica mal un componente, todo el análisis posterior queda contaminado sin que nadie se entere. Por eso, en este enfoque, la IA trabaja pero no tiene la última palabra, y un humano valida antes de continuar.
  • Segundo enfoque - no usar IA en absoluto. Una vez que tengo el inventario validado, decidir qué categorías STRIDE aplican a un `DataStore`, o qué controles mitigan la amenaza `Spoofing` sobre una entidad externa, ya es un problema resuelto.
Existe una correspondencia conocida y estable entre el tipo de activo y las amenazas que le aplican, y entre cada amenaza y sus controles. Meter un LLM ahí no agregaría capacidad, sino variabilidad donde quiero exactamente lo contrario. Para esto alcanzan reglas fijas, las cuales tienen una propiedad que ningún modelo generativo garantiza, que el mismo input produce siempre el mismo output.
  • Tercer enfoque — la IA como ayudante, no como autor. Existe una tarea final donde la IA vuelve a ser útil pero de forma acotada, que es mejorar la redacción del informe y su lectura. Ahí puede sugerir texto más claro, siempre que no toque los hallazgos técnicos. Redacta, no decide. Eso sí, que no toque los datos no significa que la redacción salga siempre bien, ya que un modelo local puede introducir errores de interpretación al redactar una conclusión sin alterar un solo dato técnico. 
Por eso el enriquecimiento es opcional y siempre queda sujeto a una última lectura humana. La diferencia con P1 es de gravedad, aquí un error se queda en la prosa y un lector atento lo detecta, mientras que allí un error de tipificación se propagaba sin ser percibido en todo el análisis.

Una aclaración importante, porque es fácil sacar la conclusión equivocada. "Delegar sin control" no está mal en general. Hay tareas de bajo riesgo donde el costo de un error es trivial y revisar todo a mano no compensa. La decisión depende del riesgo, no de un principio absoluto. Lo que pasa es que en este caso de uso concreto siempre conviene controlar la extracción, porque el modelo puede equivocarse (y más todavía cuando, por privacidad, uno corre modelos locales más pequeños que los de la nube). Volveré sobre esto al final con un ejemplo que me pasó de verdad.

Y hay un requisito que atraviesa todo lo anterior: la privacidad por diseño. Un diagrama de arquitectura es información sensible. Mandarlo a una API en la nube para que lo analice significa sacarlo de la organización. Por eso, toda la inferencia de la PoC corre en local. Esa restricción es la que vuelve la pregunta del reparto todavía más aguda, porque los modelos locales pequeños son justamente los que más se benefician de esa supervisión humana con validación. 

Veamos cómo se ve esto en la práctica.

El caso de uso, paso a paso

El sistema se organiza en cuatro procesos secuenciales: extracción y validación (P1), identificación de amenazas (P2), recomendación de controles (P3) y generación del informe (P4). El punto de partida es una imagen de un diagrama de flujo de datos (DFD) de cajas y flechas. 

Figura 4: El diagrama de entrada del caso de estudio.
Nótese que el flujo hacia "Centralized Logs" va por HTTP en claro,
mientras que el resto va cifrado (ese detalle va a importar).

Para la evaluación usé un caso representativo: un frontend, dos microservicios, tres almacenes de datos y distintas configuraciones de seguridad de transporte, como se ve en el diagrama de la imagen anterior.

P1 — La IA extrae, el humano valida

Un modelo de visión local analiza el diagrama y devuelve un inventario inicial en formato JSON, es decir, componentes normalizados a una taxonomía acotada (`ExternalEntity`, `Process`, `DataStore`, `UI`, `API Gateway`, `Queue`) y flujos con sus atributos, incluido si el transporte va cifrado o claro.

Esta es la fase más frágil de todo el sistema, y conviene hablar con franqueza sobre el motivo. Los modelos generativos son probabilísticos. Pueden alucinar, devolver el JSON cortado a la mitad cuando la salida es larga, o tipificar un componente de una forma una vez y de otra a la siguiente. Buena parte del desarrollo fue destinada precisamente a domar esa variabilidad.

Por un lado, fijé la generación a `temperature = 0`, con `seed` fijo y muestreo restringido para favorecer la reproducibilidad. Por otro, evité el truncado de la respuesta y monté un mecanismo de reintento en el que, si el JSON no parsea o no valida contra el esquema, lanza un segundo intento de reparación y, si vuelve a fallar, corta con error explícito en vez de seguir con datos corruptos.

Pero ningún ajuste de parámetros elimina del todo la posibilidad de que el modelo se equivoque al interpretar el dibujo. Y aquí está lo que comentaba. En la primera extracción del caso de estudio, el modelo tipificó el `Frontend` como `Process`.

Figura 5: La extracción inicial del modelo de visión.
El `Frontend` aparece como `Process` (no como `UI`),
y el flujo de logs queda correctamente marcado como `Plain`.
El sistema todavía no permite continuar porque falta la validación.

No es un error catastrófico ni una alucinación grosera; es una interpretación razonable que, sin embargo, cambia el análisis porque un `Process` y una `UI` no tienen el mismo conjunto de categorías STRIDE aplicables. Si ese inventario pasara directo a las fases siguientes, generaría un conjunto de amenazas distinto del correcto y nadie lo notaría.

Por eso P1 termina en una instancia de validación humana obligatoria (human-in-the-loop, HITL). El sistema bloquea el acceso a las fases deterministas hasta que el analista revisa el inventario y confirma explícitamente que es correcto. La revisión se hace mediante un chat de comandos estructurados acotado a renombrar componentes y corregir sus tipos, y la confirmación se persiste en el artefacto de trabajo para dejar traza de que la validación ocurrió.

Figura 6: El inventario tras la corrección humana - el `Frontend` ahora es `UI`.
El checkbox de confirmación está marcado y recién entonces se habilita el botón
para continuar. Esa única corrección cambia las amenazas que se van a generar.

Este HITL no es un detalle de usabilidad, es la supervisión humana con validación que hace que tenga sentido usar un modelo generativo en P1. La IA aporta la velocidad de no transcribir el diagrama a mano y el humano aporta la garantía de que el análisis no arranca sobre una premisa equivocada. Ni el modelo solo, ni el humano transcribiendo todo a mano. Cada uno donde rinde.

P2 y P3 — El núcleo determinista, sin una sola línea de IA

Con el inventario validado como "contrato de entrada", arrancan las dos fases que no usan IA.

P2 recorre cada activo del inventario y, según su tipo, determina qué categorías STRIDE aplican mediante un mapeo fijo. Un `ExternalEntity` recibe `Spoofing` y `Repudiation`. Un `Process` recibe las seis categorías. Un `DataStore` recibe `Tampering`, `Repudiation` e `Information Disclosure`. Los flujos reciben `Tampering`, `Information Disclosure` y `Denial of Service`.  Por cada combinación "tipo de activo – amenaza STRIDE" aplicable se genera un escenario de riesgo, y se le estima una severidad combinando probabilidad e impacto en una escala de 1 a 5, con reglas que se apoyan en el tipo de activo y en señales del propio diagrama (por ejemplo, si un flujo va cifrado o en claro). La severidad sale de multiplicar ambos factores y se clasifica por umbrales que van de informativa a crítica.

P3 toma cada escenario priorizado y lo mapea a controles concretos mediante otra correspondencia determinista en la que cada par "tipo de activo – amenaza STRIDE" tiene asociados sus controles del catálogo local, y la severidad gradúa cuántos se recomiendan (más para los críticos, menos para los de baja severidad). Si una combinación no tiene entrada directa, hay un mecanismo de respaldo que también es determinista.

Lo importante no es el detalle de los mapeos, sino que toda esta lógica es conocida, estable y reproducible. No hay nada que "interpretar". Meter un modelo generativo aquí no resolvería ningún problema que las reglas no resuelvan ya, y a cambio reintroduciría justo la variabilidad que tanto trabajo costó sacar de P1. Para el caso de estudio, estas dos fases produjeron 44 escenarios de riesgo y 83 recomendaciones de control a partir de un catálogo de 15 controles únicos, siempre igual ante la misma entrada.

P4 — El informe, y la IA de vuelta, pero atada

La última fase consolida todo en un informe en Markdown con la arquitectura detectada, las amenazas clasificadas y el plan de mitigación. Acá la IA reaparece, pero en su tercer enfoque, como ayudante de redacción opcional. El sistema puede pedirle a un LLM local que mejore la prosa de las descripciones (impacto, mitigación, etcétera) para que el informe se lea mejor, pero con dos límites estrictos. 

Figura 7: El informe final. El inventario validado, las amenazas y los controles
quedan como tablas auditables. Los hallazgos técnicos son inmutables.

Primero, no puede alterar los hallazgos, de modo que el inventario, las amenazas y los controles que vienen del núcleo determinista permanecen intactos. Eso protege los datos, pero no la prosa, ya que el texto enriquecido es lenguaje libre y nada impide que el modelo afirme en una descripción algo que el inventario no dice. Por eso esa capa es prescindible y la versión sin enriquecer del informe sigue siendo la fuente de verdad.

Segundo, se hace amenaza por amenaza en vez de todo de una vez, porque pedirle al modelo que reescriba un bloque grande resultó frágil, y cualquier desvío de formato echaba a perder todo el lote. Si el enriquecimiento de un caso falla, el informe sale con el texto original y la ejecución no se interrumpe. Es la misma filosofía de P1 vista desde otra perspectiva. La IA puede ayudar a redactar, pero no a decidir. La fuente de verdad sigue siendo el inventario validado y los resultados deterministas.

La evidencia: dónde vive la variabilidad

Todo el argumento anterior se puede resumir en una sola tabla, que para mí es el resultado más contundente del trabajo. Ejecuté el pipeline varias veces sobre el mismo diagrama.

Figura 8: Tabla de Repetibilidad y variación controlada
(en las tres ejecuciones o runs: 7 componentes y 6 flujos).
Con la misma entrada y la misma validación humana,
el resultado es idéntico (Run 1 y Run 2). La diferencia
del Run 3 viene exclusivamente de una decisión distinta
en el punto de validación: dejar el `Frontend` como
`Process` en lugar de corregirlo a `UI`.

Las dos primeras ejecuciones son idénticas hasta el último número porque el núcleo determinista no fluctúa. La tercera difiere (47 escenarios en vez de 44, 92 recomendaciones en vez de 83) y la diferencia tiene una sola causa. En esa ejecución no se aplicó la corrección humana y el `Frontend` quedó como `Process`, que arrastra más categorías STRIDE. La variabilidad no aparece dispersa por todo el sistema, sino confinada al punto exacto donde decidí que viviera**, el HITL

Figura 9:  Ejecución de un proceso paso a paso

Esa es la prueba de que el reparto funciona. La parte que debe ser estable, lo es, y la que legítimamente depende del criterio humano está aislada y es trazable. En este vídeo dejo las capturas de una ejecución, una tras otra, como apoyo visual al recorrido descrito arriba.  

Una nota sincera sobre la fragilidad de los modelos

Hay un detalle que prefiero contar antes que esconder porque ilustra mejor que cualquier argumento por qué el HITL no sobra. Al preparar el material de este artículo, meses después de la evaluación original, volví a mirar las ejecuciones y el modelo de visión extraía los componentes de forma algo distinta a como lo había hecho la primera vez y yo no había tocado una sola línea de código. En ese lapso solo había habido actualizaciones de herramientas del entorno. No tengo una explicación cerrada de la causa exacta, y no voy a inventarla.

Pero el fenómeno, sea cual sea su origen, es exactamente la fragilidad que el trabajo documenta como limitación, esto es, que la salida de la fase generativa puede cambiar entre sesiones por motivos que están fuera del control del analista. Y ese es justamente el argumento a favor de no confiar ciegamente en ella. Si el comportamiento del modelo puede derivar con el tiempo aunque tu código sea idéntico, quieres un punto de control humano entre esa salida y todo lo que depende de ella. La fragilidad no es un contratiempo del proyecto, sino la mejor evidencia de por qué se diseñó así.

Qué queda fuera

Esto es una prueba de concepto, con su alcance acotado (aplicaciones web de tres capas, APIs y microservicios ligeros, partiendo de un DFD de cajas y flechas). No pretende ser una herramienta lista para producción. Aquí tienes el TFM completo publicado en Slideshare.

Figura 10:  Modelado de Amenazas Automatizado con Inteligencia Artificial,
Validación Humana y Núcleo Determinista

Quedan muchas líneas abiertas por si a alguien le sirven de punto de partida, como la ampliación de la corrección humana a flujos y atributos, la validación de que la imagen de entrada sea realmente un DFD antes de procesarla, la incorporación de activos y amenazas propios de IA/LLM, o la conexión del sistema a bases de conocimiento (OWASP, NIST) vía RAG para justificar cada control con evidencia documental. El detalle de todo esto está en el TFM.

Conclusión

El modelado de amenazas funcionó aquí como el escenario idóneo para poner a prueba el concepto del reparto. Un mismo proceso puede, y a veces debe, alternar el uso de la IA generativa, es decir, emplearla en un paso, prohibirla en el siguiente y acotarla en el último. La decisión en cada etapa responde a dos preguntas pragmáticas: 
  • ¿qué impacto tiene un error del modelo en esta instancia?
  • ¿Puede resolverse este paso mediante reglas tradicionales?
Este pipeline situó a la IA donde aporta valor, interpretando imágenes bajo validación humana; la excluyó de donde solo hacen falta reglas conocidas, porque ahí solo agregaría ruido; y la incorporó como redactora del informe sin permitirle modificar un solo hallazgo. La tabla de repetibilidad muestra que este reparto se sostiene porque los componentes deterministas producen resultados idénticos en cada ejecución, y la única variabilidad se concentra, deliberadamente, en el punto de validación humana.

En definitiva, no he inventado nada espectacular; no obstante, la lógica de dónde poner cada cosa me parece que trasciende el caso del modelado de amenazas y por eso vale la pena insistir en ella.

Autor: Matias Daniel Ades


Referencias

Las referencias completas están en el TFM. Estas son las que más sostienen las ideas de este artículo.
  • I. Elsharef, Z. Zeng y Z. Gu, *Facilitating Threat Modeling by Leveraging Large Language Models*, Workshop on AI Systems with Confidential Computing (AISCC), 2024.
  • S. Berger et al., *Efficient and Extensible Security Analysis with Enhanced Data Flow Diagrams*, Proc. ESSoS, 2016.
  • Microsoft, *Microsoft Threat Modeling Tool* (documentación técnica), 2022.
  • OWASP, *Threat Dragon Documentation*.
  • AWS, Accelerate threat modeling with generative AI (AWS Threat Designer), 2025.
  • A. Crossman et al., *Auspex: Building Threat Modeling Tradecraft into an Artificial Intelligence-based Copilot, arXiv:2503.09586, 2025.
  • E. Bandara et al., *ASTRIDE: A Security Threat Modeling Platform for Agentic-AI Applications*, arXiv:2512.04785, 2025.
  • R. Troncoso, *Módulo 6. Seguridad de Aplicaciones y Desarrollo Seguro*, Máster en IA Aplicada a la Ciberseguridad, ENIIT & UCAM, 2025.
  • S. Bai et al., *Qwen2.5-VL Technical Report*, arXiv:2502.13923, 2025.

miércoles, julio 01, 2026

La velocidad mató al impostor

Seguro que conoces el Síndrome del Impostor. Esa sensación de llegar a un sitio nuevo y sentir que todos son más listos que tú, están más preparados que tú que te hace sentir como si no supieras nada, como si te hubieras colado sin estar preparado, como si fueras un impostor pretendiendo ser el profesional o la persona que ellos creen que tú eres y que es el motivo por el que te han contratado. Si no has sentido nunca el síndrome del impostor, entonces tienes otra patología que deberías tratarte. 

Figura 1: La velocidad mató al impostor

Lo cierto es que este síndrome se da por la necesidad de querer demostrar que estas listo para lo que tengas que hacer desde el primer día, cuando con la experiencia todos sabemos que esto no es posible y que todo el mundo necesita un periodo de adaptación al nuevo entorno, las nuevas herramientas, la nueva forma de trabajo. Pero sobre todo, porque siempre hay algo que tienes que aprender que aún no sabes que tienes que aprender.

Con la llegada de la IA, el síndrome del impostor ha perdido fuerza por imposibilidad de sostenerse sobre sus fundamentos y premisas iniciales. Y es que la avalancha de conocimientos, tecnologías, y paradigmas nuevos con los que nos toca trabajar cada día en nuestras jornadas laborales es tan grande que no tiene sentido intentar justificar que no se sabe algo.

En una de mis últimas charlas, un profesional de larga experiencia laboral en el mundo de la ciberseguridad, hablando del impacto de la Inteligencia Artificial en la gestión de la Ciberseguridad, en mita de la conversación, me dijo algo que se me quedó grabado:

"Chema, por primera vez en mi vida no me da vergüenza reconocer que no tengo ni idea de todo esto que nos estás contando."

Por supuesto que tendría idea de lo que estábamos hablando, pero entiendo que, como todos, no al nivel al que estábamos acostumbrados tiempo atrás, donde teníamos versiones Alpha, Beta, Release Canditate 1, Release Candidate 2, Pre-Release... ¿donde está todo aquello? Durante el tiempo en que teníamos acceso a una versión alfa, y luego llegaba la versión 1.0, teníamos la oportunidad de probar y aprender a manejar las tecnologías, de tal forma que cuando estaba en producción ya lo conocíamos. 

Hoy, en ese mismo periodo de tiempo, la tecnología ha sido lanzada, evolucionada y "deprecada", en pro de una nueva versión, una nueva tecnología, o un nuevo paradigma. Un año y medio ha pasado desde la llegada de los modelos de DeepReasoning, menos desde que aparecieron los MCPs, y un año desde que empezamos a hablar de Skills, y ya estamos con problemas de Threat Modeling para Agentic AI, y un Internet Agéntico que ha cambiado el paradigma tecnológico de todas las empresas.

Yo ya no pienso en algoritmos de orquestación a bajo nivel, pienso en orquestación, depuración y gestión de Agentes. Ya no hablamos de fortificación, sino de Guardarraíles, Harnesses y Scaffolding para seguridad. Hablamos de Token Exhaustion, de Destilación de conocimiento o de nuevos ataques ataques de Agentes con Possion Memory. Y solo ha pasado un año y medio desde que comenzó toda esta locura maravillosa de los agentes. 

Por el camino, hemos tenido la disrupción laboral, los cambios de roles, el "reshaping" de los organigramas y "blueprints" en las empresas, y los cambios en la manera de trabajar. Donde hablamos de los Agentes AI que gestionas y las X que multiplicas. Un mudo curioso que ha crecido en todo el mundo en el mismo periodo que pasó desde que Microsoft puso la primera versión de Longhorn y llego la versión 1.0 de Windows Vista. Curioso.

Y es por esto que, la velocidad a la que va este mundo profesional nuestro, ha hecho que el síndrome del impostor de los profesionales haya pasado a un segundo plano. La preocupación de los profesionales es más el AI Anxiety, el Token ranking o el 10x que te dan tus Agentes AI. Y por el camino, ni un segundo que peder en el Síndrome del Impostor, que si lo tienes, no puedes preguntar a los compañeros.. ¿Qué es esto? ¿Cómo has hechos eso? ¿Qué estás haciendo tú? ¿Me ayudas con esto?

¡Saludos Malignos!

Autor: Chema Alonso (Contactar con Chema Alonso)  


martes, junio 30, 2026

Eu estudo português, mas não o falo tão bem (ni hindi)

Desde que me comencé a trabajar en Portugal decidí comenzar a estudiar Portugués, como entretenimiento, usando Duolingo. Tengo muchas cosas que contar sobre esta aplicación, porque realmente es un entretenimiento bueno que te ayuda a aprender la lengua, sí, pero se enfoca demasiado en algoritmos de engagement que van contra el aprendizaje y hace que se pierda algo de foco. Pero no va de eso de lo que quería hablaros, sino de la traducción de vídeos.

Figura 1: Eu estudo Português, mas não o falo tão bem (ni hindi)

El domingo, como estaba trabajando, decidí hacer un pequeño vídeo para TikTok y Reels sobre los artículos que he estado dedicándole a los Asistentes AI basados en LLM, para avisar un poco de sus riesgos. Al final, he sacado tres artículos con tres asistentes diferentes, pero con unos ratitos nada más, he podido localizar varias decenas de ellos con similares resultados.
Así que, para que la gente fuera consciente de eso, hice este vídeo que podéis ver en mi cuenta de Instagram publicado, donde recojo en un minuto lo que he querido trasmitiros en los tres artículos que os he publicado.


Los artículos, por si aún no los has leído - que deberías - os los dejo aquí mismo, así que antes de seguir con este artículo, céntrate en leerlos.
Cuando hice el vídeo, en mi Foro Público de El lado del mal en MyPublicInbox, María Gómez Prieto, nos compartió cómo Instagram para Android estaba traduciendo mi vídeo a varios idiomas, y haciendo - si os fijáis con detalle -, el Lip Syncing automáticamente, y me ilusión ver lo bien que podría hablar Portugués.

Figura 4: Auto Translate con LipSync

En mi versión de Instagram para iPhone no he visto esta función todavía, pero me alegra que ya esté usando estas características para los productos masivos. Tal vez ya las conocíais todos vosotros, pero si no, que lo sepas. Ahí me tienes hablando en varios idiomas perfectamente.

¡Saludos Malignos!

Autor: Chema Alonso (Contactar con Chema Alonso)  


Entrada destacada

Hacking IA: Jailbreak, Prompt Injection, Hallucinations & Unalignment. Nuestro nuevo libro en 0xWord

Pocas veces me ha hecho tanta ilusión que saliera un nuevo libro en 0xWord como con este libro de " Hacking IA: Jailbreak, Prompt Inje...

Entradas populares