Captchas Cognitivos para Humanos y "Richie Robots" con muchos Tokens de IA
Usar Captchas Cognitivos para detectar Humanos o Bots ya hace tiempo que empieza a no ser real. La cuestión que dirime no es ya entre un bot y un humano. Ni mucho menos. La cuestión que resuelve el uso de Captchas Cognitivos es el consumo de glucosa en el cerebro de los humanos o el consumo de Tokens de modelos de IA. Y ya.
Esto hace que no podamos decir eso de "I am not a robot", sino "I am a robot or a robot with tokens de IA", porque como vemos, con los MM-LLMs es muy fácil saltarse todos los Captchas Cognitivos que les tiremos por delante. De esto se habla en el libro de "Hacking y Pentesting con Inteligencia Artificial" que os publicamos hace unos meses.
Y por supuesto, en todos estos artículos que ya os ido publicando por aquí, y que deberías leerte si quieres ver funcionando la IA para saltarse los Captchas Cognitivos, como vamos a ver hoy, donde tenemos uno nuevo no visto hasta ahora.
- Hacking Google reCaptcha with Google Voice Recognition... and Google Chrome in a Google ChromeBook
- Captcha Cognitivo de Twitter (X) con GPT4-Vision & Gemini
- Captcha Cognitivo de Twitter (X) con Anthropic Claude 3.0 Opus
- Captcha Cognitivo de Twitter (X) con GPT-4o
- Captcha Cognitivo de Administración Pública con ChatGPT
- Captcha Cognitivo de la mano y la plancha en HBO max
- Captcha Story X: I am not a Robot, I am a GenAI Multimodal Agent
- Reto hacking con un Captcha Cognitivo para romper con GenAI
- Solución al Reto de Hacking de un Captcha Cognitivo Visual
- Anthropic Claude 3.5 Sonnet & Cognitive Captchas
- LinkedIN + ChatGPT: El Captcha Cognitivo del Objeto Descolocado
- Captcha Cognitivo de Twitter / X de Sentar Personas Correctamente: Probando con ChatGPT & Gemini
- Cómo resolver los Captchas Cognitivos Visuales y Auditivos de GitHub con Gemini (o cualquier MM-LLM) sin despeinarte
- Captchas Cognitivos: Más fácil con IA que con ojos
- Agentic Internet y Captchas Cognitivos con MM-LLMs
- El Captcha Cognitivo de TikTok al estilo de "The Secret of the Monkey Island" que resuelve la Inteligencia Artificial
La creación de nuevos Captchas Cognitivos sirve para que puntualmente un conjunto de bots se paren, pero no creo que tenga un impacto grande. Mirad este caso, donde un nuevo Captcha Cognitivo en Twitter - llámalo X si prefieres -, me pide contar piedras.
En este caso, hay una pregunta, un modificador, y una imagen. Después, las dos opciones son a) la imagen responde correctamente a la pregunta, con lo que hay que pulsar el botón de "Submit", o no responde a la pregunta, por lo que hay que pulsar el botón de la flecha "A la derecha".
En el primer caso había que pulsar "derecha" en el segundo ejemplo hay que pulsar "Submit". Así de de sencillo. Así que, para automatizarlo fácilmente, decidí dividir la imagen en dos, y hacer la pregunta más genérica posible, usando las capacidades de visión artificial para reconocer el modificador de la izquierda, al que llamé "question"
Y a la parte de la derecha, donde se muestra la imagen de las rocas, que en este caso las llamé Answer, que no me iba a complicar demasiado teniendo tokens de IA para gastar.
A partir de ese momento, el proceso de automatizar la ruptura de este Captcha Cognitivo es enviarle los dos ficheros y preguntar si dada la Question, la Answer es correcta, y el resultado que me da Gemini es el que os esperáis.
Como podéis ver, Google Gemini se merienda este reto cognitivo en segundos, así que no hay mucha barrera para los bots con poner estos Captchas Cognitivos.
El reto, al final, es lo que hemos hablado, los Tokens de acceso a estos modelos, el cómputo de los mismos, la energía que gastan, etcétera, pero no la capacidad cognitiva. Es más un tema de costes que de capacidad cognitiva.
Aquí le mandamos un Captcha Cognitivo con la posición correcta, y como podéis ver lo acierta perfectamente. Así que habría que pulsar al botón de "Submit". Todo claro y cien por cien automatizable para resolverlo cuando se precise.
Como ya vimos en su momento, se puede apificar, convertir la respuesta en un sólo carácter 1 o 0, y reducir el número de tokens en razonamiento. Pero también se pueden hacer estos procesos con modelos OpenSource corriendo en máquinas en local.
escrito por Chema Alonso con la colaboración de Pablo González, Fran Ramírez, Amador Aparicio, Manuel S. Lemos y José Palanco en 0xWord
El mundo de la Inteligencia Artificial ha cambiado drásticamente el mundo de la ciberseguridad, del hacking, del pentesting, de la ciberinteligencia, del exploiting, y por supuesto del mundo del Hardening. Y esto cada día va a ser más impactante.
¡Saludos Malignos!
Autor: Chema Alonso (Contactar con Chema Alonso)





DragonJAR
8.8 Chile
Ekoparty
e-Hack MX
AREA 51
Comunidad Dojo Panamá
ARPAHE SOLUTIONS 















