Mostrando entradas con la etiqueta MachineLearning. Mostrar todas las entradas
Mostrando entradas con la etiqueta MachineLearning. Mostrar todas las entradas

viernes, octubre 10, 2025

Ataque Mic-E-Mouse: Cómo pueden escuchar lo que dices delante de tu ordenador transformando tu ratón óptico en un micrófono usando Machine Learning

Hoy os quiero hablar de un paper que me ha llamado mucho la atención, pues aparte de ser una "Idea Loca" de verdad, la verdad es que es súper hacker y mola todo. Se trata de convertir el ratón óptico con el que haces clic a los iconos en tu escritorio, en un micrófono para grabar las cosas que dices delante de él. A priori suena a locura, pero el trabajo es minucioso e ingenioso, y merece la pena prestarle atención.

El paper en concreto se llama "Invisible Ears at Your Fingertips: Acoustic Eavesdropping via Mouse Sensors" y está disponible para que lo puedas descargar y analizar en detalle.
Como podrás ver en el artículo que te acabo de dejar enlazado en la imagen anterior, los investigadores trabajan con la idea de que la estructura de un Mouse es muy similar a la estructura de un Micrófono, tal y como describen en la siguiente imagen.

Como se puede ver, la fuente de audio que afecta al diafragma de un micrófono, afecta de igual forma a la superficie que vibra cuando se mueve el ratón y que genera el cambio en el sensor óptico. Cambia que el análisis de ese cambio de luces en el ratón se transforma en una señal digital de desplazamiento, mientras que en un micrófono es una señal de audio de Hi-Fi. A partir de este punto, el resto inicialmente es trabajo para los Makers y amantes del Hardware Hacking.

Figura 4: Libros para Makers en 0xWord que deberías tener:

El esquema que presenta el ataque es el que se ve en la imagen siguiente. La voz de una persona genera una vibración en el ratón óptico que se transforma en micro incrementos en el desplazamiento del ratón, tan pequeños que son despreciados por el sistema operativo en movimientos reales, pero la señal llega hasta el driver del ratón.
A partir de ese momento, si un atacante es capaz de conseguir acceder a esa señal del ratón enviada al software del ratón, que se usa entre otras cosas para calibrar la sensibilidad del ratón, el atacante puede procesar la señal con técnicas de Machine Learning para reconstruir la señal de audio que generó los micro-movimientos, y con un modelo entrenado, reconocer patrones de palabras que han sido dichas. 

Figura 6: Libro de Machine Learning aplicado a Ciberseguridad de
Carmen TorranoFran Ramírez, Paloma Recuero, José Torres y Santiago Hernández

El proceso de este ataque, al que han llamado Mic-e-Mouse es muy ingenioso, ya que primero aprovechan para hacer una detección de la señal de ruido de fondo, calibrando durante un tiempo cuáles son las señales que hay que quitar, usando un Filtro de Wiener, y luego pudiendo separar la señal a capturar con el mensaje de voz que se quiere reconocer. Cada uno de los sensores óptico son distintos, y traen defectos diferentes, por lo que es necesario hacer esa calibración con el Filtro de Wiener para asegurar el funcionamiento del sistema.

Después, el ratón transforma los cambios en en el sensor óptico con Transformadas de Furier que ayudan a precisar los cambios en los sensores a lo largo del tiempo, en movimientos, que después son pasados por un filtro en el firmware del ratón en una señal de incrementos de movimiento a lo largo del tiempo, de la posición X y la posición Y, que es enviado al equipo, tal y como se ve en la imagen siguiente.


Esas señales se pueden conseguir del software del ratón sin necesidad de tener que instalar un driver en el sistema operativo, ya que los ratones de alta precisión permiten acceder a las señales de movimiento que generan a aplicaciones, y por tanto se puede procesar para otros propósitos más allá de mover el cursor del ratón.
Estos datos de incrementos de tiempo, X e Y pueden acabar en bases de datos en servidores de juegos, servidores web o de telemetría, y cualquiera que tenga acceso a ellos puede procesarlos para extraer los impactos de las voces en ellos, Por supuesto, no es trivial, ya que las señales de voz generan diferentes incrementos en función del ángulo de impacto de la onda de audio generada, como explica este gráfico.

Pero en cualquier caso, probando las diferentes posibilidades, se puede procesar la señal. En la imagen siguiente hay cuatro gráficas que explican bien el proceso. Como se puede ver en la primera gráfica a) hay tres señales capturadas. La señal amarilla es la señal de color amarilla es la que se puede calcular como  señal ruido gracias a la calibración inicial, la señal verde es la capturada y generada con la captura del sensor del ratón (en base a los datos de incrementos), mientras que la señal azul es la señal real de la voz emitida al lado del ratón, y hay una clara correlación entre ambas.


En la gráfica b) se ven tres tipos de señales auditivas sintéticas fijas, en dos tonos diferentes fijos y uno incremental, que generan un espectrograma de señal de audio como se ve en la gráfica c). Y la última, es una señal de audio capturada por el sensor con una frase en un entorno ruidoso, que es lo que hay que procesar. Como se ve en la imagen a) y c) las correlaciones son claras, y si existen esas correlaciones, se puede entrenar un algoritmo de Machine Learning para reconocer los audios.

Habiendo comprobado esto, la PoC de Mic-E-Mouse se hizo con cuatro ratones ópticos del alta sensibilidad, para estudiar los resultados en diferentes entornos. Estos ratones se configuraron en el entorno que tenéis arriba, para recoger datos. Con el objetivo de hacer las pruebas mejor, veis que se ha construido una caja de aislamiento sobre la que poner el ratón óptico, para poder ejecutar el ataque en un "escenario ideal", poder medir bien las señales de ruido, y sacar conclusiones sobre las que extrapolar un ataque real.

La última parte del ataque, es aplicar Reconstrucción de la Señal de Audio con Speech Reconstruction Models y el Reconocimiento de Palabras (y dígitos) usando Speech Keyword Classification Models Machine Learning, y para esto se usan dos algoritmos diferentes. El primero intenta reconstruir la onda de audio con una arquitectura similar a la que utiliza OpenAI Whisper a partir de los incrementos temporales de X e Y usando un Neural Filter. Y el resultado es una reconstrucción de un espectrograma de audio más que válido con el proceso completo.
Entrenado el modelo y probado con diferentes datasets que contienen dígitos, palabras y frases en inglés, el resultado es más que prometedor, con unos ratios de hasta más del 60% en algún dataset. Pero claro, estos resultados varían mucho dependiendo de la superficie donde esté el ratón, el tipo de ratón óptico, el ruido de ambiente, el volumen de la voz, la frecuencia de pooling the ratón, etcetera.
Por supuesto, este ataque de Mic-E-Mouse hoy parece difícil de automatizar masivamente y con éxito, pero lo que demuestra este estudio es que, a medida que aumenta la precisión de los ratones ópticos, que aumenta la frecuencia de pooling, y que aumentan la calidad de los algoritmos de Machine Learning, esto es un ataque más que posible, si no para grabar toda la conversación, para reconocer palabras, números, fechas, etcétera. 
Un ataque de side-channel similar a los ataques Tempest que tanto me gustan, y que también se han visto favorecidos con el avance de la Inteligencia Artificial, como vimos con Deep-Tempest. Si te interesa la IA y la Ciberseguridad, tienes en este enlace todos los postspapers y charlas que he escrito, citado o impartido sobre este tema: +300 referencias a papers, posts y talks de Hacking & Security con Inteligencia Artificial.

¡Saludos Malignos!

Autor: Chema Alonso (Contactar con Chema Alonso)  


jueves, septiembre 05, 2024

Códigos Antiguos, Algoritmos Modernos: Cómo la IA Rescata Papiros de la Antigua Roma de hace 2000 años

El impacto de la Inteligencia Artificial (IA) en ayudar a descifrar la Historia no es algo nuevo, pero igualmente no deja de sorprendernos. Ya hablamos en este artículo sobre cómo se descifraron las cartas de María I de Escocia y hoy queremos contaros otro gran hito, esta vez incluso más complejo aún, donde se han podido recuperar y descifrar unos papiros romanos, en concreto los papiros de Herculano
Por cierto, esto no es más que un ejemplo más de caso de uso de la Inteligencia Artificial, para resolver problemas complejos que no parecían tener solución, y que además es otro caso de uso de seguridad de la información, porque se trata de proteger la pérdida de ella. Este libro de Machine Learning aplicado a Ciberseguridad te ayuda a adentrarte a cómo usar la IA dentro de este otro campo.


Figura 2: Libro de Machine Learning aplicado a Ciberseguridad de
Carmen TorranoFran Ramírez, Paloma Recuero, José Torres y Santiago Hernández

Volviendo al caso de uso de la recuperación de los papiros, la extrema fragilidad de estos rollos carbonizados ha impedido su lectura completa durante muchos años. Los primeros intentos de desenrollarlos físicamente en el siglo XVIII resultaron en la destrucción de muchos ejemplares. Y es justo aquí donde la Inteligencia Artificial entra en juego, ofreciendo una nueva esperanza para descifrar estos textos sin llegar a dañarlos físicamente (esto es la clave). Pero vamos a aprender un poco más sobre estos papiros y cómo ha sido su proceso de recuperación.

La importancia de los papiros de Herculano

Los papiros de Herculano son una ventana única al pensamiento y la cultura del mundo grecorromano, ofreciendo una conexión directa con el Siglo I d.C. A diferencia de muchos textos antiguos conocidos a través de copias medievales, estos rollos son documentos originales, directos de la época y de incalculable valor histórico.

La mayoría de los textos descifrados hasta ahora son obras del filósofo epicúreo Filodemo de Gádara, lo que ha llevado a especular que la villa pudo haber pertenecido a Lucio Calpurnio Pisón Cesonino, suegro de Julio César y mecenas de Filodemo, subrayando así la importancia potencial de los textos aún sin descifrar.


El potencial de estos papiros para ampliar nuestro conocimiento del mundo antiguo es realmente importante. Prometen revelar obras filosóficas perdidas, como escritos originales de Epicuro y sus discípulos, información histórica detallada sobre la vida, la política y la sociedad romana del Siglo I. También nos puede mostrar avances significativos en filología, incluyendo nuevos conocimientos sobre el griego y el latín antiguos. En definitiva, puede mostrarnos valiosas perspectivas culturales sobre la literatura, el arte y las creencias de la época.

La complejidad de la preservación y lectura de pergaminos antiguos

Los papiros de Herculano, carbonizados por la erupción del Vesubio en el 79 d.C., ya hemos mencionado que presentan un gran desafío en su preservación y lectura. Su extrema fragilidad, sensibilidad a cambios ambientales y el deterioro progresivo hacen que cualquier manipulación física sea altamente peligrosa para su integridad.

La carbonización ha oscurecido tanto el papiro como la tinta, dificultando enormemente la distinción entre ambos. Los métodos tradicionales como el desenrollado mecánico, los dibujos y calcos, la fotografía multispectral y la tomografía computarizada han demostrado ser limitados o potencialmente dañinos.


Estas limitaciones han creado la necesidad de nuevos enfoques para acceder al contenido de los rollos sin destruirlos. Y es aquí donde la Inteligencia Artificial aparece como una solución prometedora. El uso de IA, con su capacidad para procesar grandes cantidades de datos y detectar patrones sutiles, ofrece el potencial de mejorar significativamente la calidad de las imágenes, distinguir entre tinta y papiro carbonizado con mayor precisión, automatizar el proceso de "desenrollado virtual" y reconstruir texto fragmentario con predicciones. Estas capacidades están revolucionando nuestra habilidad para acceder a estos tesoros históricos sin comprometer su integridad física.

La IA aplicada a los pergaminos de Herculano

Las tecnologías de Inteligencia Artificial aplicadas a Los papiros de Herculano se centran principalmente en el aprendizaje automático y la visión por ordenador. Las Redes Neuronales Convolucionales (CNN) son fundamentales en este proceso, ya que son especialmente eficaces en el reconocimiento y clasificación de imágenes.

Estas redes analizan las imágenes de los papiros carbonizados píxel por píxel, aprendiendo a distinguir entre la tinta y el fondo del papiro. Este enfoque "pointillista", como lo describe el Dr. Brent Seales, permite identificar regiones de tinta en los rollos cerrados con una precisión sin precedentes.


Además de las CNN, los modelos Transformers juegan un papel crucial en el procesamiento del texto una vez identificado. Estos modelos, conocidos por su capacidad para manejar secuencias largas y capturar contexto, son ideales para restaurar y atribuir textos antiguos.

Por ejemplo, el Modelo Ithaca, basado en Transformers, ha demostrado una precisión del 62% en la restauración de textos dañados, superando significativamente a los métodos tradicionales. Estas tecnologías de Inteligencia Artificial no solo permiten leer lo que está escrito en los papiros, sino que también pueden predecir el contenido de secciones dañadas o faltantes, basándose en patrones aprendidos de otros textos antiguos.

El Vesuvius Challenge: Un esfuerzo colaborativo con detalles técnicos
 
El Vesuvius Challenge, lanzado en marzo de 2023, es una iniciativa de ciencia ciudadana que busca descifrar Los papiros de Herculano utilizando técnicas de Inteligencia Artificial. El desafío emplea un enfoque de "desenrollado virtual" basado en imágenes de Tomografía Computarizada (TC) de alta resolución.
Estas imágenes se procesan utilizando una arquitectura de Red Neuronal Profunda, específicamente una U-Net modificada, que ha sido entrenada para detectar la presencia de tinta en cada vóxel (un píxel tridimensional) de la imagen de Tomografía Computerizada

La red utiliza Capas Convolucionales para extraer características a múltiples escalas, seguidas de capas de upsampling (el upsampling en CNN aumenta la resolución de los datos para recuperar detalles perdidos) para producir un mapa de probabilidad de tinta de alta resolución. Este proceso se realiza en pequeños sub-volúmenes, permitiendo un análisis detallado de cada sección del papiro.


Figura 7: Desenrrollado virtual de los papiros

Una vez que la red identifica las regiones de tinta, se aplican algoritmos de segmentación para separar las capas individuales del papiro enrollado. Aquí es donde entra en juego el Aprendizaje por refuerzo profundo (Reinforcement Learning): un agente de IA, entrenado mediante técnicas de Q-learning, navega por el volumen 3D del papiro, tomando decisiones sobre cómo "desenrollar" virtualmente el manuscrito. Este agente utiliza una función de recompensa que maximiza la legibilidad del texto mientras minimiza la distorsión de la estructura del papiro.

Paralelamente, se emplean modelos de lenguaje basados en Transformers, como GPT, para ayudar en la reconstrucción de texto parcial o dañado. Estos modelos han sido afinados (fine-tuned) con corpus de textos griegos antiguos para mejorar su precisión en este contexto específico. El Vesuvius Challenge ha logrado avances significativos, incluyendo la identificación de la primera palabra ("púrpura") en uno de los papiros sin abrir en octubre de 2023, demostrando el potencial de este enfoque colaborativo y tecnológico.

La gran importancia de la IA para el estudio de textos antiguos

Las implicaciones de la aplicación de la inteligencia artificial al estudio de textos antiguos van mucho más allá de Los papiros de Herculano. Esta tecnología está transformando fundamentalmente el campo de la filología y la arqueología textual. La capacidad de la Inteligencia Artificial para procesar y analizar grandes volúmenes de datos está acelerando drásticamente el ritmo de los descubrimientos, permitiendo a los investigadores abordar corpus enteros de textos en fracciones del tiempo que antes requerían.
Por otro lado, la precisión y sensibilidad de los algoritmos de IA están revelando detalles que antes eran imperceptibles para el ojo humano, desde trazos de tinta apenas visibles hasta patrones lingüísticos sutiles. Esto no solo está permitiendo la recuperación de textos perdidos, sino que también está proporcionando nuevas perspectivas sobre la evolución de las lenguas y las culturas antiguas.

Más allá de la mera recuperación de textos, la IA está abriendo nuevas vías de investigación interdisciplinaria. Los modelos de lenguaje entrenados en textos antiguos pueden ayudar a los historiadores a identificar influencias y conexiones entre diferentes culturas y períodos históricos. Las técnicas de análisis de redes, aplicadas a corpus de textos antiguos, pueden revelar patrones de difusión de ideas y conocimientos en el mundo antiguo.
Además, la capacidad de la IA para procesar y comparar rápidamente múltiples versiones de un texto está revolucionando los estudios, permitiendo una comprensión más profunda de cómo los textos antiguos se transmitieron y evolucionaron a lo largo del tiempo. A medida que estas tecnologías continúan desarrollándose, prometen recuperar textos perdidos, y también proporcionar una comprensión mayor de las civilizaciones antiguas, potencialmente reescribiendo capítulos enteros de nuestra historia cultural. Y esto es solo el principio.

Happy Hacking Hackers!!! 

Autor: Fran Ramírez, es investigador de seguridad y miembro del equipo de Ideas Locas en CDO en Telefónica, co-autor del libro "Microhistorias: Anécdotas y Curiosidades de la historia de la informática (y los hackers)", del libro "Docker: SecDevOps", también de "Machine Learning aplicado a la Ciberseguridad” además del blog CyberHades. Puedes contactar con Fran Ramirez en MyPublicInbox.

 Contactar con Fran Ramírez en MyPublicInbox

Entrada destacada

Hacking IA: Jailbreak, Prompt Injection, Hallucinations & Unalignment. Nuestro nuevo libro en 0xWord

Pocas veces me ha hecho tanta ilusión que saliera un nuevo libro en 0xWord como con este libro de " Hacking IA: Jailbreak, Prompt Inje...

Entradas populares