sábado, enero 23, 2021

El reto de las DeepFakes en el "Area 51 de Chema Alonso"

Baloncesto, viajar e Inteligencia Artificial. Estos son mis tres hobbies. Mi nombre es Bruno Ibáñez López y soy el nuevo integrante del departamento de Ideas Locas o, como a mí me gusta llamarlo: el “Área 51 de Chema Alonso”. Dado que mi especialidad no es la ciberseguridad, creo que será mejor que cuente un poco mi perfil académico y profesional para que sepáis por qué estoy por aquí.

Figura 1: El reto de las DeepFakes en el "Area 51 de Chema Alonso"

Mi pasión por la inteligencia artificial empezó en tercero de carrera, y no me voy a esconder, seguirá siéndolo durante bastante tiempo. Gracias a las Becas Balsells, tuve la oportunidad de realizar el Trabajo de Final de Grado sobre IA en la Universidad de Colorado, haciendo un estudio de las redes GAN y los ataques adversarios en NLP. Al volver de Estados Unidos, trabajé en Sadako Technologies un año, empresa de inteligencia artificial para la detección de residuos con robots y visión por computadora. Como no se debe poner límite al aprendizaje, decidí seguir formándome en otras ramas de IA.

Ya como alumno de la UC3M en el Máster en Ciencias y Tecnologías, recibí una noticia: Ideas Locas presentaba un Challenge para la detección de FakeNews y DeepFakes. Los DeepFakes, cómo bien sabréis, son ese contenido audiovisual que se modifica mediante IA de forma superrealista. Aunque los cibercriminales tienen multitudud de fines para la creación de DeepFakes, me centré en los que considero más importantes o peligrosos:

1) Lucrarse de personajes famosos chantajeándolos o publicando vídeos pornográficos falsos. Muchos de los DeepFakes en el año 2019 son vídeos pornográficos, y es un problema que se tiene que abordar.

2) Debilitar la reputación de una persona (político, famoso, ejecutivo de una empresa, etcétera) para desautorizarla con Fake News usando vídeos de DeepFakes para dar más veracidad a la falsedad (vídeo de senadora americana Pelosi). Estos vídeos pueden causar estragos en futuras elecciones, manipulando el voto popular. Podría llevar a perjuicios en sus carreras en caso de no poder demostrar la falsedad del vídeo.

3) Intentar desestabilizar estados, mercados financieros y/o relaciones internacionales con vídeos falsos de personas de autoridad (políticos, científicos…). En estos vídeos se intenta que se viralicen por redes sociales mensajes de miedo, racistas, homofóbicos… (ejemplo de vídeo DeepFake de Obama). 
 

Figura 3: DeepFake de Barack Obama

Aunque estos videos tienen distintas temáticas, tienen rasgos en común: la persona “atacada” suele ser famosa, por lo que se tienen muchos datos de ella, y es fácilmente reconocible en el vídeo, para que el público en general no dude de su identidad. El 25 de octubre se entregaban todas las solicitudes del reto, por lo que empecé a estudiar el estado del arte de los DeepFakes, ejemplos, tutoriales, etcétera. Hice una investigación bastante completa para entender cómo se generaban, qué problemas tenían y qué se había intentado ya en la detección de DeepFakesSe me ocurrieron dos ideas:

- La primera: generar un repositorio de vídeos verídicos (No-Fake Repository), basado en IA y Blockchain. Pensé una forma optimizada de generar resúmenes de vídeos y una búsqueda por similitudes. Después, a partir de redes convolucionales, se compararía el nuevo vídeo con los similares de la base de datos, para ver si se han modificado los frames o el audio.

- La segunda: diseñar una consecución de algoritmos de visión por computador (GAN, Image Classification y Object Detection) para la generación de un meta-detector de regiones características de un DeepFake. Con esta solución (Focused DeepFake Detection), se podría calcular la probabilidad de que un frame sea fake o no a partir de las probabilidades de que contenga regiones fake.

Unas semanas más tarde recibí un correo por parte de Telefónica: mis dos propuestas eran finalistas. Mi reto era doble, ya que tenía que profundizar en ambas soluciones en el mismo periodo de tiempo. Llegó la primera reunión. Allí conocí a Pablo González y Fran Ramírez del equipo de Ideas Locas. Me comentaron que intentara detallar aún más mis dos soluciones, investigando sobre qué algoritmos y repositorios específicos utilizaría en cada uno de los pasos, además de qué arquitectura de Blockchain, cifrado y firma en la propuesta No-Fake Repository.


Figura 4: Mi DeepFake con Chema Alonso

En noviembre, investigué cada una de las propuestas, definí qué Neural Networks utilizaría para cada paso, asistí a webinars de BlockChain, abordé a expertos en Hyperledger Fabric para preguntar mis dudas sobre esa topología… Básicamente, me empapé de los proyectos para poder definir cada uno de los pasos que tenía que seguir. De pe a pa. Esta expresión me encanta.


Y llegó el día de las presentaciones, con muchas ideas en la cabeza y poco tiempo. Abordé la presentación con ilusión, donde además de los dos proyectos mencionados, también presentaba cómo se podrían juntar en una solución conjunta, mezclándolas en distintos pasos para poder erradicar con todo tipo de DeepFake. Dado que sabía que si perdía, lo quería hacer siendo yo mismo, escogí un repositorio de DeepFakes y realicé el mío propio escogiendo un personaje famoso al azar:

En el Telefónica Innovation Day, Focused DeepFake Detection resultó ser la ganadora del reto. Es curioso: estuve a punto de no presentar esa propuesta. Se me ocurrió durante el desayuno el mismo día de la fecha límite, y tuve que apresurarme para escribir el documento detallado. Salió de una conversación con mi compañera de piso, que trabaja en el mundo de la producción audiovisual. Mientras veíamos juntos ejemplos de DeepFakes, me dijo que no sería capaz de detectar si una imagen era DeepFake o no, pero viendo la real y la generada por IA, veía sustanciales diferencias. De ahí, la bombilla.


Figura 6: La amenaza de las Fake News en el Innovation Day

De esta experiencia he sacado dos conclusiones:

- Tenía que arriesgarme y ser persistente. Estuve desarrollando las dos ideas mientras estudiaba el Máster y empezaba como Investigador en la UC3M. Las dudas son naturales, pero se debe confiar en uno mismo.

- Tengo que apuntarme todas las ideas que me vienen a la cabeza y elaborarlas. El proceso de la innovación es siempre complejo y no sabes cuando tendrás una idea. Ahora que las escribo… tengo miedo de que me roben las notas del móvil.

Un reto o una hackathon no deja de ser una oportunidad para presentar conocimientos y darse a conocer. Ganar o no, ya no depende de uno, por lo que no debe ser el termómetro del éxito o fracaso. Aprender y disfrutar durante el proceso, sí debe serlo. Me gustaría contaros más sobre el proyecto ganador… Pero ahora ya forma parte del “Área 51 de Chema Alonso”. No lo dudéis, si sale otro concurso, ¡Apuntaoos!  Y si queréis discutir ideas locas o hacer un brainstorming improvisado, podéis contactar conmigo. 

¡Saludos!

No hay comentarios:

Entrada destacada

ESET te consigue 100 Tempos de MyPublicInbox para consultar con los expertos de seguridad informática @eset_es @mypublicinbox1

La compañía de seguridad ESET , especializada en soluciones de seguridad personal y empresarial, ha puesto activa una campaña de concienciac...

Entradas populares