viernes, diciembre 20, 2024
martes, febrero 06, 2024
Inteligencia Artificial para ayudar en la Discapacidad Visual
Hace pocos años que surgieron las primeras versiones de DALL-E basados en modelos de difusión y GPT, que ya en aquel momento dejaron ojipláticos a los expertos en la materia. En ese momento, la sociedad todavía no era consciente del mundo de posibilidades que se abría ante sus ojos. Y hasta día de hoy, todos estos avances parecen imparables. Sin embargo, por muchas facilidades que nos ofrezca la Inteligencia Artificial en nuestro día a día, siempre existen minorías olvidadas en dicho avance.
Tengo la suerte de llevar unos meses bastante metido en el proyecto y en todo el funcionamiento de la aplicación, para poder decir que la aplicación está destinada a las personas con discapacidad visual parcial o total. Esto cobra mucho más sentido cuando pensamos en aquellos usuarios que adquirieron la discapacidad visual crecidos y debieron aprender a interactuar nuevamente con el entorno. Así nace AIDEN, utilizando los últimos avances tecnológicos en visión por computadora para permitirles explorar el mundo que les rodea.
A menudo, las personas con discapacidad visual se enfrentan a obstáculos cotidianos por la forma en la que el mundo ha sido diseñado. ¿Cómo pueden saber si se les ha olvidado la vitrocerámica encendida, o qué modo del horno está asociado a cada posición? Por supuesto, las empresas mil-millonarias, con el soporte de las grandes tecnológicas, tienen el potencial para llegar a crear modelos más competentes. Salvo por tres particulares:
- Necesidad de monetizar cualquier producto.
- Falta de enfoque en este colectivo.
- Incapacidad de ofrecer transparencia con los datos de los usuarios.
- ¿Queremos que empresas tecnologícas tenga fotografías privadas de nuestro día a día?
- ¿Superarán los filtros legales de los países europeos?
¿Alguna vez os habéis preguntado cómo hacen las personas invidentes para usar un smartphone? ¿O manejarse por una página web? ¿Pensáis que generalmente están adaptas a estos usuarios? AIDEN incorpora los últimos modelos de Visión Artificial para cada tarea especifica, combinados ofrecen al usuario la mejor experiencia de usuario. Permitiendo cuatro opciones fundamentales:
- Describir los elementos del entorno.
- Preguntar al entorno.
- Lectura de texto.
- Lector de código de barras y QR instantáneos.
Para el desarrollo de la app, se ha jugado con muchas tecnologías hasta encontrar el mejor resultado, uno de los modelos más novedosos que se ha incorporado es el V* que aplica LLMs a la Visión Artificial y así brinda excelentes resultados. Grosso modo, con V estrella logramos localizar los píxeles de la imagen en los que la Inteligencia Artificial debe centrar su atención, con el objetivo de obtener la mejor respuesta en el menor tiempo posible.
Incluso los colores que se pueden apreciar en los botones de la aplicación, o el margen entre los mismos, han sido seleccionados con cuidado para mejorar la accesibilidad y facilitar el uso del asistente del móvil. La utilización de colores lejanos en la escala cromática facilita a ciertos usuarios con ceguera parcial diferenciar los botones.
El proyecto se encuentra en las últimas etapas de desarrollo, y aunque ya dispongamos de un producto mínimo viable, nos enfrentamos a cuestiones muy complejas que requieren tiempo y que estemos por detrás un equipo excelente de doctores e ingenieros del que tengo la suerte de formar parte.
AIDEN es el primer paso en la dirección correcta, la de un mundo más accesible gracias a la tecnología. Imaginemos en pocos meses el potencial que puede tener una aplicación como AIDEN junto con las Ray-Ban Smart Glasses, en las que el usuario ya no requiera ni interactuar con el smartphone.
La aplicación tiene previsto abrir sus puertas el segundo trimestre del año, tanto para Android como para iOS, y aunque todavía estamos discutiendo si estaremos ante una versión beta abierta o privada, todo parece marchar sobre ruedas. Además, estamos súper ilusionados por que se haya interesado RTVE para contar esta historia y compartir el trasfondo social de la aplicación.
¡Saludos!
Publicado por
Chema Alonso
a las
5:45 a. m.
0
comentarios
Etiquetas: AI, Cognitive Intelligence, Cognitive Services, DeepLearning, GenAI, IA, innovación, Inteligencia Artificial, Universidad
lunes, septiembre 11, 2023
Detectar Voces Clonadas en DeepFakes usando Machine Learning
Tienes todos los CodeTalks en esta web, desde los últimos publicados hasta el acceso a las cinco temporadas anteriores, pero vamos a comentar uno a uno los que tenemos publicados para que sepas un poco mejor el contenido de estos:
Temas y Proyectos de Ideas Locas
Pues estos son los CodeTalks que tenemos publicados hechos en 2023. Cada mes seguiremos publicando un episodio de estos CodeTalks para mantenerte al día en estos temas tan importantes dentro de la tecnología, y encantados de que nos propongáis ideas locas, proyectos o temas que tocar.
![]() |
Contactar con Fran Ramírez en MyPublicInbox |
Publicado por
Chema Alonso
a las
8:42 a. m.
0
comentarios
Etiquetas: 2FA, AI, Alexa, Artificial Intelligence, biometría, Cognitive Intelligence, Cognitive Services, Deep Learning, DeepFakes, Generative-AI, Hacking, IA, Identidad, Inteligencia Artificial, Machine Learning, WhatsApp
sábado, mayo 06, 2023
Ángel o Demonio: El debate sobre la I.A. en Horizonte T3x116 @navedelmisterio
Ya vimos que en la industria militar hay preocupación como vimos con REAIM, al igual que lo hay con los modelos de Generative-AI usando Stable Diffusion que son entrenados con datos con derechos de autor y generan tantos problemas a la hora de valorar si las obras derivadas generadas con modelos de difusión son ( o no ) como cuando una canción copia unos acordes de otros o no - recordad el famoso caso del rapero y el uso de parte de la melodía de "Every breath you take" que tiene que pagar 5.000 USD al día por copiar esos acordes.
Tomaos este pequeño debate como un anticipo para OpenExpo Europe 2023, que tendrá lugar el 18 de Mayo de este año, y donde estaremos hablando Iker Jiménez, Ángel Niño, Cristina Aranda y yo mismo de estos temas. Por si te interesa tanto, para la edición de este programa sacamos un código descuento que es "HORIZONTE1" y que deja el coste de la entrada a OpenExpo Europe 2023 a solo 1 €.
Publicado por
Chema Alonso
a las
11:02 a. m.
0
comentarios
Etiquetas: AI, Artificial Intelligence, ChatGPT, Cognitive Intelligence, Cognitive Services, DeepLearning, IA, Inteligencia Artificial, LLM, Machine Learning
lunes, marzo 20, 2023
"Are You Talkin' ta me?" DeepFake Voice en Español & Detección de Voces Clonadas
![]() |
Figura 51: Libro de Machine Learning aplicado a Ciberseguridad de Carmen Torrano, Fran Ramírez, Paloma Recuero, José Torres y Santiago Hernández. |
Publicado por
Chema Alonso
a las
11:16 a. m.
0
comentarios
Etiquetas: 2FA, AI, Alexa, Artificial Intelligence, biometría, Cognitive Intelligence, Cognitive Services, Deep Learning, DeepFakes, Generative-AI, Hacking, IA, Identidad, Inteligencia Artificial, Machine Learning, WhatsApp
miércoles, marzo 15, 2023
"Are You Talkin' ta me?" Hacking Voice Biometry with DeepFake of Voice
![]() |
Figura 43: Libro de Machine Learning aplicado a Ciberseguridad de Carmen Torrano, Fran Ramírez, Paloma Recuero, José Torres y Santiago Hernández. |
Publicado por
Chema Alonso
a las
6:11 a. m.
0
comentarios
Etiquetas: 2FA, AI, Alexa, Amazon, Artificial Intelligence, biometría, Cognitive Intelligence, Cognitive Services, Deep Learning, DeepFakes, Hacking, IA, Identidad, Inteligencia Artificial, Machine Learning, WhatsApp
martes, marzo 14, 2023
"Are You Talkin' ta me?" Speaker Recognition & Doxing
- Construir el Data Lake de Audios Taggeados.
- Si en un audio salen varias personas hacer la Diarization
- Tener un modelo de IA para compara voces.
- Hacer una búsqueda en el Big Data de Audios comparando muestras automáticamente.
![]() |
Figura 31: Libros de Python para Pentesters y Hacking con Python de Daniel Echeverri publicados en 0xWord. |
Publicado por
Chema Alonso
a las
6:01 a. m.
0
comentarios
Etiquetas: AI, Alexa, Amazon, Artificial Intelligence, biometría, ChatGPT, Cognitive Intelligence, Cognitive Services, Deep Learning, DeepFakes, doxing, Google, IA, Inteligencia Artificial, LLM, Machine Learning, WhatsApp
Entrada destacada
+300 referencias a papers, posts y talks de Hacking & Security con Inteligencia Artificial
Hace un mes comencé a recuperar en un post mi interés en los últimos años, donde he publicado muchos artículos en este blog , y he dejado mu...

Entradas populares
-
Circula por la red un truco que llegó a mí de casualidad , donde se explica cómo conseguir ver más de una vez - e incluso capturar - las fot...
-
Ayer publiqué un post que tiene ver con las opciones de privacidad de Facebook asociadas a los correos electrónicos , y mañana sacaré la se...
-
Las técnicas de OSINT son aquellas que te permiten buscar información en fuentes abiertas. O lo que es lo mismo, sacar datos de plataformas...
-
Hoy os traigo una " microhistoria " peculiar que tiene que ver con la historia de la tecnología. Es una historia de esas que empie...
-
Hace mucho tiempo, cuando se creo el " Modo Incógnito " de los navegadores, que algunos llamaron también " Modo Privado ...
-
Dentro de una investigación de una fotografía, tal vez te interese saber dónde está hecha, o a qué hora se hizo. Cualquiera de esas dos info...
-
Conseguir la contraseña de Facebook de una cuenta es una de las peticiones más usuales que se suele recibir de la gente que busca solucion...
-
Una de las opciones que se puede configurar a nivel de hipervínculo, de documento o de servidor web en los navegadores es el funcionamiento...
-
El SEPE (Servicio Público de Empleo Estatal) ha sido víctima de la archiconocida crisis del COVID-19 enlazando la avalancha de expedientes...
-
La app de mensajería instantánea Telegram tiene muchos fans por el atributo de seguridad que ha querido potenciar desde el principio, per...