jueves, octubre 20, 2016

¿Quieres saber cómo piensa Facebook que eres y qué te gusta?

Hoy en día estamos ante una era en la que la sociedad y el ser humano viven en una constante automatización. La tecnología avanza rápido y nos encontramos en un instante en el que las máquinas pueden aprender, inferir comportamientos de seres humanos y, en definitiva, producir juicios basados en datos. Cada día que pasa, las sistemas inteligentes toman más decisiones por nosotros que van desde la publicidad que nos ponen, hasta conducir nuestro vehículo, pasando por llamar a un técnico para solicitar una reparación.

Figura 1: ¿Quieres saber cómo piensa Facebook que eres y qué te gusta?

De todos ellos, los que se focalizan en darnos servicio necesitan aprender lo máximo de nosotros para alimentar sus algoritmos de Machine Learning. Desde el recomendador de películas de Netflix, hasta los asistentes virtuales como Google Now o Cortana. Todos ellos van haciendo un perfil nuestro en base a los datos que van capturando. Pero... ¿qué perfil se hacen de nosotros?. Esta pregunta común entre las personas que intentamos conocer cómo funcionan estos algoritmos.

El caso de Facebook es un caso muy particular que tiene un interés especial, ya que es para muchos el principal método de socialización. Es cómo un individuo se muestra públicamente ante amigos, conocidos, presentes, pasados y/o futuros. Es la imagen social de muchos millones de personas en el mundo pero... ¿te has parado a pensar cómo será esa imagen para el algoritmo de Facebook? Esto es lo que se intenta responder con esta herramienta.

¿Qué sabe Facebook de mí?

La gente de ProPublica ha liberado una extensión para Google Chrome que permite recoger las categorías que Facebook tiene sobre su perfil. La extensión se basa en un proceso de análisis de tu cuenta para recopilar la información de las categorías que Facebook está utilizando en sus algoritmos para clasificarte, sobre gustos e intereses.

Figura 2: What Facebook Thinks You Like

Facebook tiene un conjunto grande de usuarios, con más de mil cuatrocientos millones cuentas. Cada vez que un usuario de Facebook indica que le gusta un mensaje, etiqueta una fotografía o actualiza sus películas favoritas en su perfil, Facebook lo registra. Cuando un usuario navega por la web, Facebook recopila información sobre las páginas visitadas que contienen el botón de compartir. Cuando se utiliza Instagram o Whatsapp, los cuales son propiedad de Facebook, se están aportando más datos al expediente que la empresa tiene de cada usuario. Con todas esas interacciones se hace tu perfil y categorización.

Según la gente de ProPublica, en caso de que estas acciones no sean suficientes, Facebook también realiza compra de datos a empresas que aporta información que pueden ser interesante, como por ejemplo las hipotecas de sus usuarios, la propiedad de automóviles o los hábitos de compras. Esto se hace a través de los grandes Data Brokers o de acuerdos puntuales. Muchos pueden preguntarse, Facebook utiliza todos estos datos para ofrecer a los vendedores la oportunidad de orientar los anuncios a grupos específicos de personas con una mayor granularidad.

En otras palabras, si Facebook consigue clasificar a los usuarios en grupos o categorías de forma exhaustiva, mayor será la probabilidad de que el impacto de la publicidad sobre el usuario tenga mayor éxito porque se ha definido mejor el colectivo en el que se ha incluido a cada usuario. Con este granularidad, las  herramientas para contratar la publicidad de forma dirigida en la red social permiten seleccionar grupos de objetivos en los que se seleccione, por ejemplo, usuarios menos de 25 años, que les guste viajar y que no tengan grandes recursos económicos, que podrían ser un público objetivo para empresas de viajes low-cost.

Con la extensión de ProPublica se puede ver lo que Facebook cree que sabe de ti. Lo que la extensión recopila es la misma información que la compañía ofrece a sus usuarios en la sección de Ad Preferences o preferencias de anuncios. Lo que no queda claro aún, pero muchos pueden intuir, es si esto es todo lo que Facebook sabe de uno o, realmente, conoce mucho más datos que no están disponibles.

Figura 3: Categorías de intereses para anunciantes

Como puede verse, Facebook clasifica los intereses de una persona en diferentes categorías. Esta misma información que ellos proporcionan a cada usuario en su apartado de AdPreferences es la que se utiliza para dirigir la publicidad. También, se informa de qué anunciantes han visitado la información del contacto.

ProPublica plantea un esquema para intentar averiguar si lo que dice Facebook que sabe sobre los usuarios son realmente las categorías en que debería estar un usuario. Este experimento solicita información a los usuarios, a través de un proceso de encuesta para saber si realmente tienen esos intereses en los que están catalogados o no. Puedes inscribirte en el experimento y, al finalizar el proyecto, se enviará un e-mail con los resultados de todo esto.

Figura4: ¿Tienes estos intereseses? ¡¡¡No mientas!!!!


Nosotros hemos estado haciendo una pequeña prueba de cómo Facebook ha ido recopilando la información y qué sabía de una cuenta ficticia creada. Analizando las 14 categorías de nuestra pequeña prueba podemos ver algunas cosas de interés:
• El usuario es clasificado en dicha categoría porque instaló una aplicación. Es el ejemplo de Canva, aplicación en Facebook. Se asume que te gusta o interesa, ya que has mostrado cierto interés instalándolo.
• El usuario es clasificado en dicha categoría porque directamente ha indicado que le gusta una página relacionada con un tema.
• El usuario es clasificado en dicha categoría porque Facebook recopila información desde el propio perfil. Por ejemplo, si exponemos que somos estudiantes, nos clasifica y seríamos un target concreto para publicidad.
• El usuario es clasificado en dicha categoría porque Facebook ha inferido qué tipo de actividad realizar en el sitio.
• El usuario es clasificado en algún tipo de gusto o categoría, debido a qué software utiliza de forma externa, es el caso del navegador.
El propio Facebook, intentando ser transparente, proporciona información sobre qué utiliza para llegar al público adecuado. El apartado de categorías de socios puede llamar mucho la atención de los usuarios. Según algunos informes, Facebook dispone de más de 1.300 categorías o formas de clasificarte, por lo que la segmentación en este campo es enorme.

Figura: Categorías para la clasificación

En definitiva, el objetivo que esta extensión persigue es ver si lo que Facebook dice que sabe de un usuario coincide con las categorías de anuncios que, posteriormente, vende. Para intentar conocer más cómo funciona el negocio de los datos en estas grandes empresas de Internet hoy en día.  Si te interesa este tema, debes leerte los artículos de "Cómo Twitter saber cuáles son los cereales que desayunas" o "Cuánto valen tus datos de Facebook".

Autor: Pablo González Pérez (@pablogonzalezpe)
Escritor de los libros "Metasploit para Pentesters", "Ethical Hacking", "Got Root" y “Pentesting con Powershell

Entrada destacada

Infraestructuras Críticas y Sistemas Industriales: Auditorías de Seguridad y Fortificación de @0xWord

Desde hoy está disponible a la venta un nuevo libro de 0xWord centrado en la seguridad de los Sistemas Industriales y las Infraestructuras...

Entradas populares