jueves, septiembre 18, 2008

Metadatos en Microsoft Office (I de V)
por Enrique Rando y Chema Alonso

***************************************************************************************
Artículo publicado en Windows TI Magazine nº 135 Septiembre de 2008
- Metadatos en Microsoft Office (I de V)
- Metadatos en Microsoft Office (II de V)
- Metadatos en Microsoft Office (III de V)
- Metadatos en Microsoft Office (IV de V)
- Metadatos en Microsoft Office (V de V)
***************************************************************************************

Hace unos años, las portadas de los periódicos hablaban sobre la guerra de Irak y contaban como no aparecían por ningún lado las famosas “armas de destrucción masiva”. La historia al margen de la Historia tuvo una vertiente técnica, curiosa para nosotros… y nada divertida para Tony Blair, por culpa de un documento Office con información que demostraba que había sido manipulado. La culpa de todo la tuvieron los metadatos.

Metadatos

Un metadato es información relativa a un documento, tales como el autor, el programa utilizado o la catalogación que el usuario ha hecho del mismo. En un típico entorno colaborativo, como el que disfrutamos en una empresa o en un organismo público, estos datos son de gran utilidad y permiten coordinar las tareas de elaboración, edición y localización de los documentos.

Los metadatos existen para enriquecer la información que proporciona el documento. Así es común que las cámaras fotográficas o los programas de tratamiento de imágenes digitales almacenen en los metadatos información del modelo de la cámara, la hora realización de la fotografía o el programa utilizado para su tratamiento utilizando los formatos de metadatos EXIF o XMP de IPTC, por ejemplo.

Son muchas las aplicaciones almacenan metadatos junto con los documentos, ya sean estos archivos de audio, video, textos, presentaciones, bases de datos u hojas de cálculo. Entre ellas, por supuesto, se cuentan las aplicaciones que forman parte del paquete Microsoft Office.

Volviendo a nuestro caso, en febrero de 2003, el gabinete de Tony Blair publicó en Internet un documento sobre la infraestructura militar de Irak. Y lo hizo en formato Word… Y alguien se tomó la molestia de analizarlo y estudiar los metadatos que el fichero DOC contenía [Microsoft Word bytes Tony Blair in the butt].

El examen demostró que el documento había sido manipulado. Se pudo extraer la información de las personas que lo habían manipulado, en qué fecha se había hecho y desde qué ordenador.

La moraleja de esta historia es que los metadatos, si bien son útiles para la elaboración y edición de documentos, pueden terminar convirtiéndose en una fuente de información de riesgo que un atacante puede utilizar en tu contra. Debemos controlar los metadatos de los documentos que publicamos. Y para ello es importante conocer que tipos de datos se almacenan en un documento cuando éste se genera o modifica.

Versiones de Microsoft Office

Si bien, como se indicó anteriormente, los documentos de Microsoft Office no son los únicos que guardan metadatos, en este artículo vamos a centrarnos exclusivamente en ellos. Como es sabido, existen múltiples versiones de Microsoft Office, que van desde aquella que funcionaba en Windows 3.1, pasando por el Microsoft Office 95, Microsoft Office 97, Microsoft Office 2000, Microsoft Office XP, Microsoft Office 2003 y Microsoft Office 2007. Cada versión de Office ha ido acompañada de un formato de documento más o menos mejorado, con más o menos novedades y, como es de suponer, con más o menos cambios en su almacenamiento, uso y comportamiento.

Es normal que un documento generado con el formato de Microsoft Word 97 .doc que almacenara nuevas características no fuera igual que el formato .doc que se generaba con la versión e Microsoft Word 95. Dependiendo de la versión del documento y el paquete de software va a haber una información almacenada u otra.

Información almacenada

Pero volvamos a lo que nos ocupa. ¿Qué información se guarda en un documento de Microsoft Office? La información puede ser mucha y muy variada y hay que tenerla en cuenta antes de que el documento sea puesto en un repositorio público o enviado por correo electrónico. En los siguientes apartados vamos a ir analizando los puntos clave de la información almacenada.

Propiedades del Software

Durante el proceso de instalación de Microsoft Office aparece un cuadro de dialogo en el que se solicita información acerca del usuario que va a utilizar este software. Esta información va a ser añadida por defecto a todos los documentos creados mediante ese software por ese usuario.

Imagen 1: Información de Usuario en Word 2003

En entornos multiusuario es habitual que un mismo producto sea utilizado por varias cuentas de usuario distintas en un mismo ordenador. A cada uno de estos usuarios, la primera vez que use Office, le aparecerá un cuadro de diálogo para rellenar esta información. Y los valores que introduzca figurarán en todos los documentos que dicho usuario cree a partir de ese momento.

Imagen 2: Otro usuario utiliza por primera vez Office en el mismo equipo

Esta información debe ser evaluada por el usuario para saber si supone un riesgo o no. Hay que tener en cuenta que el valor por defecto para el campo “Nombre” es el identificador de la cuenta del usuario. Si este dato es aceptado por el usuario y los metadatos del documento no son modificados, entonces todos los archivos van a distribuir el nombre del usuario del sistema.

***************************************************************************************
Artículo publicado en Windows TI Magazine nº 135 Septiembre de 2008
- Metadatos en Microsoft Office (I de V)
- Metadatos en Microsoft Office (II de V)
- Metadatos en Microsoft Office (III de V)
- Metadatos en Microsoft Office (IV de V)
- Metadatos en Microsoft Office (V de V)
***************************************************************************************

12 comentarios:

Anónimo dijo...

Muy interesante el tema. Las imágenes no se ven.
¿Ya está publicado el solucionario del último reto hacking, los captchas?
Un saludo.

Chema Alonso dijo...

@an0nim0, las imagenes deberían verse, yo las veo. Aun no está el solucionario, avisaré ;)

Saludos!

Christian Martorella dijo...

Este tema es muy interesante desde el punto de vista de seguridad, hace tiempo he desarrollado una herramienta que dado un dominio específico, descargara todos los documentos públicos y posteriormente obtuviera la información interesante como puede ser Nombre de usuarios, Paths y Mac Address.... pueden ver la página de la herramienta aquí:
http://www.edge-security.com/metagoofil.php

También hay una presentación en:
http://www.edge-security.com/docs/IG-FIST-s21sec.pdf

Saludos

Chema Alonso dijo...

@Christian Martorella,

Hola! La herramienta la hemos puesto en el artículo y hablamos de ella en las sesiones de footprinting.

Muchas Gracias!

Anónimo dijo...

Pues anda que no me habré reido yo viendole el careto a algunos que tapan su cara con un rectangulo del paint...

Asfasfos dijo...

Un documento muy interesante y un tema que la verdad nunca había pensado en el, habrá que empezar a estudiar los metadatos :)

Anónimo dijo...

"¿Qué información se guarda en un documento de Microsoft Office?"

¿Acaso tú puedes saber al 100% TODA la información que se almacena en un binario de office (más allá de lo que te cuenten) si está elaborado con un software cerrado? En fin... más de lo mismo...

Chema Alonso dijo...

@anónimo, que sí hombre, que sí, que el formato está disponible para todos. Pero claro, si vamos a la teoría de Ken Thompson, nada vale...Reflections on Trusting Trust

Anónimo dijo...

@Maligno: Me encanta la parte que dice: "You can't trust code that you did not totally create yourself. (Especially code from companies that employ people like me)"

Qué tío más cachondo, eso sí, tiene razón en todo, todo depende de la fiabilidad que le des a las cosas, igual que en los informativos o en los libros de historia, nunca podrás estar totalmente seguro de si te mienten o no... Pero eso es entrar en el terreno de la conspiranoya...

Anónimo dijo...

datos datos necesito más datos!!! Oye y vas a publicar la charla que vas a dar sobre esto en la reunión de sw libre de Malaga??

S2!!

Anónimo dijo...

@maligno:
Me encanta esa forma de pensar tan objetiva... Las cosas son porque son.

@tayoken:
No se si es conspiranoia, pero el creer que una empresa como MS no tiene acuerdos con las agencias de seguridad nacional, y no pensar que estos se pasan por el forro la privacidad de la gente (como no hay otra forma), es como el que todavía piensa que las armas de irak no se encuentran porque están enterradas muy profundas.

Unknown dijo...

hola chema me gusto mucho esta primera parte espero poder aprender todo sobre los metadatos y nada solo queria agradecerte por tu libro esta super bueno y espero con ansias los videos de youtube, un saludo y me da gusto seguir tus pasos...

Entrada destacada

10 maneras de sacarle el jugo a tu cuenta de @MyPublicInbox si eres un Perfil Público

Cuando doy una charla a algún amigo, conocido, o a un grupo de personas que quieren conocer MyPublicInbox , siempre se acaban sorprendiendo ...

Entradas populares