lunes, septiembre 29, 2008

Metadatos en Microsoft Office (IV de V)
por Enrique Rando y Chema Alonso

***************************************************************************************
Artículo publicado en Windows TI Magazine nº 135 Septiembre de 2008
- Metadatos en Microsoft Office (I de V)
- Metadatos en Microsoft Office (II de V)
- Metadatos en Microsoft Office (III de V)
- Metadatos en Microsoft Office (IV de V)
- Metadatos en Microsoft Office (V de V)
***************************************************************************************

Metadatos Ocultos

Hasta este momento se han revisado metadatos e información fácilmente accesible, y en ocasiones modificable, por el usuario que hace uso de un paquete de Microsoft Office. Sin embargo, existe también otra información, que, según las diferentes versiones de los formatos de documento, se almacena de forma oculta dentro de los archivos.

Son metadatos, sí, pero metadatos internos de los que hace uso el propio paquete de Microsoft Office. Y a veces revelan datos sensibles que pueden perjudicar al publicador del documento. Así, podemos encontrar una lista de valores que identifican la versión de software utilizada en la creación del documento, el autor que creó el archivo, la fecha de creación, el número de revisiones que se han realizado, el último usuario en modificar el documento, la última vez que se imprimió el archivo, el tiempo total que se ha estado trabajando con ese documento, información sobre el tamaño del documento y hasta un identificador único del archivo que se creaba en los documentos generados en algunas versiones de Microsoft Office que utiliza información del equipo para ser generado y que podría ser usado para seguir un documento hasta el equipo desde el que fue creado.

Imagen 11: Metadatos extraídos con Libextractor de un doc Word97


Imagen 12: Direcciones de correo ocultas en un documento Office97

No todos estos valores están presentes en todos los formatos de archivo y su aparición en un documento depende tanto de la versión del formato de archivo utilizado como de la versión de la herramienta que se está utilizando. Así, un documento creado con una versión antigua puede tener todos estos metadatos y sólo se modifican algunos de ellos cuando se edita el archivo con una versión más moderna.

Toda esta información va a poder permitir obtener rutas a servidores internos de la organización, nombres de usuario, quién creó el documento y si éste fue posteriormente modificado o no, quién lo modificó, desde dónde, etc. Información que puede ser muy sensible, como la historia nos ha enseñado.

En algunos casos también pueden obtenerse datos de conexiones a bases de datos. En la imagen siguiente aparece una consulta SELECT, los nombres de los drivers ODBC usados, del servidor de base de datos, de la base de datos y de la cuenta de acceso… Y también la contraseña:

Imagen 13: Información sobre conexión a base de datos en un documento de Word

El texto, para mayor claridad, es:

SELECT pruebas_0.apellidos, pruebas_0.nombre, pruebas_0.tlf FROM
pruebasmetadata.pruebas pruebas_0
DATABASE=pruebasmetadata
DRIVER={MySQL ODBC 3.51 Driver} OPTION=0
PWD=PassMETADATA
PORT=0 SERVER=servidor
UID=UsuarioMETADATA


Para encontrar esta información basta con utilizar cualquier editor hexadecimal o bien utilizar una de las múltiples herramientas que existen para realizar esta tarea.

LibExtractor, Doc Scrubber, Metagoofil, Metadata Extraction Tool

Existen muchas herramientas para trabajar con los metadatos. Sencillas y potentes herramientas como LibExtractor o con un interfaz más depurado como Doc Scrubber o Metadata Extraction Tool o incluso herramientas pensadas para los auditores de seguridad como Metagoofil, que integra la búsqueda de archivos a través del sitio web de la compañía con la extracción de información sensible de los documentos. Al final, toda la información oculta queda fácilmente descubierta hoy en día.

Imagen 14: Metadata Extractor

***************************************************************************************
Artículo publicado en Windows TI Magazine nº 135 Septiembre de 2008
- Metadatos en Microsoft Office (I de V)
- Metadatos en Microsoft Office (II de V)
- Metadatos en Microsoft Office (III de V)
- Metadatos en Microsoft Office (IV de V)
- Metadatos en Microsoft Office (V de V)
***************************************************************************************

5 comentarios:

  1. Muy buena serie de artículos. Estoy disfrutando como un enano.

    ResponderEliminar
  2. Microsoft tiene un complemento gratis para eliminar los datos ocultos en:
    http://www.microsoft.com/downloads/details.aspx?FamilyID=144e54ed-d43e-42ca-bc7b-5446d34e5360&displaylang=es

    saludos
    Jorge Escudero
    Buenos Aires
    Argentina

    ResponderEliminar
  3. Si, muy interesante toda esta serie de artículos de metadatos.

    Y habrá que probar ese complemento oficial también.

    Saludos.

    ResponderEliminar
  4. La solución a estos problemas existe desde hace mucho más tiempo que las herramientas que "dicen" eliminar todos los metadatos.

    Simple y sencillamente: "Imprimir como PDF".

    ResponderEliminar
  5. @Netvicious, no sabes lo que acabas de decir. Toda la info queda en el pdf también y además añade cosas suyas... Ya hablaremos del PDF más adelante..

    Saludos!

    ResponderEliminar