miércoles, diciembre 17, 2008

WordPerfect Metadata

Durante los tres últimos meses hemos estado trabajando con los metadatos en documentos ofimáticos. Esto nos llevó a publicar el artículo de Metadatos en documentos Spectra Office en Windows TI Magazine, el artículo de Metadatos e información oculta en documentos Open Office que publicamos en la PCWorld, a construir el OOMetaExtractor para limpiar documentos OpenOffice y a crear la FOCA, pero... cuanto más jugamos con esto más divertido es.

El último formato con el que hemos estado jugando ha sido el formato WPD. Sí, a lo mejor a algunos no os suena, pero hubo un tiempo en el que una pantalla azul en modo texto gobernaba el mundo de las suites offimaticas. Una herramienta conocida como WordPerfect fue el procesador de textos por excelencia.

Yo nunca fui amante de WordPerfect y reconozco que llegué a usarlo en su justa medida porque mi vida con los procesadores de texto empezó en Write Assistant, WordStar y Lotus AmiPro hasta que terminé en los brazos de WinWord.

Los documentos que se generaban con WordPerfect no forzaban una extensión en aquellos tiempos, así que era común que no mucha gente reconociera WPD como la extensión de documenos generados como WordPerfect, pero en versiones siguientes, con soporte para Windows y con la posterior compra por parte de Corel se empezó a estandarizar el uso de WPD.

A día de hoy, con la batalla ODF, OOXML lejos está WordPerfect de ser una herramienta usada masivamente, pero sin embargo, quedan aun muchos documentos generados con estos procesadores de texto (en este país una barbaridad) y por eso sigue siendo reconocido como formato por todos los procesadores de texto.

Buscando en Google el número de documentos que hay con extensión WPD aparece la nada desdeñable cantidad de 150.000 documentos publicados. La pregunta era ¿tendrán metadatos o información oculta esos ficheros?.


Documentos wpd en Google

Como libextractor no da soporte para estos ficheros a día de hoy me he bajado unos trescientos documentos y he ido abriendolos para ver que encontraba y... ¡qué sorpresa! El 90% de ellos contienen información de usuarios e impresoras.


Usuarios y Rutas

Algunas en formato UNC para dejar al descubierto nombres de servidores y recursos commpartidos


Imprsoras en formato UNC

Y otros te dan la información del software de creación.


Versión de software

Vamos a tener que hacer que nuestra FOCA coma ficheros de versiones antiguas porque puede ser muy divertido lo que aparece en estos tipos de documentos....

Saludos Malignos!

7 comentarios:

  1. igual es una obviedad, pero lo preguntaré de todas maneras, por si acaso... ¡que no se me enfade nadie!

    ¿incorporará FOCA alguna opción para poner un umbral que limite la fecha mínima que debería tener un documento analizado? lo digo por no extraer la topología de red de una oficina de hace 10 años, o por mezclar datos actuales con antiguos...

    saludos!

    ResponderEliminar
  2. Hola Miguel,

    ahora lo que hace es ordenar los docs por fecha y dejarte elegir que docs quieres para extraer datos.

    ResponderEliminar
  3. jeje, osea que has creado una FOCA paleontóloga..

    ResponderEliminar
  4. Últimamente hablas poco de seguridad en navegadores. ¿Por qué no haces una comparativa de "troneras" actuales de IE7, Firefox y Chrome?

    ResponderEliminar
  5. joder!! y yo que pensaba que nos hablarias hoy de porque MS ha vuelto a romper su ciclo habitual de parches para solventar el problema de IE 1,2,3,4,5,6,7,¿8? :S

    ResponderEliminar
  6. ¡Buenas!

    La verdad es que resulta más que interesante el tema. Sigo tus entradas sobre los metadatos en documentos con asiduidad, y el tema de Wordperfect me ha sorprendido. ¿Qué ocurrirá con los documentos de WordStar, mucho menos difundido que el anterior, pero que también tuvo sus momentos de gloria? ¿Y con el magnífico Write Assistant con el que yo también me inicié en el mundillo de los procesadores de texto? :D

    ¡Saludos!

    ResponderEliminar
  7. Madredediossss!! WordStar... que tiempos!! A mi me pillo demasiado canijo pero llegue a usarlo. Y fue la aplicacion que me obligo a aprender Ctrl+C, +v, +x, seleccion de texto con shift y mil teclas mas de funcion. A partir de ahi el raton casi solo lo use para el Wolfenstein 3D jejeje
    Viejas glorias que cayeron en el olvido.
    Me uno a la mocion para que se hable un poquito de la ultima vulnerabilidad de IE, por saber un poquito mas de ella. Nada personal XD

    ResponderEliminar