sábado, 27 de octubre de 2012

Metadatos. Una fuente de información desconocida

Introducción 

Gracias al uso descuidado de Microsoft Word, hoy ya es posible conocer algunos entresijos de la Autoridad Provisional de la Coalición que (des)gobernó Iraq tras la invasión del país por tropas estadounidenses y de sus aliados.
Al parecer, los funcionarios de dicho organismo no conocían los metadatos que Word incluye en los documentos y sus peligrosos "efectos colaterales", lo que ha permitido acceder a información que refleja la incompetencia de las fuerzas de ocupación.

Podemos ver en este enlace mas detalle:  http://www.computerbytesman.com/privacy/blair.htm



Pero... ¿Que son los metadatos?.

Según la wikipedia los metadatos son datos que guardan información sobre otros datos. En el caso aplicado a los documentos son datos que almacenan información sobre el propio documento: datos del creador, fecha del creación, historial de modificaciones, etc.

La existencia de metadatos no tiene que ser un problema si el usuario normal los puede controlar y verificar de forma transparente.

Pero cuando la creación y manejo de los metadatos es opaca para los usuarios los metadatos se pueden convertir en un problema.

Como conocer y modificar los metadatos.

Es contradictorio que tomemos todas la precauciones del mundo al escribir un documento para no dar más información que la estrictamente necesaria  y por otro lado estamos mandando información sin ser consciente de ello.

La NSA tiene publicado un documento al respecto, donde explica en detelle como trabajar con ellos

Por su parte, Microsoft permite descargar un plugin que se supone elimina los metadatos. Pero el tema sigue opaco para nosotros.

La máxima transparencia debe venir de los formatos Abiertos. Aunque existe la creencia general de que para eliminar todos los metadatos basta en principio con importar un doc en OpenOffice y convertirlo a odt o la simple conversión de formato Word a pdf.

Y no es así los documentos en formato abierto tambien tienes sus propios metadatos pero, en este caso sí están documentados y existe herramientas tambien fiables que nos permiten verlos, modificarlos y eliminarlos. 

Manos a la obra. Como eliminar los metadatos de un documento Office. 

Un método bastante fiable es pasar el documento a un formato abierto como puede ser OpenOffice. Necesitamos tener esta suite ofimática en nuestro equipo. No voy en este post a contar las bondades de Open Office pero aconsejo tenerla instalada independientemente de que tengamos también la suite de Microsoft.

También sera necesario instalar un programa que elimine los metadatos del documentoOpen Office, ya con la garantía de que no hay nada oculto. Uso para eso el programa: OOMetaExtractor de Informática64  y lo podréis encontrar en su página de herramientas

Ya tenemos lo necesario en nuestro equipo.

Primero empezamos por la conversión que es tan simple como abrir el documento con Open Office y volverlo a guardar en formato open: odt.

Arrancamos OOMetaExtractor:





Y abrimos el documento Open Office que hemos creado.





Solo nos queda limpiar los metadatos: Metadata -> Clean




Volvemos a abrir el documento para verificar:

Podemos ver el documento limpio de metadatos.

No olvidemos de mandar el documento que hemos creado, no el original Word.






No hay comentarios:

Publicar un comentario