WINTXCODERS Terminal
[visitante@wintxcoders-pc ~]:$ Bienvenido a la comunidad
Recuerda que puedes participar en nuestra comunidad registrándote

#1 | ¿Metadatos?

Iniciado por PAYASAKX, Enero 19, 2015, 05:46:26 PM

« anterior - próximo »

PAYASAKX

Maestro

  • Desconectado

  • #1 | ¿Metadatos?
    PD: Hago este tutorial dividido en dos, porque en uno solo es demasiado largo y habría que leer demasiado.


    Índice
    - Definición de metadatos
    - Metadatos y peligros para la confidencialidad de datos
    - ¿Qué son los Metadatos?
    - Metadatos: Datos ocultos en ficheros
    - Metadatos y Drones: ladrones de los datos de tu smartphone
    - Prevención



    Definición de "metadatos"
    Los metadatos en informática son datos adicionales almacenados en un fichero. Estos datos suelen definir más en profundidad algunas características de un fichero. Por ejemplo, un pdf de Acrobat contiene la información propia (imágenes y texto) y puede contener información adicional que no se ve directamente en forma de metadatos como: título del documento, asunto, autor, cargo del autor, descripción, autor de la descripción, palabras clave, estado de copyright, aviso de copyright, URL de la información sobre copyright, etc.

    El uso de los metadatos más frecuente es para mejorar la velocidad y rendimiento de las búsquedas, pues los buscadores pueden buscar previamente en los metadatos antes de hacerlo en todo el contenido del fichero. Usando informaciones adicionales los resultados son más precisos, y el usuario se ahorra filtraciones manuales complementarias.

    Metadatos y peligros para la confidencialidad de datos.
    Tras mostrar las posibilidades de los metadatos en los distintos tipos de ficheros que permiten albergarlos queda claro que pueden ser muy útiles para catalogar ficheros de forma automática y para una mejor y más rápida búsqueda de información. Pero también queda claro que los metadatos pueden ser peligrosos para la confidencialidad de los datos, imaginemos, por ejemplo, que hemos realizado una fotografía muy personal con una cámara digital, una vez descargada esta foto en el PC, la retocamos con algún software de retoque fotográfico para quitar la parte que no queremos mostrar, la subimos a algún sitio público o la enviamos a algunos amigos.

    Si el software de retoque no es muy bueno, habrá dejado la miniatura (thumbnail) de la imagen original sin retocar, con lo cual cualquiera, usando una software como AjpdSoft Extraer y eliminar miniatura JPG podrá ver la imagen original.

    ¿Qué son los metadatos?
    Debido a la gran diversidad y volumen de las fuentes y recursos en Internet, se hizo necesario establecer un mecanismo para etiquetar,catalogar, describir y clasificar los recursos presentes en la World Wide Web (DeepWeb) con el fin de facilitar la posterior búsqueda y recuperación de la información. Este mecanismo los constituyen los llamados metadatos. Un metadato no es más que un dato estructurado sobre la información, o sea, información sobre información, o de forma más simple, datos sobre datos. Los metadatos en el contexto de la Web, son datos que se pueden guardar, intercambiar y procesar por medio del ordenador y que están estructurados de tal forma que permiten ayudar a la identificación, descripción clasificación y localización del contenido de un documento o recurso web y que, por tanto, también sirven para su recuperación.

    Así considerados, cada ficha catalográfica es un conjunto de metadatos de un libro o bien de un autor y los metadatos proporcionan una información básica sobre las obras de un autor y lo relacionan con otras obras del mismo autor u otras obras de similar contenido. De la misma forma, los registros de una base de datos llevada a cabo para indizar o hacer un resumen documental, podrían también considerarse como metadatos.

    Sin embargo, si acotamos la definición de metadatos dándole un sentido más estricto, los metadatos sólo serían posibles en un contexto digitaly en red ya que sólo dentro de este contexto se pueden utilizar los metadatos con la función que les caracteriza, que es la de la localización, identificación y descripción de recursos, legibles e interpretables por máquina.
    Dependiendo de la clase de metadatos puede existir: información sobre elementos de datos o atributos, información sobre la estructura de los datos, información sobre un aspecto concreto, etc. De forma general, podemos encontrar metadatos referidos a:

    El contenido (concepto)
    Aspectos formales (tipo, tamaño, fecha, lengua, etc.)
    Información del copyright
    Iinformación de la autentificación del documento o recurso
    Información sobre el contexto (calidad, condiciones o características de acceso, uso, etc.)




    Metadatos; datos ocultos en ficheros.
    Muchos expertos nos dirán que son "datos de datos" que significa que es la información de algo.

    Los metadatos no siempre vendrán adjuntos o adheridos al objeto o archivo, sino que pueden estar en otro lugar o en ambos a la vez. No todos los usuarios de Word saben que los documentos generados con esta aplicación crean unos datos ocultos denominados metadatos donde se esconden múltiples datos que pueden ser recuperados por medio de diversas herramientas. Estos datos pueden ser sensiblemente importantes y comprometedores dependiendo del contenido del documento y de quien lo emite. Sin duda esa información será mas sensible si el documento se edita en las oficinas de Hacienda, que este post que ahora mismo estamos editando.

    Dentro de la información que se encuentra en los metadatos podemos encontrar: Titulo del documento, autor, compañía, palabras claves, asunto, comentarios, plantilla utilizada, aplicación utilizada, fecha y hora de creación del documento, ultima fecha y hora que se salvo el documento, persona que realizo la ultima edición del documento, numero de paginas del documento, numero de palabras del documento, numero de caracteres del documento, numero de revisiones que ha tenido el documento, total tiempo de edición, etc.

    Pero, ¿qué información concreta se almacena en estos metadatos? La información depende de la versión de la aplicación de que se trate: Microsoft Office 2007 almacena mayor número de características que Office 2000 o cualquier otra versión anterior. Las versiones actuales de Office almacenan entre otros los siguientes tipos de metadatos:

    - Propiedades del Software: tales como nombre de usuario, iniciales, organización. Por defecto, si no se indica otro parámetro, el campo "nombre" es el identificador de cuenta de usuario del sistema. Si no se modifica, en los metadatos se encontrará por tanto el nombre de cuenta con el que el usuario ha entrado en el sistema.

    - Propiedades del Documento: tales como creador del documento, descripción, palabras claves, comentarios, etc.

    - Metadatos Ocultos: se trata de datos que se almacenan de forma oculta dentro de los ficheros y que son utilizados por el paquete Office internamente.

    Toda esta información permitirá obtener nombres de servidores internos de la organización, nombres de cuentas de usuarios, quién modificó un documento, cuándo lo modificó, desde dónde, qué software se utiliza en una organización, versiones, etc.

    Como ejemplo de lo sensible que puede resultar esta información, tomaremos de ejemplo el Gabinete de Tony Blair, que en 2003 publicó en un fichero Word información relativa a la infraestructura militar de Irak. Investigando los metadatos del documento, se descubrió que el fichero había sido editado por cuatro civiles de los que aparecieron sus nombres, rutas donde editaron el fichero e impresoras utilizadas.

    ¿Qué podemos hacer para evitar esta situación? Es esencial "limpiar" los metadatos de cualquier documento que se cree o modifique, sobretodo si este va a ser publicado. Microsoft dispone de un complemento/herramienta para Office de fácil instalación llamada "Eliminar Datos Ocultos". Una vez instalado, permite desde el menu "Archivo->Eliminar Datos Ocultos" limpiar de metadatos los ficheros Office.

    Metadatos y Drones: ladrones de datos de tu smartphone
    Hackers desarrollaron un drone que puede robar contenidos de tu teléfono inteligente —desde datos de tu ubicación hasta tu contraseña de Amazon— y lo están probando en los cielos de Londres. Los resultados de la investigación serán presentados la próxima semana en la conferencia de seguridad cibernética Black Hat Asia que se llevará a cabo en Singapur. El drone, conocido como Snoopy, cuenta con una tecnología que busca dispositivos móviles con wi-fi encendido. Snoopy se aprovecha de una función dentro de los smartphones y tabletas: cuando estos intentan conectarse a internet, buscan redes a las cuales han accedido en el pasado.

    "De manera muy ruidosa, el teléfono gritará el nombre de cada red a la cual se ha conectado", dijo el investigador de seguridad de Sensepost, Glenn Wilkinson. "Estarán gritando: 'Starbucks, ¿estás ahí?... wi-fi gratis de McDonalds, ¿estás ahí?".

    Ahí es cuando este drone podrá entrar en acción (y será peor que la caricatura): podrá devolver una señal pretendiendo ser una red a la cual te has conectado en el pasado. Dispositivos a 60 centímetros de distancia pueden conectarse con el drone, creyendo que es una red confiable de wi-fi. Cuando los teléfonos inteligentes se conecten con Snoopy, éste interceptará todo lo que envíe y reciba.

    "Tu teléfono se conecta conmigo y puedo ver todo tu tráfico", dijo Wilkinson.

    Eso incluye los sitios que visites, información de tarjetas de crédito guardada, datos de ubicación, usuarios y contraseñas. Cada teléfono tiene un número de identificación o dirección MAC, lo cual es usado por el drone para conectarse. Los nombres de las redes que los teléfonos visiten también pueden ser reveladores. "He visto que alguien buscando la red corporativa de Bank X", explicó Wilkinson. "Ahora sabemos que esa persona trabaja en ese banco".

    CNNMoney llevó a Snoopy a dar un paseo por Londres un sábado de marzo por la tarde y Wilkinson pudo mostrarnos lo que él creía eran las casas de varias personas que habían caminado bajo su drone. En menos de una hora de vuelo, obtuvo los nombres de las redes y coordenadas de GPS de unos 150 dispositivos móviles. También pudo obtener nombres de usuarios y contraseñas de cuentas de Amazon, PayPal y Yahoo creadas para propósitos de este reporte, para que pudiéramos verificarlo sin robar información de transeúntes.

    La recolección de metadatos, identificaciones de dispositivos y nombres de redes probablemente no es ilegal, de acuerdo con la Electronic Frontier Foundation. Interceptar nombres de usuarios, contraseñas e información de tarjetas de crédito con la intención de usarlos sí violaría leyes de robo de identidad y espionaje. Wilkinson, quien desarrolló la tecnología junto a Daniel Cuthbert en los laboratorios de Sensepost Research, dice que él es un hacker ético. El propósito de su investigación es crear consciencia sobre la vulnerabilidad de los datos en dispositivos inteligentes.

    Prevención
    Nadie está a salvo, un descuido curioso lo tuvo un hacker de la talla de Robert Hansen (a.k.a. RSnake), quien pese a su intento de ocultar los datos de contacto de Mike Shaver (Mozilla) en su famosa tarjeta "10 putos días", olvidó eliminar de su foto los metadatos (ver antes y después de "limpiarla"), así como una imagen en miniatura (thumbnail) donde éstos seguían apareciendo en toda su plenitud...

    Sigue los consejos de los sabios y elimina los metadatos de tus fotos antes de colgarlas en la Red o incluso de llevarlas al laboratorio para pasarlas a papel.

    Un posible método -que sugiere en su weblog Giorgio Maone, creador de NoScript y descubridor del embarazoso y conocido incidente de RSnake - consiste en utilizar IrfanView, un freeware para Windows que se dice corre también en Linux bajo Wine (aunque no parece ser así en mi sistema).

    Basta descargar el programa (1.1 MB) y su paquete de plugins (5.7 MB). Se carga el fichero de imagen a "limpiar" y se le aplica el filtro que aparece en Options -> JPEG Losless Operations -> Clean all APP Markers.

    Como la operación no implica pérdidas, la calidad de la imagen es mejor que la obtenida mediante la opción de Photoshop "Save for the Web", que también elimina thumbnails y otros metadatos.

    Aunque me consta que existen profesionales del diseño que ni siquiera conocen este problema, apuesto a que hay lectores de Kriptópolis que pueden sugerir ideas y métodos aún mejores para ayudarnos a que nuestras imágenes no muestren nunca nada más de lo necesario.
    Herramientas

    Existen diversas herramientas para detectar y evitar estos metadatos, como por ejemplo:
    Citar- Metadata Analyzer: Este programa se encarga de comprobar los documentos de MS Office: Microsoft Word, Microsoft Excel y Microsoft PowerPoint en busca de este tipo de información. El programa analizará tus documentos y te informará de toda la información privada que encuentre.

    - Doc Scrubber: Doc Scrubber es una pequeña aplicación que te permite ver la información que esta mas allá del texto escrito en un documento de Word, una información que en ocasiones no es bueno mostrar a terceras personas. Este tipo de información recibe normalmente el nombre de metadatos.

    El programa es compatible con las versiones 97, 2000, XP y 2003 de Microsoft Word pero no es compatible con el nuevo formato de documento de Word 2007 la extensión docx. Aunque en PortalProgramas puede encontrar diversas herramientas que le permiten pasar el formato docx a formatos mas antiguos.

    La aplicación elimina el GUID identificador, los comentarios, las palabras clave, fechas de guardado de impresión y de edición, historiales de revisión, etc. Además puedes exportar a formato de texto plano (txt) el resultado del análisis.

    - Foca: Para saber los metadatos ocultos de documentos Office, OpenOffice, PDF, JPG y muchos más existe una herramienta presentada en varias conferencias internacionales como BlackHat EU y Defcon 17 el cual ayudará a obtener la información del documento que deseemos, el nombre de esta herramienta es FOCA (Fingerprinting Organizations whits Collected Archives) creado por Informática 64.

    Además si se desea extraer información de un documento de alguna web nos generará mapas de red a partir de los metadatos mostrando una ruta de las infraestructuras de la red de la empresa.

    - AjpdSoft Extraer y eliminar miniatura JPG: es una aplicación es una aplicación 100% open source, desarrollada en Borland Delphi 6, gratuita (freeware) que extrae la miniatura (thumbnail) de una imagen JPG ó JPEG, si la tiene.

    Permite guardar la miniatura (thumbnail) de una imagen JPG en un fichero. Por seguridad y por preservar la privacidad, también por ahorrar espacio, es recomendable eliminar la miniatura (thumbnail) que algunas aplicaciones incluyen en los metadatos EXIF de los ficheros JPG o JPEG. AjpdSoft Extraer y eliminar miniatura JPG también permite eliminar esta miniatura.

    Seleccionando el fichero de imagen JPG en "Fichero de imagen JPEG", la aplicación mostrará la vista previa de la imagen (a la izquierda) y la vista previa de la miniatura de la imagen (si existe) a la derecha. Si existe miniatura en la imagen JPG, podremos eliminarla pulsando el botón "Eliminar miniatura"


    ¿Quiéres ver el #2 de ¿Metadatos?
    Pronto lo publicaré.

    #i[J]0SEE

    Maestro

  • Desconectado
  •  #google

    No animo a publicar un copy & paste, creo para esto tiene mas mérito publicar un PDF trabado.
    You are not allowed to view links. Register or Login

    PAYASAKX

    Maestro

  • Desconectado
  • You are not allowed to view links. Register or Login
    #google

    No animo a publicar un copy & paste, creo para esto tiene mas mérito publicar un PDF trabado.
    You are not allowed to view links. Register or Login
    Vería innecesario poner #1 | ¿Metadatos? y poner el link de la página.
    Prefiero postear lo que contiene esa página, ya que estamos aquí para aportar temas propios o terceros, (de otros foros o web) Al fin y al cabo el objetivo es hacer saber a la gente y a los usuarios del foro lo que en realidad contiene el post y de qué trata.