fbpx
Wikipedia

Los metadatos (del griego μετα, meta, 'después de, más allá de'​ y latín datum, 'lo que se da', «dato»​), literalmente «sobre datos», son datos que describen otros datos. En general, un grupo de metadatos se refiere a un grupo de datos que describen el contenido informativo de un objeto al que se denomina recurso.​ El concepto de metadatos es análogo al uso de índices para localizar objetos en vez de datos. Por ejemplo, en una biblioteca se usan fichas que especifican autores, títulos, casas editoriales y lugares para buscar libros. Así, los metadatos ayudan a ubicar datos.

En el siglo XXI, los metadatos se refieren típicamente a formularios digitales. Sin embargo, los catálogos de tarjetas tradicionales contienen metadatos como autor, título, tema, etc.

Para varios campos de la informática, como la recuperación de información o la web semántica, los metadatos en etiquetas son un enfoque importante para construir un puente sobre el intervalo semántico, ya que cualquier recurso tiene, cuando está almacenado conjuntamente con otros, la necesidad de ser descrito para facilitar las búsquedas que pudieran tratar de encontrarlo a partir de sus características distintivas. Esto es cierto para cualquier tipo de recurso, tanto para un vídeo como para un libro en una biblioteca o para un hueso en el armario de un paleontólogo.

El concepto de metadatos es anterior a Internet y a la web, si bien es cierto que las nuevas necesidades de búsqueda de información han suscitado un interés por las normas y prácticas de metadatos hasta entonces desconocido.

Índice

El término «metadatos» no tiene una definición única. Según la definición más difundida de metadatos es que son «datos sobre datos». También hay muchas declaraciones como «informaciones sobre datos»,​ «datos sobre informaciones»​ e «informaciones sobre informaciones».

Otra clase de definiciones trata de precisar el término como «descripciones estructuradas y opcionales que están disponibles de forma pública para ayudar a localizar objetos»​ o «datos estructurados y codificados que describen características de instancias conteniendo informaciones para ayudar a identificar, descubrir, valorar y administrar las instancias descritas».​ Esta clase surgió de la crítica de que las declaraciones más simples son tan difusas y generales que dificultarán la tarea de acordar estándares, pero estas definiciones no son muy comunes.

Podemos también considerar los metadatos, en las áreas de telecomunicaciones e informática, como información no relevante para el usuario final pero sí de suma importancia para el sistema que maneja los datos. Los metadatos son enviados junto a la información cuando se realiza alguna petición o actualización de la misma.

En el campo biológico los metadatos se han convertido en una herramienta fundamental para el descubrimiento de datos e información. En este contexto se pueden definir los metadatos como «una descripción estandarizada de las características de un conjunto de datos» con esto se incluye la descripción del contexto en el cual los datos fueron coleccionados y además se refiere al uso de estándares para describirlos.

Distinción entre datos y metadatos

La mayoría de las veces no es posible diferenciar entre datos y metadatos. Por ejemplo, un poema es un grupo de datos, pero también puede ser un grupo de metadatos si está adjuntado a una canción que lo usa como texto.

Muchas veces, los datos son tanto "datos" como "metadatos". Por ejemplo, el título de un texto es parte del texto como a la vez es un dato referente al texto (dato como metadato).

Metadatos sobre metadatos

Debido a que los metadatos son datos en sí mismos, es posible crear metadatos sobre metadatos. Aunque, a primera vista, parece absurdo, los metadatos sobre metadatos pueden ser muy útiles. Por ejemplo, fusionando dos imágenes y sus metadatos distintos puede ser muy importante deducir cuál es el origen de cada grupo de metadatos, registrando ello en metadatos sobre los metadatos.

Tipos de metadatos

Descriptivos: Para encontrar o entender una fuente de información.

Administrativos: - Metadatos técnicos: Para decodificar y representar archivos. - Metadatos de preservación: Gestión a largo plazo de archivos. - Metadatos de derechos: Derechos de propiedad intelectual adjuntos al contenido.

Estructurales: Relaciones de partes de recursos entre sí.

Lenguajes de marcado: Integra metadatos y marcas para otras características estructurales o semánticas dentro del contenido

El uso de los metadatos mencionado más frecuentemente es la refinación de consultas a buscadores. Usando información adicional los resultados son más precisos, y el usuario se ahorra filtraciones manuales complementarias.

El intervalo semántico plantea el problema de que el usuario y el ordenador no se entiendan porque este último no comprenda el significado de los datos. Es posible que los metadatos posibiliten la comunicación declarando cómo están relacionados los datos. Por eso la representación del conocimiento usa metadatos para categorizar informaciones. La misma idea facilita la inteligencia artificial al deducir conclusiones automáticamente.

Los metadatos facilitan el flujo de trabajo convirtiendo datos automáticamente de un formato a otro. Para eso es necesario que los metadatos describan contenido y estructura de los datos.

Algunos metadatos hacen posible una compresión de datos más eficaz. Por ejemplo, si en un vídeo el software sabe distinguir el primer plano del fondo puede usar algoritmos de compresión diferentes y así mejorar la cuota de compresión.

Otra idea de aplicación es la presentación variable de datos. Si hay metadatos señalando los detalles más importantes, un programa puede seleccionar la forma de presentación más adecuada. Por ejemplo, si un teléfono móvil sabe dónde está localizada una persona en una imagen, tiene la posibilidad de reducirlo a las dimensiones de su pantalla. Del mismo modo un navegador puede decidir presentar un diagrama a su usuario ciego en forma táctil o leída.

Los metadatos se clasifican usando tres criterios:

Contenido
Subdividir metadatos por su contenido es lo más común. Se puede separar los metadatos que describen el recurso mismo de los que describen el contenido del recurso. Es posible subdividir estos dos grupos más veces, por ejemplo para separar los metadatos que describen el sentido del contenido de los que describen la estructura del contenido o los que describen el recurso mismo de los que describen el ciclo vital del recurso.
Variabilidad
Según la variabilidad se puede distinguir metadatos mutables e inmutables. Los inmutables no cambian, no importa qué parte del recurso se vea, por ejemplo el nombre de un fichero. Los mutables difieren de parte a parte, por ejemplo el contenido de un vídeo.
Función
Los datos pueden ser parte de una de las tres capas de funciones: subsimbólicos, simbólicos o lógicos. Los datos subsimbólicos no contienen información sobre su significado. Los simbólicos describen datos subsimbólicos, es decir añaden sentido. Los datos lógicos describen cómo los datos simbólicos pueden ser usados para deducir conclusiones lógicas, es decir añaden comprensión.

El ciclo de vida de los metadatos comprende las fases creación, manipulación y destrucción. El análisis minucioso de cada una de las etapas saca a la luz asuntos significativos.

Creación

Se pueden crear metadatos manualmente, semiautomáticamente o automáticamente. El proceso manual puede ser muy laborioso, dependiente del formato usado y del volumen deseado, hasta un grado en el que los seres humanos no puedan superarlo. Por eso, el desarrollo de utillaje semiautomático o automático es más que deseable.

En la producción automática el software adquiere las informaciones que necesita sin ayuda externa. Aunque el desarrollo de algoritmos tan avanzados está siendo objeto de investigación actualmente, no es probable que la computadora vaya a ser capaz de extraer todos los metadatos automáticamente. En vez de ello, se considera la producción semiautomática más realista; aquí un servidor humano sostiene algoritmos autónomos con la aclaración de inseguridades o la proposición de informaciones que el software no puede extraer sin ayuda.

Hay muchos expertos que se encargan del diseño de herramientas para la creación de metadatos pero que ignoran cuestionar este proceso. Según los que no evitan el asunto, la generación no debe comenzar después de la terminación de un recurso sino que debe hacerse durante la fabricación: hay que archivar los metadatos tan pronto como se originan, con los conocimientos especiales del productor, para evitar una laboriosa reconstrucción posterior. Por eso, se tiene que integrar la producción de metadatos en el procedimiento de fabricación del recurso.

Manipulación

Si los datos cambian, los metadatos tienen que cambiar también. Aquí se hace la pregunta: ¿quién va a adaptar los metadatos? Existen modificaciones que pueden ser manejadas de forma sencilla y automática, pero hay otras donde la intervención de un servidor humano es indispensable.

La metaproducción, el reciclaje de partes de recursos para crear otros recursos, demanda atención particular. La fusión de los metadatos afiliados no es trivial, especialmente si se trata de información con relevancia jurídica, como por ejemplo la gestión digital de derechos.

Destrucción

Además hay que investigar la destrucción de metadatos. En algunos casos es conveniente eliminar los metadatos junto con sus recursos, en otros es razonable conservar los metadatos, por ejemplo para supervisar cambios en un documento de texto.

Los metadatos han cobrado gran relevancia en el mundo de Internet, por la necesidad de utilizar los metadatos para la clasificación de la enorme cantidad de datos. Además de la clasificación los metadatos pueden ayudar en las búsquedas. Por ejemplo, si buscamos un artículo sobre vehículos, este dato tendrá sus correspondiente metadatos clave adjuntos, como 4 ruedas, motor, etc.

Otros ejemplos de usos de metadatos en la informática:

  • Metatags en HTML: etiquetas con información sobre el propio documento web: autor, editor, codificación, etc.
  • Información en el propio sistema de ficheros: HFS o ReiserFS, por nombrar dos. Se ven completados por los buscadores inteligentes ( o ) que saben reconocer estos metadatos.
  • Clasificaciones de fotos: , o , por ejemplo.
  • Clasificadores de canciones: contienen metadatos sobre las canciones, bien en MP3 o en CD de audio, en un formato llamado ID3. Por ejemplo: y .

Hay dos posibilidades para almacenar metadatos: depositarlos internamente, en el mismo documento que los datos, o depositarlos externamente, en su mismo recurso. Inicialmente, los metadatos se almacenaban internamente para facilitar la administración.

Hoy, por lo general, se considera mejor opción la localización externa porque hace posible la concentración de metadatos para optimizar operaciones de búsqueda. Por el contrario, existe el problema de cómo se liga un recurso con sus metadatos. La mayoría de los estándares usa URIs, la técnica de localizar documentos en la World Wide Web, pero este método propone otras preguntas, por ejemplo qué hacer con documentos que no tienen URI.

Codificación

Los primeros y más simples formatos de los metadatos usaron texto no cifrado o la codificación binaria para almacenar metadatos en ficheros.

Hoy, es común codificar metadatos usando XML. Así, son legibles tanto por seres humanos como por computadoras. Además este lenguaje tiene muchas características a su favor, por ejemplo es muy simple integrarlo en la World Wide Web. Pero también hay inconvenientes: los datos necesitan más espacio de memoria que en formato binario y no está claro cómo convertir la estructura de árbol en una corriente de datos.

Por eso, muchos estándares incluyen utilidades para convertir XML en codificación binaria y viceversa, de forma que se unen las ventajas de los dos.

Para garantizar la uniformidad y la compatibilidad de los metadatos, muchos sugieren el uso de un vocabulario controlado fijando los términos de un campo. Por ejemplo, en caso de sinónimos o interlenguaje hay que acordarse qué palabras se usan para evitar que el buscador localice «español» pero no «española».

Una ontología además define las relaciones de los términos del vocabulario para que la computadora puede evaluarlas automáticamente. Así es posible presentar una página web sobre «Vincent Van Gogh» aunque el usuario tecleó «pintores neerlandeses»; usando una ontología adecuada el buscador comprende que Van Gogh fue un pintor neerlandés.

Un concepto muy similar a las ontologías son las folksonomías. Las ontologías son definidas por expertos del campo que ordenan los términos, pero las folksonomías son definidas por los mismos usuarios.

En el e-learning los metadatos se emplean para describir los objetos y recursos de aprendizaje con el objetivo de facilitar las búsquedas en los repositorios. A menudo la información de metadatos de los repositorios de objetos de aprendizaje cumple el estándar IEEE LOM, el cual define un conjunto de nueve categorías de información, que permiten describir los recursos tanto desde el punto de vista didáctico como técnico, lo que permite hacer búsquedas mucho más ajustadas que permitirán a los usuarios (profesores que componen un nuevo curso con materiales existentes, o alumnos interesados en aprender sobre un cierto tema) obtener resultados más ajustados a los criterios de búsqueda introducidos.

Los metadatos son una parte esencial del paradigma de los objetos de aprendizaje, puesto que:

  • La reutilización de objetos de aprendizaje se basa en la creación y uso de metadatos, descripciones a menudo externas a los propios recursos.
  • Los metadatos, si se proporcionan en los lenguajes adecuados, permiten desarrollar novedosas herramientas tecnológicas que facilitan la búsqueda y manipulación de los objetos de aprendizaje.
  • Facilitan la recuperación de la información, al describir el contenido y sus relaciones con otros recursos.
  • Facilitan la interoperabilidad, ya que hacen más fácil compartir e intercambiar información.
  • Simplifican la gestión y el almacenamiento, pues permiten guardar información sobre el ciclo de vida de los recursos.
  • Ayudan a gestionar adecuadamente y proteger los derechos de propiedad intelectual.

Los metadatos son por tanto un elemento de valor fundamental. Un recurso digital con un diseño pedagógico excelente no es per se un buen objeto de aprendizaje, sino que lo será en la medida en que los metadatos que lo describan sean también de calidad.

Se conoce como paradatos al conjunto de datos que se genera durante la interacción entre un usuario y un recurso o servicio de un escenario educativo (un entorno virtual de aprendizaje, repositorio, red social, etcétera). En función del recurso o servicio accedido y las operaciones realizadas con el mismo, los paradatos generados contendrán más o menos información. Esta información se puede almacenar para ser posteriormente analizada, con el objetivo de comprender mejor cómo los usuarios interactúan en dicho escenario educativo, detectando posibles problemas, así como oportunidades de mejora tanto del propio escenario educativo y de las herramientas utilizadas como del entendimiento del proceso que siguen los usuarios en el mismo. A partir del análisis realizado, es posible entonces construir, entre otros, sistemas de recomendación, esquemas de reputación, visualizaciones de la interacción, etc.

Por ejemplo, si un usuario se descarga un documento de un repositorio de objetos de aprendizaje, será posible saber que el usuario U ha descargado el documento D en el momento T. Esta información puede usarse para detectar aquellos recursos más descargados o, por el contrario, aquellos que nunca son accedidos por los usuarios, pero también conocer en qué épocas del semestre académico se produce una mayor utilización del repositorio. Otra posibilidad es si un usuario U evalúa un recurso R con una valoración X en el momento T, por ejemplo, un comentario en un grupo de Facebook. Esto permite conocer los comentarios mejor o peor valorados por los usuarios, así como los usuarios más activos.

En general, el objetivo es guardar la interacción de los usuarios con el sistema en forma de tuplas (U, T, S, R, X): un usuario U en el momento T utiliza un servicio S sobre un recurso R con un resultado X. Esta es la mínima información que debe ser almacenada para su posterior análisis.

Almacenamiento de paradatos

Dado que la interacción en un entorno virtual de aprendizaje suele realizarse mediante el uso de un navegador web, un usuario que visita los espacios ofrecidos por el mismo deja un rastro en forma de accesos a páginas web que quedan recogidos en los ficheros de registro (en inglés, log files) de los servidores web que soportan el sistema. Por lo tanto, parece factible analizar los ficheros de registro para extraer la información relativa a la interacción. El problema, no obstante, es que estos ficheros contienen muchas más entradas relativas a la disposición de los elementos que forman una página web, que realmente relacionadas con el propio resultado de la interacción de los usuarios, la cual debe ser calculada a partir de la secuencia de saltos capturada en los ficheros de registro. El coste computacional de analizar ficheros de registro es muy elevado (contienen millones de líneas de registro) y no es sencillo cuando se trata de sistemas complejos con múltiples servidores donde el rastro dejado por un usuario puede estar fragmentado en diferentes ficheros.

Por lo tanto, si es necesario recoger paradatos para su análisis posterior, es mejor que el sistema sea diseñado específicamente con un servicio de recogida enfocado a almacenar solamente la información requerida para el análisis, reduciendo el tamaño necesario así como el tiempo de proceso. En función del objetivo del análisis, los paradatos pueden almacenarse dentro de los metadatos de un recurso, dentro del perfil del usuario o bien, lo más habitual, en una tabla (o base de datos, en función de su complejidad) separada.

Algunos expertos critican fuertemente el uso de metadatos. Sus argumentos más sustanciosos son:

  • Los metadatos son costosos y necesitan demasiado tiempo. Las empresas no van a producir metadatos porque no hay demanda y los usuarios privados no van a invertir tanto tiempo.
  • Los metadatos son demasiado complicados. La gente no acepta los estándares porque no los comprende y no quiere aprenderlos.
  • Los metadatos dependen del punto de vista y del contexto. No hay dos personas que añadan los mismos metadatos. Además, los mismos datos pueden ser interpretados de manera totalmente diferente, dependiendo del contexto.
  • Los metadatos son ilimitados. Es posible adherir más y más metadatos útiles y no hay fin.
  • Los metadatos son superfluos. Ya hay buscadores potentes para textos, y en el futuro la técnica query by example («búsqueda basada en un ejemplo») va a mejorarse, tanto para localizar imágenes como para música y vídeo.

Algunos estándares de metadatos están disponibles pero no se aplican: los críticos lo consideran una prueba de las carencias del concepto de metadatos. Hay que notar que este efecto también puede ser causado por insuficiente compatibilidad de los formatos o por la enorme diversidad que amedrenta a las empresas. Fuera de eso hay formatos de metadatos muy populares.

Si bien la inclusión de metadatos es necesaria, para facilitar y potenciar un buen número de tareas importantes, también existen problemas asociados al uso de los mismos. Algunos de los problemas más citados en la literatura científica se resumen en los siguientes puntos:

  • Falta de compleción: introducir metadatos es a menudo una tarea ingrata y que requiere un esfuerzo considerable. Esto lleva a una cierta tendencia a no completar (o a completar deficientemente) los registros de metadatos, ya que las organizaciones bien no perciben adecuadamente la necesidad de ofrecer registros de metadatos completos o no pueden hacer frente a los altos costes, en términos de esfuerzo, de completar sus colecciones. Este problema es más patente cuando el número de objetos de aprendizaje a anotar es importante (colecciones de miles de objetos de aprendizaje) o cuando el número de elementos de metadatos a rellenar es elevado (por encima de la veintena).
  • Dificultades de interoperabilidad: algunas informaciones de metadatos descansan en el uso de vocabularios, colecciones de términos cerradas cuyos elementos se han de emplear obligatoriamente para consignar la información relativa al elemento de metadatos en cuestión. Los estándares permiten utilizar distintos vocabularios para un elemento de metadatos, por lo que estos pueden variar de una institución a otra causando dificultades para intercambiar recursos, para que sistemas externos operen sobre metadatos con distinto origen, etc. Así por ejemplo, la información para el elemento 5.8.Dificultad del estándar IEEE LOM ha de escogerse (según el estándar IEEE LOM) de la siguiente lista de términos: muy fácil / fácil / medio/ difícil / muy difícil. Sin embargo, el propio estándar IEEE LOM permite utilizar otro vocabulario si se estima oportuno, por lo que una cierta institución podría simplificar el número de categorías a 3, ampliarlo a 10 para ofrecer una escala más detallada, o elegir otra escala más adecuada a su contexto tal como por ejemplo: básico / básico-necesita-apoyo / imprescindible-apoyo-externo/ complejo.
  • Inconsistencia semántica y otros interesantes problemas derivados de los estándares establecidos: no es infrecuente observar cómo dos instituciones distintas ofrecen informaciones diferentes para el mismo elemento de metadatos, a menudo por falta de claridad del estándar de metadatos utilizado. Tomando como ejemplo el estándar IEEE LOM, algunos elementos como el elemento 5.8.Dificultad dependen en gran medida de la opinión subjetiva de la persona que crea el registro de metadatos y, en consecuencia, están destinados a ser inconsistentes con registros creados por otras personas pues uno podría considerar difícil lo que para otro es muy difícil. Otro problema similar es la incompletitud semántica, es decir, la introducción de información incompleta para un cierto elemento de metadatos, no proporcionando toda la información que sería posible —y deseable— ofrecer.
  • Están "orientados a humanos": los metadatos son descripciones textuales que las personas interpretamos fácilmente. Sin embargo, a los sistemas y aplicaciones informáticas no les resulta sencillo procesar esta información para ofrecer servicios añadidos, ya que los metadatos no han sido escritos para que los entiendan "máquinas". Así, resulta difícil programar un buscador que priorice los resultados de una búsqueda de objetos de aprendizaje en un repositorio, en función de, por ejemplo, la información sobre derechos de acceso (elemento LOM 6.2.Derechos) o de su cobertura geográfica o temporal (elemento 1.8.Cobertura), sencillamente porque dicha información está en un texto escrito en un lenguaje humano del que es difícil extraer la información buscada: es preciso procesar el texto mediante complejas técnicas de análisis lingüístico, dividirlo en sus partes esenciales, analizar cada parte y extraer la información, etc., teniendo siempre en cuenta que en textos como la descripción de la cobertura puede haber localismos, omisiones obvias para las personas pero incomprensibles para una máquina, o cualesquiera otras complejidades propias de los lenguajes humanos.

Hay dos grupos que impulsan el desarrollo de formatos de metadatos: la técnica multimedia y la web semántica. El destino de la técnica multimedia es describir un singular recurso de multimedia, el de la web semántica la descripción de recursos de cada tipo y además el encadenamiento de los conocimientos. Los formatos más populares y grandes son:

  1. Real Academia Española y Asociación de Academias de la Lengua Española. . Diccionario de la lengua española (23.ª edición).
  2. Real Academia Española y Asociación de Academias de la Lengua Española. . Diccionario de la lengua española (23.ª edición).
  3. Senso, José Antonio; Rosa Piñero, Alberto de la (2003). . Ciência da Informação, vol. 32, n. 2: 95-106.
  4. Tim Bray. 9 junio de 1998, visitado 29 mayo de 2006
  5. Tom Sheldon. 2001, visitado 29 mayo de 2006
  6. A. Steinacker, A. Ghavam, R. Steinmetz. IEEE MultiMedia, enero-marzo de 2001
  7. W3C, Ralph Swick. 2002, visto 29 mayo de 2006
  8. D. C. A. Bultermann. «Is It Time for a Moratorium on Metadata?» IEEE Multimedia, 11(4):10-17, IEEE Computer Society Press, Los Alamitos, Ca, USA, octubre-diciembre de 2004
  9. W. R. Durrell. Data Administration. A Practical Guide to Data Administration. McGraw-Hill, 1985
  10. . Archivado desde el 21 de noviembre de 2008. Consultado el 22 de enero de 2019.
  11. .
  12. C. Wroe, C. Goble, M. Greenwood, P. Lord, S. Miles, J. Papay, T. Payne, L. Moreau. «Automating Experiments Using Semantic Data on a Bioinformatics Grid». IEEE Intelligent Systems, 19(1):48-55, enero/febrero de 2004
  13. H. Kosch, L. Böszörményi, M. Döller, M. Libsie, P. Schojer, A. Kofler. «The Life Cycle of Multimedia Metadata».' IEEE MultiMedia, 12(1), IEEE Computer Society Press, Los Alamitos, Ca, USA, enero de 2005
  14. M. Horstmann, M. Lorenz, A. Watkowski, et al. «Automated interpretation and accessible presentation of technical diagrams for blind people». The New Review of Hypermedia and Multimedia, 10(29:141-163, Taylor & Francis Inc., Pa, USA, 2004
  15. J. R. Smith, P. Schirling. «Metadata Standards Roundup». IEEE MultiMedia, 13(2):84-88, IEEE Computer Society Press, Los Alamitos, Ca, USA, avril 2006
  16. G. Stamou, J. v. Ossenbruggen, J. Pan, G. Schreiber. «Multimedia Annotations on the Semantic Web». IEEE MultiMedia, 13(1):86-90, IEEE Computer Society Press, Los Alamitos, Ca, USA, enero-marzo de 2006

metadatos, grupo, datos, describen, otros, datos, idioma, vigilar, editar, redirigido, desde, metadato, metadatos, griego, μετα, meta, después, más, allá, latín, datum, dato, literalmente, sobre, datos, datos, describen, otros, datos, general, grupo, metadatos. Metadatos grupo de datos que describen otros datos Idioma Vigilar Editar Redirigido desde Metadato Los metadatos del griego meta meta despues de mas alla de 1 y latin datum lo que se da dato 2 literalmente sobre datos son datos que describen otros datos En general un grupo de metadatos se refiere a un grupo de datos que describen el contenido informativo de un objeto al que se denomina recurso 3 El concepto de metadatos es analogo al uso de indices para localizar objetos en vez de datos Por ejemplo en una biblioteca se usan fichas que especifican autores titulos casas editoriales y lugares para buscar libros Asi los metadatos ayudan a ubicar datos 4 En el siglo XXI los metadatos se refieren tipicamente a formularios digitales Sin embargo los catalogos de tarjetas tradicionales contienen metadatos como autor titulo tema etc Para varios campos de la informatica como la recuperacion de informacion o la web semantica los metadatos en etiquetas son un enfoque importante para construir un puente sobre el intervalo semantico ya que cualquier recurso tiene cuando esta almacenado conjuntamente con otros la necesidad de ser descrito para facilitar las busquedas que pudieran tratar de encontrarlo a partir de sus caracteristicas distintivas Esto es cierto para cualquier tipo de recurso tanto para un video como para un libro en una biblioteca o para un hueso en el armario de un paleontologo El concepto de metadatos es anterior a Internet y a la web si bien es cierto que las nuevas necesidades de busqueda de informacion han suscitado un interes por las normas y practicas de metadatos hasta entonces desconocido Indice 1 Definiciones 1 1 Distincion entre datos y metadatos 1 2 Metadatos sobre metadatos 1 3 Tipos de metadatos 11 2 Objetivos 3 Clasificacion 4 Ciclo de vida 4 1 Creacion 4 2 Manipulacion 4 3 Destruccion 5 Metadatos en la informatica 6 Almacenamiento 6 1 Codificacion 7 Vocabularios controlados y ontologias 8 Metadatos y objetos de aprendizaje 9 Paradatos 9 1 Almacenamiento de paradatos 10 Critica y problemas asociados al uso de los metadatos 11 Formatos y estandares 12 Vease tambien 13 Referencias 14 Enlaces externosDefiniciones EditarEl termino metadatos no tiene una definicion unica Segun la definicion mas difundida de metadatos es que son datos sobre datos Tambien hay muchas declaraciones como informaciones sobre datos 5 datos sobre informaciones 6 e informaciones sobre informaciones 7 Otra clase de definiciones trata de precisar el termino como descripciones estructuradas y opcionales que estan disponibles de forma publica para ayudar a localizar objetos 8 o datos estructurados y codificados que describen caracteristicas de instancias conteniendo informaciones para ayudar a identificar descubrir valorar y administrar las instancias descritas 9 Esta clase surgio de la critica de que las declaraciones mas simples son tan difusas y generales que dificultaran la tarea de acordar estandares pero estas definiciones no son muy comunes Podemos tambien considerar los metadatos en las areas de telecomunicaciones e informatica como informacion no relevante para el usuario final pero si de suma importancia para el sistema que maneja los datos Los metadatos son enviados junto a la informacion cuando se realiza alguna peticion o actualizacion de la misma En el campo biologico los metadatos se han convertido en una herramienta fundamental para el descubrimiento de datos e informacion En este contexto se pueden definir los metadatos como una descripcion estandarizada de las caracteristicas de un conjunto de datos con esto se incluye la descripcion del contexto en el cual los datos fueron coleccionados y ademas se refiere al uso de estandares para describirlos 10 Distincion entre datos y metadatos Editar La mayoria de las veces no es posible diferenciar entre datos y metadatos Por ejemplo un poema es un grupo de datos pero tambien puede ser un grupo de metadatos si esta adjuntado a una cancion que lo usa como texto Muchas veces los datos son tanto datos como metadatos Por ejemplo el titulo de un texto es parte del texto como a la vez es un dato referente al texto dato como metadato Metadatos sobre metadatos Editar Debido a que los metadatos son datos en si mismos es posible crear metadatos sobre metadatos Aunque a primera vista parece absurdo los metadatos sobre metadatos pueden ser muy utiles Por ejemplo fusionando dos imagenes y sus metadatos distintos puede ser muy importante deducir cual es el origen de cada grupo de metadatos registrando ello en metadatos sobre los metadatos Tipos de metadatos 11 Editar Descriptivos Para encontrar o entender una fuente de informacion Administrativos Metadatos tecnicos Para decodificar y representar archivos Metadatos de preservacion Gestion a largo plazo de archivos Metadatos de derechos Derechos de propiedad intelectual adjuntos al contenido Estructurales Relaciones de partes de recursos entre si Lenguajes de marcado Integra metadatos y marcas para otras caracteristicas estructurales o semanticas dentro del contenidoObjetivos EditarEl uso de los metadatos mencionado mas frecuentemente es la refinacion de consultas a buscadores Usando informacion adicional los resultados son mas precisos y el usuario se ahorra filtraciones manuales complementarias El intervalo semantico plantea el problema de que el usuario y el ordenador no se entiendan porque este ultimo no comprenda el significado de los datos Es posible que los metadatos posibiliten la comunicacion declarando como estan relacionados los datos Por eso la representacion del conocimiento usa metadatos para categorizar informaciones La misma idea facilita la inteligencia artificial al deducir conclusiones automaticamente Los metadatos facilitan el flujo de trabajo convirtiendo datos automaticamente de un formato a otro Para eso es necesario que los metadatos describan contenido y estructura de los datos 12 Algunos metadatos hacen posible una compresion de datos mas eficaz Por ejemplo si en un video el software sabe distinguir el primer plano del fondo puede usar algoritmos de compresion diferentes y asi mejorar la cuota de compresion 13 Otra idea de aplicacion es la presentacion variable de datos Si hay metadatos senalando los detalles mas importantes un programa puede seleccionar la forma de presentacion mas adecuada Por ejemplo si un telefono movil sabe donde esta localizada una persona en una imagen tiene la posibilidad de reducirlo a las dimensiones de su pantalla Del mismo modo un navegador puede decidir presentar un diagrama a su usuario ciego en forma tactil o leida 14 Clasificacion EditarLos metadatos se clasifican usando tres criterios Contenido Subdividir metadatos por su contenido es lo mas comun Se puede separar los metadatos que describen el recurso mismo de los que describen el contenido del recurso Es posible subdividir estos dos grupos mas veces por ejemplo para separar los metadatos que describen el sentido del contenido de los que describen la estructura del contenido o los que describen el recurso mismo de los que describen el ciclo vital del recurso Variabilidad Segun la variabilidad se puede distinguir metadatos mutables e inmutables Los inmutables no cambian no importa que parte del recurso se vea por ejemplo el nombre de un fichero Los mutables difieren de parte a parte por ejemplo el contenido de un video 15 Funcion Los datos pueden ser parte de una de las tres capas de funciones subsimbolicos simbolicos o logicos Los datos subsimbolicos no contienen informacion sobre su significado Los simbolicos describen datos subsimbolicos es decir anaden sentido Los datos logicos describen como los datos simbolicos pueden ser usados para deducir conclusiones logicas es decir anaden comprension 16 Ciclo de vida EditarEl ciclo de vida de los metadatos comprende las fases creacion manipulacion y destruccion El analisis minucioso de cada una de las etapas saca a la luz asuntos significativos Creacion Editar Se pueden crear metadatos manualmente semiautomaticamente o automaticamente El proceso manual puede ser muy laborioso dependiente del formato usado y del volumen deseado hasta un grado en el que los seres humanos no puedan superarlo Por eso el desarrollo de utillaje semiautomatico o automatico es mas que deseable En la produccion automatica el software adquiere las informaciones que necesita sin ayuda externa Aunque el desarrollo de algoritmos tan avanzados esta siendo objeto de investigacion actualmente no es probable que la computadora vaya a ser capaz de extraer todos los metadatos automaticamente En vez de ello se considera la produccion semiautomatica mas realista aqui un servidor humano sostiene algoritmos autonomos con la aclaracion de inseguridades o la proposicion de informaciones que el software no puede extraer sin ayuda Hay muchos expertos que se encargan del diseno de herramientas para la creacion de metadatos pero que ignoran cuestionar este proceso Segun los que no evitan el asunto la generacion no debe comenzar despues de la terminacion de un recurso sino que debe hacerse durante la fabricacion hay que archivar los metadatos tan pronto como se originan con los conocimientos especiales del productor para evitar una laboriosa reconstruccion posterior Por eso se tiene que integrar la produccion de metadatos en el procedimiento de fabricacion del recurso 15 Manipulacion Editar Si los datos cambian los metadatos tienen que cambiar tambien Aqui se hace la pregunta quien va a adaptar los metadatos Existen modificaciones que pueden ser manejadas de forma sencilla y automatica pero hay otras donde la intervencion de un servidor humano es indispensable La metaproduccion el reciclaje de partes de recursos para crear otros recursos demanda atencion particular La fusion de los metadatos afiliados no es trivial especialmente si se trata de informacion con relevancia juridica como por ejemplo la gestion digital de derechos Destruccion Editar Ademas hay que investigar la destruccion de metadatos En algunos casos es conveniente eliminar los metadatos junto con sus recursos en otros es razonable conservar los metadatos por ejemplo para supervisar cambios en un documento de texto Metadatos en la informatica EditarLos metadatos han cobrado gran relevancia en el mundo de Internet por la necesidad de utilizar los metadatos para la clasificacion de la enorme cantidad de datos Ademas de la clasificacion los metadatos pueden ayudar en las busquedas Por ejemplo si buscamos un articulo sobre vehiculos este dato tendra sus correspondiente metadatos clave adjuntos como 4 ruedas motor etc Otros ejemplos de usos de metadatos en la informatica Metatags en HTML etiquetas con informacion sobre el propio documento web autor editor codificacion etc Informacion en el propio sistema de ficheros HFS o ReiserFS por nombrar dos Se ven completados por los buscadores inteligentes Beagle o Spotlight que saben reconocer estos metadatos Clasificaciones de fotos F Spot Picasa o iPhoto por ejemplo Clasificadores de canciones contienen metadatos sobre las canciones bien en MP3 o en CD de audio en un formato llamado ID3 Por ejemplo iTunes y Rhythmbox Almacenamiento EditarHay dos posibilidades para almacenar metadatos depositarlos internamente en el mismo documento que los datos o depositarlos externamente en su mismo recurso Inicialmente los metadatos se almacenaban internamente para facilitar la administracion Hoy por lo general se considera mejor opcion la localizacion externa porque hace posible la concentracion de metadatos para optimizar operaciones de busqueda Por el contrario existe el problema de como se liga un recurso con sus metadatos La mayoria de los estandares usa URIs la tecnica de localizar documentos en la World Wide Web pero este metodo propone otras preguntas por ejemplo que hacer con documentos que no tienen URI Codificacion Editar Los primeros y mas simples formatos de los metadatos usaron texto no cifrado o la codificacion binaria para almacenar metadatos en ficheros Hoy es comun codificar metadatos usando XML Asi son legibles tanto por seres humanos como por computadoras Ademas este lenguaje tiene muchas caracteristicas a su favor por ejemplo es muy simple integrarlo en la World Wide Web Pero tambien hay inconvenientes los datos necesitan mas espacio de memoria que en formato binario y no esta claro como convertir la estructura de arbol en una corriente de datos Por eso muchos estandares incluyen utilidades para convertir XML en codificacion binaria y viceversa de forma que se unen las ventajas de los dos Vocabularios controlados y ontologias EditarPara garantizar la uniformidad y la compatibilidad de los metadatos muchos sugieren el uso de un vocabulario controlado fijando los terminos de un campo Por ejemplo en caso de sinonimos o interlenguaje hay que acordarse que palabras se usan para evitar que el buscador localice espanol pero no espanola Una ontologia ademas define las relaciones de los terminos del vocabulario para que la computadora puede evaluarlas automaticamente Asi es posible presentar una pagina web sobre Vincent Van Gogh aunque el usuario tecleo pintores neerlandeses usando una ontologia adecuada el buscador comprende que Van Gogh fue un pintor neerlandes Un concepto muy similar a las ontologias son las folksonomias Las ontologias son definidas por expertos del campo que ordenan los terminos pero las folksonomias son definidas por los mismos usuarios Metadatos y objetos de aprendizaje EditarEn el e learning los metadatos se emplean para describir los objetos y recursos de aprendizaje con el objetivo de facilitar las busquedas en los repositorios A menudo la informacion de metadatos de los repositorios de objetos de aprendizaje cumple el estandar IEEE LOM el cual define un conjunto de nueve categorias de informacion que permiten describir los recursos tanto desde el punto de vista didactico como tecnico lo que permite hacer busquedas mucho mas ajustadas que permitiran a los usuarios profesores que componen un nuevo curso con materiales existentes o alumnos interesados en aprender sobre un cierto tema obtener resultados mas ajustados a los criterios de busqueda introducidos Los metadatos son una parte esencial del paradigma de los objetos de aprendizaje puesto que La reutilizacion de objetos de aprendizaje se basa en la creacion y uso de metadatos descripciones a menudo externas a los propios recursos Los metadatos si se proporcionan en los lenguajes adecuados permiten desarrollar novedosas herramientas tecnologicas que facilitan la busqueda y manipulacion de los objetos de aprendizaje Facilitan la recuperacion de la informacion al describir el contenido y sus relaciones con otros recursos Facilitan la interoperabilidad ya que hacen mas facil compartir e intercambiar informacion Simplifican la gestion y el almacenamiento pues permiten guardar informacion sobre el ciclo de vida de los recursos Ayudan a gestionar adecuadamente y proteger los derechos de propiedad intelectual Los metadatos son por tanto un elemento de valor fundamental Un recurso digital con un diseno pedagogico excelente no es per se un buen objeto de aprendizaje sino que lo sera en la medida en que los metadatos que lo describan sean tambien de calidad Paradatos EditarSe conoce como paradatos al conjunto de datos que se genera durante la interaccion entre un usuario y un recurso o servicio de un escenario educativo un entorno virtual de aprendizaje repositorio red social etcetera En funcion del recurso o servicio accedido y las operaciones realizadas con el mismo los paradatos generados contendran mas o menos informacion Esta informacion se puede almacenar para ser posteriormente analizada con el objetivo de comprender mejor como los usuarios interactuan en dicho escenario educativo detectando posibles problemas asi como oportunidades de mejora tanto del propio escenario educativo y de las herramientas utilizadas como del entendimiento del proceso que siguen los usuarios en el mismo A partir del analisis realizado es posible entonces construir entre otros sistemas de recomendacion esquemas de reputacion visualizaciones de la interaccion etc Por ejemplo si un usuario se descarga un documento de un repositorio de objetos de aprendizaje sera posible saber que el usuario U ha descargado el documento D en el momento T Esta informacion puede usarse para detectar aquellos recursos mas descargados o por el contrario aquellos que nunca son accedidos por los usuarios pero tambien conocer en que epocas del semestre academico se produce una mayor utilizacion del repositorio Otra posibilidad es si un usuario U evalua un recurso R con una valoracion X en el momento T por ejemplo un comentario en un grupo de Facebook Esto permite conocer los comentarios mejor o peor valorados por los usuarios asi como los usuarios mas activos En general el objetivo es guardar la interaccion de los usuarios con el sistema en forma de tuplas U T S R X un usuario U en el momento T utiliza un servicio S sobre un recurso R con un resultado X Esta es la minima informacion que debe ser almacenada para su posterior analisis Almacenamiento de paradatos Editar Dado que la interaccion en un entorno virtual de aprendizaje suele realizarse mediante el uso de un navegador web un usuario que visita los espacios ofrecidos por el mismo deja un rastro en forma de accesos a paginas web que quedan recogidos en los ficheros de registro en ingles log files de los servidores web que soportan el sistema Por lo tanto parece factible analizar los ficheros de registro para extraer la informacion relativa a la interaccion El problema no obstante es que estos ficheros contienen muchas mas entradas relativas a la disposicion de los elementos que forman una pagina web que realmente relacionadas con el propio resultado de la interaccion de los usuarios la cual debe ser calculada a partir de la secuencia de saltos capturada en los ficheros de registro El coste computacional de analizar ficheros de registro es muy elevado contienen millones de lineas de registro y no es sencillo cuando se trata de sistemas complejos con multiples servidores donde el rastro dejado por un usuario puede estar fragmentado en diferentes ficheros Por lo tanto si es necesario recoger paradatos para su analisis posterior es mejor que el sistema sea disenado especificamente con un servicio de recogida enfocado a almacenar solamente la informacion requerida para el analisis reduciendo el tamano necesario asi como el tiempo de proceso En funcion del objetivo del analisis los paradatos pueden almacenarse dentro de los metadatos de un recurso dentro del perfil del usuario o bien lo mas habitual en una tabla o base de datos en funcion de su complejidad separada Critica y problemas asociados al uso de los metadatos EditarAlgunos expertos critican fuertemente el uso de metadatos Sus argumentos mas sustanciosos son Los metadatos son costosos y necesitan demasiado tiempo Las empresas no van a producir metadatos porque no hay demanda y los usuarios privados no van a invertir tanto tiempo Los metadatos son demasiado complicados La gente no acepta los estandares porque no los comprende y no quiere aprenderlos Los metadatos dependen del punto de vista y del contexto No hay dos personas que anadan los mismos metadatos Ademas los mismos datos pueden ser interpretados de manera totalmente diferente dependiendo del contexto Los metadatos son ilimitados Es posible adherir mas y mas metadatos utiles y no hay fin Los metadatos son superfluos Ya hay buscadores potentes para textos y en el futuro la tecnica query by example busqueda basada en un ejemplo va a mejorarse tanto para localizar imagenes como para musica y video Algunos estandares de metadatos estan disponibles pero no se aplican los criticos lo consideran una prueba de las carencias del concepto de metadatos Hay que notar que este efecto tambien puede ser causado por insuficiente compatibilidad de los formatos o por la enorme diversidad que amedrenta a las empresas Fuera de eso hay formatos de metadatos muy populares 8 Si bien la inclusion de metadatos es necesaria para facilitar y potenciar un buen numero de tareas importantes tambien existen problemas asociados al uso de los mismos Algunos de los problemas mas citados en la literatura cientifica se resumen en los siguientes puntos Falta de complecion introducir metadatos es a menudo una tarea ingrata y que requiere un esfuerzo considerable Esto lleva a una cierta tendencia a no completar o a completar deficientemente los registros de metadatos ya que las organizaciones bien no perciben adecuadamente la necesidad de ofrecer registros de metadatos completos o no pueden hacer frente a los altos costes en terminos de esfuerzo de completar sus colecciones Este problema es mas patente cuando el numero de objetos de aprendizaje a anotar es importante colecciones de miles de objetos de aprendizaje o cuando el numero de elementos de metadatos a rellenar es elevado por encima de la veintena Dificultades de interoperabilidad algunas informaciones de metadatos descansan en el uso de vocabularios colecciones de terminos cerradas cuyos elementos se han de emplear obligatoriamente para consignar la informacion relativa al elemento de metadatos en cuestion Los estandares permiten utilizar distintos vocabularios para un elemento de metadatos por lo que estos pueden variar de una institucion a otra causando dificultades para intercambiar recursos para que sistemas externos operen sobre metadatos con distinto origen etc Asi por ejemplo la informacion para el elemento 5 8 Dificultad del estandar IEEE LOM ha de escogerse segun el estandar IEEE LOM de la siguiente lista de terminos muy facil facil medio dificil muy dificil Sin embargo el propio estandar IEEE LOM permite utilizar otro vocabulario si se estima oportuno por lo que una cierta institucion podria simplificar el numero de categorias a 3 ampliarlo a 10 para ofrecer una escala mas detallada o elegir otra escala mas adecuada a su contexto tal como por ejemplo basico basico necesita apoyo imprescindible apoyo externo complejo Inconsistencia semantica y otros interesantes problemas derivados de los estandares establecidos no es infrecuente observar como dos instituciones distintas ofrecen informaciones diferentes para el mismo elemento de metadatos a menudo por falta de claridad del estandar de metadatos utilizado Tomando como ejemplo el estandar IEEE LOM algunos elementos como el elemento 5 8 Dificultad dependen en gran medida de la opinion subjetiva de la persona que crea el registro de metadatos y en consecuencia estan destinados a ser inconsistentes con registros creados por otras personas pues uno podria considerar dificil lo que para otro es muy dificil Otro problema similar es la incompletitud semantica es decir la introduccion de informacion incompleta para un cierto elemento de metadatos no proporcionando toda la informacion que seria posible y deseable ofrecer Estan orientados a humanos los metadatos son descripciones textuales que las personas interpretamos facilmente Sin embargo a los sistemas y aplicaciones informaticas no les resulta sencillo procesar esta informacion para ofrecer servicios anadidos ya que los metadatos no han sido escritos para que los entiendan maquinas Asi resulta dificil programar un buscador que priorice los resultados de una busqueda de objetos de aprendizaje en un repositorio en funcion de por ejemplo la informacion sobre derechos de acceso elemento LOM 6 2 Derechos o de su cobertura geografica o temporal elemento 1 8 Cobertura sencillamente porque dicha informacion esta en un texto escrito en un lenguaje humano del que es dificil extraer la informacion buscada es preciso procesar el texto mediante complejas tecnicas de analisis linguistico dividirlo en sus partes esenciales analizar cada parte y extraer la informacion etc teniendo siempre en cuenta que en textos como la descripcion de la cobertura puede haber localismos omisiones obvias para las personas pero incomprensibles para una maquina o cualesquiera otras complejidades propias de los lenguajes humanos Formatos y estandares EditarHay dos grupos que impulsan el desarrollo de formatos de metadatos la tecnica multimedia y la web semantica El destino de la tecnica multimedia es describir un singular recurso de multimedia el de la web semantica la descripcion de recursos de cada tipo y ademas el encadenamiento de los conocimientos Los formatos mas populares y grandes son ID3 hace posible la notacion de metadatos muy sencillos tales como titulo e interprete en ficheros de audio MP3 El formato es muy popular y demuestra que los metadatos pueden ser utiles MPEG 7 MPEG 21 TV Anytime EXIF Dublin Core LOM utilizado en los objetos de aprendizaje Marco de descripcion de recursos RDF RDF Schema OWL NewsML SportsML ONIX for Books estandar utilizado en la industria editorial como un medio de transmision de los metadatos de los libros necesarios para el comercio ISO 19115 norma que regula los metadatos de la informacion geografica Vease tambien EditarDato Infraestructura de Datos Espaciales Objeto de aprendizaje EstandarizacionReferencias Editar Real Academia Espanola y Asociacion de Academias de la Lengua Espanola meta Diccionario de la lengua espanola 23 ª edicion Real Academia Espanola y Asociacion de Academias de la Lengua Espanola dato Diccionario de la lengua espanola 23 ª edicion Senso Jose Antonio Rosa Pinero Alberto de la 2003 El concepto de metadato Algo mas que descripcion de recursos electronicos Ciencia da Informacao vol 32 n 2 95 106 Tim Bray RDF and Metadata 9 junio de 1998 visitado 29 mayo de 2006 Tom Sheldon Linktionary Entrada Metadata 2001 visitado 29 mayo de 2006 A Steinacker A Ghavam R Steinmetz Metadata Standards for Web Based Resources IEEE MultiMedia enero marzo de 2001 W3C Ralph Swick Metadata Activity Statement 2002 visto 29 mayo de 2006 a b D C A Bultermann Is It Time for a Moratorium on Metadata IEEE Multimedia 11 4 10 17 IEEE Computer Society Press Los Alamitos Ca USA octubre diciembre de 2004 W R Durrell Data Administration A Practical Guide to Data Administration McGraw Hill 1985 SIATAC Archivado desde el original el 21 de noviembre de 2008 Consultado el 22 de enero de 2019 Understanding Metadata C Wroe C Goble M Greenwood P Lord S Miles J Papay T Payne L Moreau Automating Experiments Using Semantic Data on a Bioinformatics Grid IEEE Intelligent Systems 19 1 48 55 enero febrero de 2004 H Kosch L Boszormenyi M Doller M Libsie P Schojer A Kofler The Life Cycle of Multimedia Metadata IEEE MultiMedia 12 1 IEEE Computer Society Press Los Alamitos Ca USA enero de 2005 M Horstmann M Lorenz A Watkowski et al Automated interpretation and accessible presentation of technical diagrams for blind people The New Review of Hypermedia and Multimedia 10 29 141 163 Taylor amp Francis Inc Pa USA 2004 a b J R Smith P Schirling Metadata Standards Roundup IEEE MultiMedia 13 2 84 88 IEEE Computer Society Press Los Alamitos Ca USA avril 2006 G Stamou J v Ossenbruggen J Pan G Schreiber Multimedia Annotations on the Semantic Web IEEE MultiMedia 13 1 86 90 IEEE Computer Society Press Los Alamitos Ca USA enero marzo de 2006Enlaces externos EditarVideo educativo de metadatos Datos Q180160 Multimedia Metadata Coordinacion Wikimedia user groups Agreement and code of conduct Obtenido de https es wikipedia org w index php title Metadatos amp oldid 137791296, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos