Acciones

Diferencia entre revisiones de «Metadata»

De iMMAP-Colombia Wiki

 
Línea 4: Línea 4:
 
#una definición
 
#una definición
 
#una estructura
 
#una estructura
y, # la administración de archivos de datos con todos sus contenidos en un contexto para facilitar el uso de los datos capturados para uso en el futuro.
+
#la administración de archivos de datos con todos sus contenidos en un contexto para facilitar el uso de los datos capturados para uso en el futuro.
  
 
Las paginas web frecuentemente incluyen a metadatos en el formato de "metatags".  Metatags con descripciones y palabras claves se utiliza en muchos casos para describir el contenido de una página Web.  La mayoría de buscadores utilizan a estos datos cuando agregan a paginas a su índice de búsqueda.
 
Las paginas web frecuentemente incluyen a metadatos en el formato de "metatags".  Metatags con descripciones y palabras claves se utiliza en muchos casos para describir el contenido de una página Web.  La mayoría de buscadores utilizan a estos datos cuando agregan a paginas a su índice de búsqueda.
Línea 17: Línea 17:
 
*que [[estándar]] se utiliza
 
*que [[estándar]] se utiliza
  
 +
En varios formatos, los metadatos han sido utilizados como un medio de catalogar la información archivada.  Un ejemplo de una forma antigua de los metadatos es el Sistema Dewey utilizado por las bibliotecas para indexar los libros.  En este sistema, los datos encontrados en tarjetas incluyeron el nombre del libro, su autor, el tema, un resumen pequeño y tipicamente un sistema alfanumérico abreviado indicando la ubicación del libro en repisas particulares.  Tal dato permite clasificar, agregar e identificar los libros para encontrarlos rapidamente. 
  
 +
=== Creación de los metadatos ===
 +
Los metadatos pueden ser generados a través de procesamiento de información automatizado o con trabajo manual.  Metadatos elementales capturados por los computadores pueden incluir informació nsobre cuando se creó un archivo, quien lo creó, cuando fue actualizado la última vez, su tamaño y su extensión.
  
Metadata definition provides information about the distinct items, such as:
+
== Estructuras de metadatos ==
* means of creation,
+
Los metadatos tipicamente se estructuran según conceptos estandardizados utilizando una esquema bien definida, incluyendo: [[estandares de metadatos]] y modelación de metadatos. Herramientas como [[vocabulario controlado]], [[taxonomía]], [[tesaurus]], [[diccionarios de datos]] y un [[registro de metadatos]] pueden ser utilizados para estandardizar los metadatos aún más.
* purpose of the data,
 
* time and date of creation,
 
* creator or author of data,
 
* placement on a network (electronic form) where the data was created,
 
* what [[standard]]s used
 
* etc.
 
For example: The purpose of a [[digital image]] created may include metadata that describes how large the picture is, the color depth, the image resolution, when the image was created, and other data. A text document's metadata may contain information about how long the document is, who the author is, when the document was written, and a short summary of the document.
 
  
In various form metadata has been used in so far as a means of cataloging information archived. An example of an earlier form of metadata is the Dewey Decimal System employed by libraries to index books. In this system, the data found on small 3x5 inch (A7) sized cards with the name of the book, its author, subject matter, a brief synopsis and typically an abbreviated alpha- numeric system indicating the location of the book on particular shelves. Such data helps classify, aggregate and identify the book(s) in question to find quickly.  Another form of older metadata collection is the use by US Census Bureau in what is known as the “Long Form." The Long Form asks questions that are used to create demographic data to create patters and to find patterns of distribution. 
+
=== Sintaxis de metadatos ===
<ref>{{Cite web
+
Los sintaxis de los metadatos hacen referencia a las reglas creadas para estructurar los campos o elementos de los metadatos.<ref>{{Cite web
| title = AGLS Metadata Element Set - Part 2: Usage Guide - A non-technical guide to using AGLS metadata for describing resources
 
| author = National Archives of Australia
 
| year = 2002
 
| url = http://www.naa.gov.au/records-management/publications/agls-element.aspx
 
| accessdate = 17 March 2010}}
 
  </ref> The term was coined in 1968 by Philip Bagley, one of the pioneers of [[Information retrieval|computerized document retrieval]].<ref>{{Citation
 
|last=Bagley
 
|first=Philip
 
|title=Extension of programming language concepts
 
|year=1968
 
|month=Nov
 
|publisher=University City Science Center
 
|location=Philadelphia
 
}}</ref><ref>"The notion of "metadata" introduced by Bagley". {{Citation
 
| last = Solntseff
 
| first = N
 
| last2 = Yezerski
 
| first2 = A
 
| year = 1974
 
| title = A survey of extensible programming languages
 
| series = Annual Review in Automatic Programming
 
| publisher = Elsevier Science Ltd
 
| volume = 7
 
| pages = 267-307
 
| doi = 10.1016/0066-4138(74)90001-9
 
}}</ref> Since then the fields of information management, information science, information technology, librarianship and GIS have widely adopted the term. In these fields the word metadata is defined as “data about data”.<ref  name=NISO>{{Cite web
 
| last = NISO
 
| authorlink =NISO
 
| title = Understanding Metadata
 
| publisher = NISO Press
 
| date =
 
| url = http://www.niso.org/publications/press/UnderstandingMetadata.pdf
 
| isbn = 1-880124-62-9
 
| accessdate = 05 January 2010 }}
 
</ref> While this is the generally accepted definition, various disciplines have adopted their own more specific explanation and uses of the term.
 
 
 
For the purposes of this article, an "object" refers to any of the following:
 
*a physical item such as a book, CD, DVD, map, chair, table, flower pot, etc
 
*an electronic file such as a digital image, digital photo, document, program file, database table etc
 
 
 
'''Photographic Metadata Definition:''' 
 
Information written into a digital photo file that will identify who owns it, copyright & contact information, what camera created the file, along with exposure information and descriptive information such as keywords about the photo, making the file searchable on the computer and/or the Internet.  Some metadata is written by the camera and some is input by the photographer and/or software after downloading to a computer.
 
 
 
Photographic Metadata Standards are governed by organizations that that develop the following standards. They include, but are not limited to:
 
*[[IPTC Information Interchange Model]] IIM (International Press Telecommunications Council),
 
*IPTC Core Schema for XMP,
 
*[[Extensible Metadata Platform|XMP]] - Extensible Metadata Platform (an Adobe standard)
 
*[[Exif]] - Exchangeable image file format, Maintained by CIPA (Camera & Imaging Products Association) and published by JEITA (Japan Electronics and Information Technology Industries Association)
 
*[[Dublin Core]] (Dublin Core Metadata Initiative -DCMI)
 
*[[PLUS]] (Picture Licensing Universal System)
 
 
 
=== Creation of Metadata ===
 
 
 
Metadata can be created either by automated information processing or by manual work. Elementary metadata captured by computers can include information about when a file was created, who created it, when it was last updated, file size and file extension.
 
 
 
== Metadata Structures ==
 
 
 
Metadata is typically structured according to a standardised concept using a well defined metadata scheme, including: [[metadata standards]] and [[Metadata_modeling|metadata models]]. Tools such as [[Controlled_vocabulary|controlled vocabularies]], [[Taxonomy|taxonomies]], [[thesauri]], [[Data_Dictionary|data dictionaries]] and [[Metadata_registry|metadata registries]] can be used to apply further standardisation to the metadata.
 
 
 
=== Metadata Syntax ===
 
 
 
Metadata syntax refers to the rules created to structure the fields or elements of metadata.<ref>{{Cite web
 
 
| last = Cathro
 
| last = Cathro
 
| first = Warwick
 
| first = Warwick
Línea 100: Línea 34:
 
| url = http://www.nla.gov.au/nla/staffpaper/cathro3.html
 
| url = http://www.nla.gov.au/nla/staffpaper/cathro3.html
 
| accessdate = 6 January 2010}}
 
| accessdate = 6 January 2010}}
</ref> A single metadata scheme may be expressed in a number of different markup or programming languages, each of which requires a different syntax. For example, Dublin Core may be expressed in plain text, [[HTML]], [[XML]] and [[Resource Description Framework|RDF]].<ref> {{Cite web
+
</ref>  
 +
Una sola esquema de metadatos puede ser expresada por varios lenguajes de programación, cada uno con sintaxis diferente. Por ejemplo, Dublin Core puede ser expresado en texto plano, [[HTML]], [[XML]] y [[RDF]].<ref> {{Cite web
 
| last = DCMI
 
| last = DCMI
 
| authorlink =Dublin_Core_Metadata_Initiative
 
| authorlink =Dublin_Core_Metadata_Initiative
Línea 108: Línea 43:
 
| accessdate = 6 January 2010}} </ref>
 
| accessdate = 6 January 2010}} </ref>
  
=== Metadata Types ===
+
=== Tipos de Metadatos ===
 
+
Dado que la aplicación de los metadatos es variada cubriendo varios campos de aplicación, hay modelos especializados y aceptados en su agrupación para especificar los tipos de metadatos.  Bretheron y Singley distinguen entre dos clases distintos: metadatos estructurales/control y metadatos de guía.<ref>{{Cite conference
As the metadata application is manifold covering a large variety of fields of application there are nothing but specialised and well accepted models to specify types of metadata.  Bretheron & Singley (1994) distinguish between two distinct classes: structural/control metadata and guide metadata.<ref>{{Cite conference
 
 
| first1 = F. P. | last1 = Bretherton   
 
| first1 = F. P. | last1 = Bretherton   
 
|first2 = P.T. | last2 = Singley
 
|first2 = P.T. | last2 = Singley
Línea 117: Línea 51:
 
| publisher =  
 
| publisher =  
 
| year = 1994}}
 
| year = 1994}}
</ref> '''Structural metadata''' is used to describe the structure of computer systems such as tables, columns and indexes. '''Guide metadata''' is used to help humans find specific items and is usually expressed as a set of keywords in a natural language. According to [[Ralph Kimball]] metadata can be divided into 2 similar categories - Technical metadata and Business metadata. '''Technical metadata''' correspond to internal metadata, '''business metadata''' to external metadata. Kimball adds a third category named '''Process metadata'''. On the other hand, NISO distinguishes between three types of metadata: descriptive, structural and administrative. <ref name=NISO/> '''Descriptive metadata''' is the information used to search and locate an object such as title, author, subjects, keywords, publisher; '''structural metadata''' gives a description of how the components of the object are organised; and '''administrative metadata''' refers to the technical information including file type. Two sub-types of administrative metadata are rights management metadata and preservation metadata.
+
</ref> '''Metadata estructural''' se utiliza para describir la estructura de sistemas de computación tales como tablas, columnas e indices. '''Metadatos de guía''' se utiliza para ayudar a los seres humanos encontrar a itemes específicos y normalmente se expresa con un conjunto de palabras claves en lenguaje natural. Según Ralph Kimball, los metadatos se puede dividir entre 2 categorias parecidas - metadatos tecnicos y metadatos de negocios. '''Metadatos tecnicos''' corresponden a metadatos internos, '''metadatos de negocios''' a metadatos externos. Kimball agrega una tercera categoría nombrada '''metadatos de procesos'''. Por otro lado, NISO distingue entre tres tipos de metadatos: descriptivos, estructurales y administrativos.<ref name=NISO/> '''Metadatos descriptivos''' incluyen a la información utilizada para buscar y ubicar un objeto tal como el título, el autor, los temas, las palabras claves, la casa editorial; '''metadatos estructurales''' da la descripción de cómo los componentes del objeto están organizados; y '''metadatos administrativos''' hacen referencia a la información técnica incluyendo el tipo de archivo. Los dos sub-tipos de metadatos administrativos incluyen a metadatos de manejo de derechos y metadatos de preservación.
  
=== Hierarchical, linear and planar schemata===
+
=== Esquema jerárquica, linear y planar ===
 
+
Las esquemas de los metadatos pueden ser jerárquicas en su naturaleza en donde relaciones existen entre los elementos de los metadatos y los elementos están ubicados tales como relaciones padre-hijo existen entre los elementos.  
Metadata schemas can be hierarchical in nature where relationships exist between metadata elements and elements are nested so that parent-child relationships exist between the elements.  
+
Un ejemplo de una esquema jerárquico de metadatos es el de metadatos de objetos de aprendizaje, en donde los elementos de los metadatos pueden ser poseídos por un elemento 'padre' del metadato. Las esquemas de los metadatos también pueden ser unidimensional, o linear, en donde cada elemento es totalmente discreto con respecto a los demás elementos y clasificados por un solo elemento. Un ejemplo de la esquema linear de metadatos es Dublin Core. Las esquemas de los metadatos frecuentemente incluyen a dos dimensiones, es decir que son planares, en donde cada elemento es totalmente discreto con respecto a los demás elementos pero clasificados según los dos dimensiones ortogonales.<ref>{{Cite web
An example of a hierarchical metadata schema is the [[Learning_object_metadata|IEEE LOM]] schema where metadata elements may belong to a parent metadata element.
 
Metadata schemas can also be one dimensional, or linear, where each element is completely discrete from other elements and classified according to one dimension only .  
 
An example of a linear metadata schema is [[Dublin_Core_Metadata_Initiative|Dublin Core]] schema which is one dimensional.
 
Metadata schemas are often two dimensional, or planar, where each element is completely discrete from other elements but classified according to two orthogonal dimensions.  
 
<ref>{{Cite web
 
 
| title = Types of Metadata
 
| title = Types of Metadata
 
|publisher = [[University of Melbourne]]
 
|publisher = [[University of Melbourne]]
Línea 134: Línea 63:
 
</ref>
 
</ref>
  
=== Metadata Hypermapping ===
+
=== Hipermapeo de los metadatos ===
 
+
En todos los casos en donde las esquemas de los metadatos pasan la representación planar, algún tipo de hipermapeo es necesario para permitir la visualización de los metadatos según el aspecto escogido y para servir vistas especiales.  El hipermapeo frecuentemente se aplica a la nivelació nde la información geográfica o geológica.<ref>[www.isprs.org/proceedings/XXXII/part4/www.ifp.uni.../kuebler51.pdf THE DESIGN AND DEVELOPMENT OF A GEOLOGIC HYPERMAP PROTOTYPE]</ref>.
In all cases where the metadata schemata exceed the planar depiction, some type of [[Hypermap|hypermapping]] is required to enable display and view of metadata according to chosen aspect and to serve special views. Hypermapping frequently applies to layering of geographical and geological information overlays<ref>[www.isprs.org/proceedings/XXXII/part4/www.ifp.uni.../kuebler51.pdf THE DESIGN AND DEVELOPMENT OF A GEOLOGIC HYPERMAP PROTOTYPE]</ref>.
 
 
 
=== Granularity ===
 
 
 
Granularity is a term that applies to data as well as to metadata. The degree to which metadata is structured is referred to as its [[Granularity#Data_granularity|granularity]].  Metadata with a high granularity allows for deeper structured information and enables greater levels of technical manipulation however, a lower level of granularity means that metadata can be created for considerably lower costs but will not provide as detailed information. The major impact of granularity is not only on creation and capture, but moreover on maintenance. As soon as the metadata structures get outdated, the access to the referred data will get outdated. Hence granularity shall take into account the effort to create as well as the effort to maintain.
 
 
 
== Metadata Standards ==
 
 
 
International standards apply to metadata. Much work is being accomplished in the national and international standards communities, especially [[ANSI]] (American National Standards Institute) and [[ISO]] (International Organization for Standardization) to reach consensus on standardizing metadata and registries.
 
 
 
The core standard is [[ISO]]/[[IEC]] 11179-1:2004 <ref>[http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=39438 ISO/IEC 11179-1:2004 Information technology - Metadata registries (MDR) - Part 1: Framework]</ref> and subsequent standards (see [[ISO/IEC_11179]]). All yet published registrations according to this standard cover just the definition of metadata and do not serve the structuring of metadata storage or retrieval neither any administrative standardisation.
 
 
 
== Metadata Usage ==
 
 
 
=== Statistics and Census Services ===
 
 
 
Standardisation work has had a large impact on efforts to build metadata systems in the statistical community. Several metadata standards are described, and their importance to statistical agencies is discussed. Applications of the standards at the Census Bureau, Environmental Protection Agency, Bureau of Labor Statistics, Statistics Canada, and many others are described. Emphasis is on the impact a metadata registry can have in a statistical agency.
 
 
 
=== Library and Information Science ===
 
 
 
[[Digital_library|Digital libraries]] widely employ metadata in [[Library management system]]. Metadata is used as a means of cataloguing resources such as books, periodicals, papers, CDs, and DVDs. This data is stored in an integrated library management system, [[Library_management_system|ILMS]], using the [[MARC_standards|MARC]] metadata standard. The purpose is the straight querying for quick access to the repository of titles on the queried subject.
 
 
 
Libraries are also using the [[Library_management_system|ILMS]]  to store information about electronic resources including [[Electronic_journal|electronic journals]], [[E-book|e-books]] and [[Website|websites]].  
 
  
Standardisation for library operation is a key topic in international standardisation ([[ISO]]) since decades. Standards for metadata in digital libraries include [[Dublin Core]], [[METS]], [[Metadata_Object_Description_Schema|MODS]], [[Data_Documentation_Initiative|DDI]], [[Digital Object Identifier|ISO standard Digital Object Identifier (DOI)]], [[Uniform Resource Name|ISO standard Uniform Resource Name (URN)]], [[Preservation Metadata: Implementation Strategies (PREMIS)|PREMIS]] schema, and [[Open Archives Initiative Protocol for Metadata Harvesting|OAI-PMH]]. Leading libraries in the world give hints on their metadata standards strategies <ref>[http://www.loc.gov/standards/metadata.html Library of Congress Washington DC on metadata]</ref>, <ref>[www.d-nb.de/standardisierung/.../metadaten.htm Deutsche Nationalbibliothek Frankfurt on metadata]</ref>.
+
=== Granularidad ===
 +
La granularidad es un termino que aplica a los datos tanto como a los metadatos. El grado hasta donde los metadatos están estructurados se refiere como su [[granularidad]]. Los metadatos con alto nivel de granularidad permite una estructura de información mas profunda y mayores niveles de manipulación técnica. Sin embargo, un nivel más bajo de granularidad significa que los metadatos pueden ser creados por un costo considerablemente menor pero no dará una información tan detallada. El impacto mayor sobre la granularidad no es solamente en cuanto a su creación y captura, pero además en su mantenimiento. Tan pronto que se desactualice las estructuras de los metadatos, el acceso a los datos referidos se desactualizan. Por ende, la granularidad tomará en cuenta el esfuerzo de creación además de los esfuerzos para mantenerlo.
  
=== Metadata and the Law ===
+
== Estandares de metadatos ==
 +
Existen estandares internacionales que son aplicables a los metadatos.  Se han logrado mucho en comites nacionales e internacionales de estandares para asi llegar a consensos sobre la estandardización de los metadatos y registros.
  
=== United States ===
+
El estándar más básico es el [[ISO]]/IEC 11179-1:2004<ref>[http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=39438 ISO/IEC 11179-1:2004 Information technology - Metadata registries (MDR) - Part 1: Framework]</ref> y estandares subsecuentes (ver [[ISO/IEC 11179]]).  Todos los registros publicados hasta el momento según este estándar cubren unicamente la definición del metadato y no sirven para estructurar el almacenamiento de los metadatos o su acceso ni tampoco la estandardización administrativa.
  
Problems involving metadata in [[litigation]] in the [[United States]] are becoming widespread.{{when}} Courts have looked at various questions involving metadata, including the discoverability of metadata by parties. Although the Federal Rules of Civil Procedure have only specified rules about electronic documents, subsequent case law has elaborated on the requirement of parties to reveal metadata.<ref>{{Cite journal
+
== Uso de Metadatos ==
  | last = Gelzer
 
  | first = Reed D.
 
  | title = Metadata, Law, and the Real World: Slowly, the Three Are Merging
 
  | journal = Journal of AHIMA
 
  | volume = 79
 
  | issue = 2
 
  | pages = 56–57,64
 
  | publisher = American Health Information Management Association
 
  | date = February 2008
 
  | url = http://library.ahima.org/xpedio/groups/public/documents/ahima/bok1_036537.hcsp?dDocName=bok1_036537
 
  | accessdate = 8 January 2010}}</ref> In October 2009, the [[Arizona Supreme Court]] has ruled that metadata records are public record.<ref>{{Cite news
 
  | last = Walsh
 
  | first = Jim
 
  | title = Ariz. Supreme Court rules electronic data is public record
 
  | newspaper = The Arizona Republic
 
  | location = Arizona, United States
 
  | date = 30 October 2009
 
  | url = http://www.azcentral.com/arizonarepublic/local/articles/2009/10/30/20091030metadata1030.html
 
  | accessdate = 8 January 2010}}
 
</ref>
 
  
Document Metadata is particularly important in legal environments where litigation can request this sensitive information (metadata) which can include many elements of private detrimental data. This data has been linked to multiple lawsuits that have got corporations into legal complications.
+
=== Estadísticas y Servicios del Censo ===
 +
El trabajo de estandardización ha tenido un gran impacto sobre los esfuerzos de crear sistemas de metadatos en la comunidad de estadístas. Varias estándares de metadatos han sido elaborados y su importancia a las organizaciones de estadísticas, como el [[DANE]], se ha discutido.  El énfasis es sobre el impacto de un registro de metadatos en una organización de estadísticas.
  
Using [[metadata removal tool|metadata removal tools]] can mitigate the risks associated with metadata. These clean documents before they are sent outside of the firm. This process partially protects law firms from potentially unsafe leaking of sensitive data through [[Electronic Discovery]]. Removal of metadata alone is only one aspect of [[Sanitization_(classified_information) |redaction]], a technique for which it's infamously necessary to perform thoroughly and completely.
+
=== Las ciencias de información y bibliotecología ===
 +
Las [[bibliotecas digitales]] utilizan a metadatos en un sistema de manejo de bibliotecas. Los metadatos se utilizan como un medio de catalogar los recursos como los libros, las revistas, los trabajos, CDs, y DVDs. Estos datos se almacenan en un sistema integrado de manejo de biblioteca, utilizando estándares [[MARC]]. El propósito es poder buscar para acceso rapido en [[revistas electrónicas]], libros electrónicos y sitios Web.
  
=== Metadata in Healthcare ===
+
La estándardización para el funcionamiento de las bibliotecas es un tema clave en la estandardización internacional [[ISO]] desde hace varias decadas.  Los estandares de los metadatos en las bibliotecas digitales incluyen a Dublin Core, METS, MODS, DDI, DOI, PREMIS y OAI-PMH.  Las bibliotecas más reconocidas del mundo dan pistas sobre sus estrategias en los estandares de los metadatos.<ref>[http://www.loc.gov/standards/metadata.html Library of Congress Washington DC on metadata]</ref>, <ref>[www.d-nb.de/standardisierung/.../metadaten.htm Deutsche Nationalbibliothek Frankfurt on metadata]</ref>.
  
Australian researches in medicine started a lot of metadata definition for applications in health care. That approach offers the first recognised attempt to adhere to international standards in medical sciences instead of defining a proprietary standard under the WHO umbrella first.  
+
== Metadatos en el Internet ==
 +
El formato [[HTML]] se utiliza para definir las paginas web.  Esto permite la inclusión de una serie de tipos de metadatos, desde textos básicos descriptivos, fechas y palabras claves hasta esquemas de metadatos más complejas tales como Dublin Core, e-GMS, y AGLS.<ref>National Archives of Australia, AGLS Metadata Standard, accessed 07 January 2010, [http://www.naa.gov.au/records-management/create-capture-describe/describe/AGLS/index.aspx]</ref> Las paginas también pueden utilizar [[geotags]] con las [[coordenadas geográficas]].  Los metadatos pueden ser incluidos en la cabeza de la pagina o en un archivo separado. El microformato permite que los metadatos pueden ser agregados entre los datos en la pagina de una manera que los usuarios no lo ven, pero los computadores pueden acceder facilmente.
  
The medical community yet did not approve the need to follow metadata standards despite respective research<ref>[ceur-ws.org/Vol-559/Paper1.pdf TIM: A Semantic Web Application for the Specification of Metadata Items in Clinical Research]</ref>
+
Vale la pena anotar que muchos buscadores son cautelosos en utilizar los metadatos en los algoritmos de ranking dada la posibilidad de explotar los metadatos y la práctica de optimización frente a los buscadores para mejorar su posicionamiento.
  
=== Metadata and Data Warehousing ===
+
=== Metadatos Geoespaciales ===
 +
Los metadatos que describen los objetos geográficos (tales como conjuntos de datos, mapas, objetos o simplemente documentos con un componente geoespacial) tienen una historia desde por lo menos 1994 (ver [http://libraries.mit.edu/guides/subjects/metadata/standards/fgdc.html MIT Library page on FGDC Metadata]). Esta clase de metadatos son los [[metadatos geoespaciales]].
  
[[Data warehouse]] (DW) is a repository of an organization's electronically stored data. Data warehouses are designed to manage and store the data whereas the [[Business Intelligence]] (BI) focuses on the usage of data to facilitate reporting and analysis.<ref>Inmon, W.H. Tech Topic: What is a Data Warehouse? Prism Solutions. Volume 1. 1995.  (http://en.wikipedia.org/wiki/Data_warehouse)</ref>
+
== Administración y Manejo de Metadatos ==
  
The purpose of a data warehouse is to house standardized, structured, consistent, integrated, correct, cleansed and timely data, extracted from various operational systems in an organization. The extracted data is integrated in the [[data warehouse]] environment in order to provide an enterprise wide perspective, one version of the truth. Data is structured in a way to specifically address the reporting and analytic requirements.
+
=== Almacenimiento de los Metadatos ===
 +
Los metadatos pueden ser almacenados ''internamente'', en el mismo archivo con los datos, o ''externamente'', en un archivo aparte.  Los metadatos ubicados con el contenido también se refiere como ''metadatos en nido''.  Un repositorio de datos tipicamente almacene los metadatos removidos de los datos.  Ambos formatos tienen sus ventajes y sus desventajas:
 +
*Almacenimiento interno permite transferir los metadatos conjuntamente con los datos que describe; así, los metadatos siempre están a la mano y pueden ser manipulados facilmente.  Esta metodología crear alta redundancia y no permite juntar los metadatos.
 +
*Almacenimiento externo permite juntar los metadatos, por ejemplo en una base de datos, para buscar de manera más eficiente. No existe redundancia y los metadatos pueden ser transferido simultáneamente cuando se envíe.  Sin embargo, dado que muchos formatos utilizan URIs, la metodología de como se conecta los metadatos con sus datos debe ser tratado con cuidado.  Cuando un recurso no tiene un URI, los metadatos solamente pueden ser evaluados cuando existe una conexión al Internet, particularmente en RDF. Así puede ser dificil dar cuenta de que un recurso está reemplazo por otro con el mismo nombre pero otro contenido.
  
An essential component of a [[data warehouse]]/[[business intelligence]] system is the metadata and tools to manage and retrieve metadata. [[Ralph Kimball]]<ref>[[Ralph Kimball]],''The Data Warehouse Lifecycle Toolkit'', Second Edition. New York, Wiley, 2008, ISBN 978-0-470-14977-5, page 10, 115-117,131-132, 140, 154-155</ref>  describes metadata as the DNA of the data warehouse as metadata defines the elements of the [[data warehouse]] and how they work together.
+
También existe una cuestión de formato de los datos: almacenar los metadatos en un formato leíble por las personas, como [[XML]] dado que los usuarios puede entenderlo y editarlo sin herramientas especializadas. Pero por otro lado, estos formatos no están optimizados para capacidad de almacenimiento; puede ser útil almacenar los metadatos en codigo binario para mejorar transferencias y reducir el uso de la memoria.
  
== Metadata on the Internet ==
+
=== Manejo de Bases de Datos ===
 
+
Cada [[base de datos relacional]] tiene sus propios mecanismos para almacenar los metadatos. Ejemplos de base de datos relacionados con sus metadatos incluyen:
The [[HTML]] format used to define web pages allows for the inclusion of a variety of types of metadata, from basic descriptive text, dates and keywords to further advanced metadata schemes such as the [[Dublin Core]], [[e-GMS]], and AGLS<ref>National Archives of Australia, AGLS Metadata Standard, accessed 07 January 2010, [http://www.naa.gov.au/records-management/create-capture-describe/describe/AGLS/index.aspx]</ref> standards. Pages can also be [[geotagging|geotagged]] with [[Geographic coordinate system|coordinates]]. Metadata may be included in the page's header or in a separate file. [[Microformat]]s allow metadata to be added to on-page data in a way that users don't see, but computers can readily access.
+
*Tablas de todas las tablas en una base de datos, sus nombres, tamaños y el número de filas en cada tabla.
 
+
*Tablas de las columnas en cada base de datos, en qué tablas se utilice, y los tipos de los datos almacenados en cada columna.
Interestingly, many search engines are cautious about using metadata in their ranking algorithms due to exploitation of metadata and the practice of search engine optimization, [[Search_engine_optimization|SEO]], to improve rankings, see [[Meta element]] article for further discussion.
+
En terminología de base de datos, este conjunto de metadatos se conoce como el [[catálogo de la base de datos]]. El estándar [[SQL]] especifica que uniforme significa acceso al catálogo, llamado la esquema de información, pero no todas las bases de datos lo implementan, incluso si implementan otros aspectos del estándar SQL. Para un ejemplo de metodologias de acceso de metadatos específicos a las bases de datos, anota los metadatos de Oracle. El acceso programático a los metadatos es posible utilizando APIs tales como JDBC o SchemaCrawler.<ref name=schemacrawler>{{cite web  
 
 
=== Geospatial Metadata ===
 
 
 
Metadata that describe geographic objects (such as datasets, maps, features, or simply documents with a geospatial component) have a history going back to at least 1994 (refer [http://libraries.mit.edu/guides/subjects/metadata/standards/fgdc.html MIT Library page on FGDC Metadata]). This class of metadata is described more fully on the [[Geospatial metadata]] page.
 
 
 
== Metadata Administration and Management ==
 
 
 
=== Metadata Storage ===
 
{{noref|section|date=June 2010}}
 
Metadata can be stored either ''internally'', in the same file as the data, or ''externally'', in a separate file. Metadata that is embedded with content is called ''embedded metadata''. A data repository typically stores the metadata ''detached'' from the data. Both ways have advantages and disadvantages:
 
* Internal storage allows transferring metadata together with the data it describes; thus, metadata is always at hand and can be manipulated easily. This method creates high redundancy and does not allow holding metadata together.
 
* External storage allows bundling metadata, for example in a database, for more efficient searching. There is no redundancy and metadata can be transferred simultaneously when using [[Streaming_media|streaming]]. However, as most formats use [[Uniform_Resource_Identifier|URIs]] for that purpose, the method of how the metadata is linked to its data should be treated with care. What if a resource does not have a URI (resources on a local hard disk or web pages that are created on-the-fly using a content management system)? What if metadata can only be evaluated if there is a connection to the Web, especially when using [[Resource_Description_Framework|RDF?]] How to realize that a resource is replaced by another with the same name but different content?
 
 
 
Moreover, there is the question of data format: storing metadata in a human-readable format such as [[XML]] can be useful because users can understand and edit it without specialized tools. On the other hand, these formats are not optimized for storage capacity; it may be useful to store metadata in a binary, non-human-readable format instead to speed up transfer and save memory.
 
 
 
=== Database Management ===
 
 
 
Each [[relational database]] system has its own mechanisms for storing metadata. Examples of relational-database metadata include:
 
* Tables of all tables in a database, their names, sizes and number of rows in each table.
 
* Tables of columns in each database, what tables they are used in, and the type of data stored in each column.
 
In database terminology, this set of metadata is referred to as the [[database catalog|catalog]]. The [[SQL]] standard specifies a uniform means to access the catalog, called the <code>INFORMATION_SCHEMA</code>, but not all databases implement it, even if they implement other aspects of the SQL standard. For an example of database-specific metadata access methods, see [[Oracle metadata]]. Programmatic access to metadata is possible using APIs such as JDBC, or SchemaCrawler.<ref name=schemacrawler>{{cite web  
 
 
| author=Sualeh Fatehi
 
| author=Sualeh Fatehi
 
| url=http://schemacrawler.sourceforge.net/
 
| url=http://schemacrawler.sourceforge.net/
Línea 238: Línea 112:
 
}}</ref>
 
}}</ref>
  
== See also ==
 
 
{{col-begin}}
 
{{col-break}}
 
* [[Agris: International Information System for the Agricultural Sciences and Technology]]
 
* [[Crosswalk (metadata)]]
 
* [[Data Dictionary]] (aka metadata repository)
 
* [[Dublin Core]]
 
* [[Folksonomy]]
 
* [[ISO/IEC 11179]]
 
* [[Knowledge tag]]
 
* [[Meta element]]
 
* [[Wikiversity:4-b: Metadata|Metadata from Wikiversity]]
 
* [[Metadata discovery]]
 
* [[Metadata facility for Java]]
 
{{col-break}}
 
* [[Metadata publishing]]
 
* [[Metadata registry]]
 
* [[Microcontent]]
 
* [[Microformat]]s
 
* [[Ontology (computer science)]]
 
* [[Official statistics]]
 
* [[Preservation Metadata]]
 
* [[Semantic Web]]
 
*[[SGML]]
 
* [[The Metadata Company]]
 
* [[Universal Data Element Framework]]
 
*[[XSD]]
 
{{col-end}}
 
  
== References ==
+
== Referencias ==
 
{{Reflist}}
 
{{Reflist}}
 
<references/>
 
<references/>
  
== External links ==
+
== Links Externos ==
 
{{Wiktionarypar|metadata}}
 
{{Wiktionarypar|metadata}}
* [http://mercury.ornl.gov/ornldaac Mercury: Metadata Management, Data Discovery and Access], managed by Oak Ridge National Laboratory [[Distributed Active Archive Center]]
+
* [http://mercury.ornl.gov/ornldaac Mercury: Metadata Management, Data Discovery and Access], manejado por Oak Ridge National Laboratory [[Distributed Active Archive Center]]
* [http://www.well.com/~doctorow/metacrap.htm Metacrap: Putting the torch to seven straw-men of the meta-utopia] – [[Cory Doctorow]]'s opinion on the limitations of metadata on the [[Internet]], 2001
+
* [http://www.well.com/~doctorow/metacrap.htm Metacrap: Putting the torch to seven straw-men of the meta-utopia] – La opinión de Cory Doctorow sobre las limitaciones de los metadatos en el Internet
 
* [http://www.anonwatch.com/?p=9 Retrieving Meta Data from Documents and Pictures Online] - AnonWatch
 
* [http://www.anonwatch.com/?p=9 Retrieving Meta Data from Documents and Pictures Online] - AnonWatch
 
* [http://www.niso.org/publications/press/UnderstandingMetadata.pdf Understanding Metadata] - [[NISO]], 2004
 
* [http://www.niso.org/publications/press/UnderstandingMetadata.pdf Understanding Metadata] - [[NISO]], 2004
Línea 291: Línea 136:
 
   | accessdate = 8 January 2010}}
 
   | accessdate = 8 January 2010}}
  
{{Software Engineering}}
+
[[Categoría:Manejo de Datos]]
 
+
[[Categoría:Bibliotecología]]
[[Category:Data management]]
+
[[Categoría:Metadata]]
[[Category:Knowledge representation]]
 
[[Category:Library cataloging and classification]]
 
[[Category:Metadata| ]]
 
[[Category:Technical communication]]
 
 
 
[[ar:بيانات وصفية]]
 
[[az:Metaverilənlər]]
 
[[ca:Metadades]]
 
[[cs:Metadata]]
 
[[da:Metadata]]
 
[[de:Metadaten]]
 
[[et:Metaandmed]]
 
[[el:Μεταδεδομένα]]
 
[[es:Metadato]]
 
[[eo:Meta-dateno]]
 
[[fa:فراداده]]
 
[[fr:Métadonnée]]
 
[[ko:메타데이터]]
 
[[hr:Metapodaci]]
 
[[id:Metadata]]
 
[[it:Metadato]]
 
[[he:Metadata]]
 
[[kn:ಮೆಟಾಡೇಟಾ]]
 
[[lv:Metadati]]
 
[[hu:Metaadat]]
 
[[ml:മെറ്റാഡാറ്റ]]
 
[[ms:Metadata]]
 
[[nl:Metadata]]
 
[[ja:メタデータ]]
 
[[no:Metadata]]
 
[[pl:Metadane]]
 
[[pt:Metadados]]
 
[[ro:Metadată]]
 
[[ru:Метаданные]]
 
[[simple:Metadata]]
 
[[sk:Metadáta]]
 
[[sr:Metapodaci]]
 
[[fi:Metatieto]]
 
[[sv:Metadata]]
 
[[ta:மேனிலைத் தரவு]]
 
[[th:เมทาดาตา]]
 
[[uk:Метадані]]
 
[[ur:Metadata]]
 
[[vi:Siêu dữ liệu]]
 
[[zh:元数据]]
 

Revisión actual del 11:41 23 jun 2010

Un metadato esta definido como datos sobre datos. Aunque esta definición es facil de recordar, no es muy preciso. La fortaleza de esta definición es en reconocer que el metadato también es un dato. Como tal, el metadato puede ser almacenado y manejado entre una base de datos, frecuentemente nombrado un registro o repositorio. Sin embargo, es imposible identificar al metadato solo por mirarlo. No sabemos cuando un metadato es un metadato o solamente datos.<ref>METADATA STANDARDS AND METADATA REGISTRIES: AN OVERVIEW</ref>

Los metadatos son un concepto que aplica principalmente a datos archivados electrónicamente y utilizados para describir:

  1. una definición
  2. una estructura
  3. la administración de archivos de datos con todos sus contenidos en un contexto para facilitar el uso de los datos capturados para uso en el futuro.

Las paginas web frecuentemente incluyen a metadatos en el formato de "metatags". Metatags con descripciones y palabras claves se utiliza en muchos casos para describir el contenido de una página Web. La mayoría de buscadores utilizan a estos datos cuando agregan a paginas a su índice de búsqueda.

Definición de metadatos

La definición de metadatos ofrece información sobre varios elementos, tales como:

  • medio de creación,
  • propósito de los datos,
  • tiempo y fecha de creación,
  • creador o autor del dato,
  • ubicación de una red en donde se creó los datos,
  • que estándar se utiliza

En varios formatos, los metadatos han sido utilizados como un medio de catalogar la información archivada. Un ejemplo de una forma antigua de los metadatos es el Sistema Dewey utilizado por las bibliotecas para indexar los libros. En este sistema, los datos encontrados en tarjetas incluyeron el nombre del libro, su autor, el tema, un resumen pequeño y tipicamente un sistema alfanumérico abreviado indicando la ubicación del libro en repisas particulares. Tal dato permite clasificar, agregar e identificar los libros para encontrarlos rapidamente.

Creación de los metadatos

Los metadatos pueden ser generados a través de procesamiento de información automatizado o con trabajo manual. Metadatos elementales capturados por los computadores pueden incluir informació nsobre cuando se creó un archivo, quien lo creó, cuando fue actualizado la última vez, su tamaño y su extensión.

Estructuras de metadatos

Los metadatos tipicamente se estructuran según conceptos estandardizados utilizando una esquema bien definida, incluyendo: estandares de metadatos y modelación de metadatos. Herramientas como vocabulario controlado, taxonomía, tesaurus, diccionarios de datos y un registro de metadatos pueden ser utilizados para estandardizar los metadatos aún más.

Sintaxis de metadatos

Los sintaxis de los metadatos hacen referencia a las reglas creadas para estructurar los campos o elementos de los metadatos.<ref>Plantilla:Cite web </ref> Una sola esquema de metadatos puede ser expresada por varios lenguajes de programación, cada uno con sintaxis diferente. Por ejemplo, Dublin Core puede ser expresado en texto plano, HTML, XML y RDF.<ref> Plantilla:Cite web </ref>

Tipos de Metadatos

Dado que la aplicación de los metadatos es variada cubriendo varios campos de aplicación, hay modelos especializados y aceptados en su agrupación para especificar los tipos de metadatos. Bretheron y Singley distinguen entre dos clases distintos: metadatos estructurales/control y metadatos de guía.<ref>Plantilla:Cite conference </ref> Metadata estructural se utiliza para describir la estructura de sistemas de computación tales como tablas, columnas e indices. Metadatos de guía se utiliza para ayudar a los seres humanos encontrar a itemes específicos y normalmente se expresa con un conjunto de palabras claves en lenguaje natural. Según Ralph Kimball, los metadatos se puede dividir entre 2 categorias parecidas - metadatos tecnicos y metadatos de negocios. Metadatos tecnicos corresponden a metadatos internos, metadatos de negocios a metadatos externos. Kimball agrega una tercera categoría nombrada metadatos de procesos. Por otro lado, NISO distingue entre tres tipos de metadatos: descriptivos, estructurales y administrativos.<ref name=NISO/> Metadatos descriptivos incluyen a la información utilizada para buscar y ubicar un objeto tal como el título, el autor, los temas, las palabras claves, la casa editorial; metadatos estructurales da la descripción de cómo los componentes del objeto están organizados; y metadatos administrativos hacen referencia a la información técnica incluyendo el tipo de archivo. Los dos sub-tipos de metadatos administrativos incluyen a metadatos de manejo de derechos y metadatos de preservación.

Esquema jerárquica, linear y planar

Las esquemas de los metadatos pueden ser jerárquicas en su naturaleza en donde relaciones existen entre los elementos de los metadatos y los elementos están ubicados tales como relaciones padre-hijo existen entre los elementos. Un ejemplo de una esquema jerárquico de metadatos es el de metadatos de objetos de aprendizaje, en donde los elementos de los metadatos pueden ser poseídos por un elemento 'padre' del metadato. Las esquemas de los metadatos también pueden ser unidimensional, o linear, en donde cada elemento es totalmente discreto con respecto a los demás elementos y clasificados por un solo elemento. Un ejemplo de la esquema linear de metadatos es Dublin Core. Las esquemas de los metadatos frecuentemente incluyen a dos dimensiones, es decir que son planares, en donde cada elemento es totalmente discreto con respecto a los demás elementos pero clasificados según los dos dimensiones ortogonales.<ref>Plantilla:Cite web </ref>

Hipermapeo de los metadatos

En todos los casos en donde las esquemas de los metadatos pasan la representación planar, algún tipo de hipermapeo es necesario para permitir la visualización de los metadatos según el aspecto escogido y para servir vistas especiales. El hipermapeo frecuentemente se aplica a la nivelació nde la información geográfica o geológica.<ref>[www.isprs.org/proceedings/XXXII/part4/www.ifp.uni.../kuebler51.pdf THE DESIGN AND DEVELOPMENT OF A GEOLOGIC HYPERMAP PROTOTYPE]</ref>.

Granularidad

La granularidad es un termino que aplica a los datos tanto como a los metadatos. El grado hasta donde los metadatos están estructurados se refiere como su granularidad. Los metadatos con alto nivel de granularidad permite una estructura de información mas profunda y mayores niveles de manipulación técnica. Sin embargo, un nivel más bajo de granularidad significa que los metadatos pueden ser creados por un costo considerablemente menor pero no dará una información tan detallada. El impacto mayor sobre la granularidad no es solamente en cuanto a su creación y captura, pero además en su mantenimiento. Tan pronto que se desactualice las estructuras de los metadatos, el acceso a los datos referidos se desactualizan. Por ende, la granularidad tomará en cuenta el esfuerzo de creación además de los esfuerzos para mantenerlo.

Estandares de metadatos

Existen estandares internacionales que son aplicables a los metadatos. Se han logrado mucho en comites nacionales e internacionales de estandares para asi llegar a consensos sobre la estandardización de los metadatos y registros.

El estándar más básico es el ISO/IEC 11179-1:2004<ref>ISO/IEC 11179-1:2004 Information technology - Metadata registries (MDR) - Part 1: Framework</ref> y estandares subsecuentes (ver ISO/IEC 11179). Todos los registros publicados hasta el momento según este estándar cubren unicamente la definición del metadato y no sirven para estructurar el almacenamiento de los metadatos o su acceso ni tampoco la estandardización administrativa.

Uso de Metadatos

Estadísticas y Servicios del Censo

El trabajo de estandardización ha tenido un gran impacto sobre los esfuerzos de crear sistemas de metadatos en la comunidad de estadístas. Varias estándares de metadatos han sido elaborados y su importancia a las organizaciones de estadísticas, como el DANE, se ha discutido. El énfasis es sobre el impacto de un registro de metadatos en una organización de estadísticas.

Las ciencias de información y bibliotecología

Las bibliotecas digitales utilizan a metadatos en un sistema de manejo de bibliotecas. Los metadatos se utilizan como un medio de catalogar los recursos como los libros, las revistas, los trabajos, CDs, y DVDs. Estos datos se almacenan en un sistema integrado de manejo de biblioteca, utilizando estándares MARC. El propósito es poder buscar para acceso rapido en revistas electrónicas, libros electrónicos y sitios Web.

La estándardización para el funcionamiento de las bibliotecas es un tema clave en la estandardización internacional ISO desde hace varias decadas. Los estandares de los metadatos en las bibliotecas digitales incluyen a Dublin Core, METS, MODS, DDI, DOI, PREMIS y OAI-PMH. Las bibliotecas más reconocidas del mundo dan pistas sobre sus estrategias en los estandares de los metadatos.<ref>Library of Congress Washington DC on metadata</ref>, <ref>[www.d-nb.de/standardisierung/.../metadaten.htm Deutsche Nationalbibliothek Frankfurt on metadata]</ref>.

Metadatos en el Internet

El formato HTML se utiliza para definir las paginas web. Esto permite la inclusión de una serie de tipos de metadatos, desde textos básicos descriptivos, fechas y palabras claves hasta esquemas de metadatos más complejas tales como Dublin Core, e-GMS, y AGLS.<ref>National Archives of Australia, AGLS Metadata Standard, accessed 07 January 2010, [1]</ref> Las paginas también pueden utilizar geotags con las coordenadas geográficas. Los metadatos pueden ser incluidos en la cabeza de la pagina o en un archivo separado. El microformato permite que los metadatos pueden ser agregados entre los datos en la pagina de una manera que los usuarios no lo ven, pero los computadores pueden acceder facilmente.

Vale la pena anotar que muchos buscadores son cautelosos en utilizar los metadatos en los algoritmos de ranking dada la posibilidad de explotar los metadatos y la práctica de optimización frente a los buscadores para mejorar su posicionamiento.

Metadatos Geoespaciales

Los metadatos que describen los objetos geográficos (tales como conjuntos de datos, mapas, objetos o simplemente documentos con un componente geoespacial) tienen una historia desde por lo menos 1994 (ver MIT Library page on FGDC Metadata). Esta clase de metadatos son los metadatos geoespaciales.

Administración y Manejo de Metadatos

Almacenimiento de los Metadatos

Los metadatos pueden ser almacenados internamente, en el mismo archivo con los datos, o externamente, en un archivo aparte. Los metadatos ubicados con el contenido también se refiere como metadatos en nido. Un repositorio de datos tipicamente almacene los metadatos removidos de los datos. Ambos formatos tienen sus ventajes y sus desventajas:

  • Almacenimiento interno permite transferir los metadatos conjuntamente con los datos que describe; así, los metadatos siempre están a la mano y pueden ser manipulados facilmente. Esta metodología crear alta redundancia y no permite juntar los metadatos.
  • Almacenimiento externo permite juntar los metadatos, por ejemplo en una base de datos, para buscar de manera más eficiente. No existe redundancia y los metadatos pueden ser transferido simultáneamente cuando se envíe. Sin embargo, dado que muchos formatos utilizan URIs, la metodología de como se conecta los metadatos con sus datos debe ser tratado con cuidado. Cuando un recurso no tiene un URI, los metadatos solamente pueden ser evaluados cuando existe una conexión al Internet, particularmente en RDF. Así puede ser dificil dar cuenta de que un recurso está reemplazo por otro con el mismo nombre pero otro contenido.

También existe una cuestión de formato de los datos: almacenar los metadatos en un formato leíble por las personas, como XML dado que los usuarios puede entenderlo y editarlo sin herramientas especializadas. Pero por otro lado, estos formatos no están optimizados para capacidad de almacenimiento; puede ser útil almacenar los metadatos en codigo binario para mejorar transferencias y reducir el uso de la memoria.

Manejo de Bases de Datos

Cada base de datos relacional tiene sus propios mecanismos para almacenar los metadatos. Ejemplos de base de datos relacionados con sus metadatos incluyen:

  • Tablas de todas las tablas en una base de datos, sus nombres, tamaños y el número de filas en cada tabla.
  • Tablas de las columnas en cada base de datos, en qué tablas se utilice, y los tipos de los datos almacenados en cada columna.

En terminología de base de datos, este conjunto de metadatos se conoce como el catálogo de la base de datos. El estándar SQL especifica que uniforme significa acceso al catálogo, llamado la esquema de información, pero no todas las bases de datos lo implementan, incluso si implementan otros aspectos del estándar SQL. Para un ejemplo de metodologias de acceso de metadatos específicos a las bases de datos, anota los metadatos de Oracle. El acceso programático a los metadatos es posible utilizando APIs tales como JDBC o SchemaCrawler.<ref name=schemacrawler>Plantilla:Cite web</ref>


Referencias

<references group=""></references>

<references/>

Links Externos

Plantilla:Wiktionarypar