1 / 71

ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES WEB

ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES WEB. Sesión IV: Metadatos y metainformación. GEMA BUENO DE LA FUENTE UNIVERSIDAD CARLOS III DE MADRID. METADATOS Y METAINFORMACIÓN EN LA AI.

elden
Download Presentation

ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES WEB

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ARQUITECTURA DE LA INFORMACIÓN PARA EL DISEÑO DE SEDES WEB Sesión IV: Metadatos y metainformación GEMA BUENO DE LA FUENTE UNIVERSIDAD CARLOS III DE MADRID

  2. METADATOS Y METAINFORMACIÓN EN LA AI Cualquier repositorio de contenidos Web sin metadatos es como una biblioteca sin un índice. Más que los usuarios, el personal no sabría dónde poner las cosas y encontrarlas de nuevo. Los metadatos son la clave para conseguir que las máquinas guarden los contenidos y los encuentren cuando sea necesario –abriendo las puertas al 80% de la información de una organización que no reside en una base de datos. (Interwoven, 2001) gbueno@bib.uc3m.es

  3. Contenidos • Metadatos para el diseño de sedes web. • Concepto de metadatos ymetainformación. • Marcado procedural y descriptivo. • Metadatos y descripción de loscontenidos de la sede. • Metadatos e indización de contenidos. • Prácticas.

  4. METADATOS Y METAINFORMACIÓN EN LA AI Metadatos para el diseño de sedes Web: Implicaciones, concepto y matices.

  5. ¿Qué son los metadatos/metainformación? • Meta-datos: 'junto a', 'después de', 'entre' o 'con'. • Por definición: información descriptiva 'junto a', 'después de', 'entre' o 'con'(incluso, ‘sobre’) los datos. • Ejemplos tradicionales son: las fichas de catálogo, los registros de una base de datos bibliográfica. • En la Web: información descriptiva (ej. etiquetas META) del contenido de un recurso electrónico. • A pesar de la simplicidad de la definición, los metadatos albergan una gran complejidad, dimensiones e importancia en la arquitectura de la información.

  6. Metadatos son... • Datos que soportan operaciones llevadas a cabo con OBJETOS DE INFORMACIÓN de la Red. • Evitan al usuario la necesidad de tener que poseer un conocimiento completo de las características de los recursos. • Estructuras de organización de la información legibles por máquina. • Destinados a ordenar y describir la información contenida en un e-documento. • Para: hacer útiles los datos.

  7. Metadatos son... ...Datos ... Datos sobre datos ...Descripciones estructuradas de un objeto de información. ... Un conjunto de elementos y atributos para caracterizar la información. ...Estándares para describir objetos de datos discretos, que precisan de una semántica y estructura. Su finalidad es... ... Describir y recuperar información Web. ... Fundamentar SRI de sistemas y servicios de información digital.

  8. Metadatos ¿por qué? • Justificación tradicional: • Para describir la información existente. • Para organizar el conocimiento. • Para poder encontrar y utilizar dicha información y/o conocimiento. • Justificación en entorno Web: • Gran volumen de información en formato electrónico. • Necesidad de aunar recursos en la Web (verticalización de la información: Sedes Web especializadas-Modelos de metadatos específicos). • Valor añadido al Web (AI): Oportunidad de proporcionar a los profesionales servicios de mayor calidad (precisión y relevancía) que Google, etc.

  9. Metadatos ¿para qué?

  10. Metadatos para el diseño de sedes web Búsqueda: Visibilidad y posicionamiento • Metaetiquetas HTML (head) • Promoción del Web (mediante software especializado) • Búsqueda all-the-web: dirigidos a buscadores de carácter global. • Spamming Otras técnicas de cálculo de la relevancia (Google-page rank) • Análisis cibermétricos • Visibilidad a niveles científicos: OAI

  11. Metadatos para el diseño de sedes web Búsqueda: “Findability” • Findability (Facilidad de búsqueda“encontrabilidad”): el arte de conseguir que un usuario encuentre lo que necesita en unaweb (Rosenfeld) • Búsqueda interna en una sede Web: • Motor de búsqueda interno • Clasificación automática (elemento de metadatos de descripción de materias. P. ej. DC.Subject) • Desarrollo: schema de metadatos-sistema de recuperación cualificado orientado a metadatos • Complejidad e interrelación de metadatos orientados a la búsqueda (all-the-web y/o Findability): Ej.

  12. Ejemplo: AVEL http://avel.edu.au

  13. Metadatos para el diseño de sedes web Descripción de contenidos • Objetivo: gestión flexible de contenidos distribuidos. • Precisan el carácter de los contenidos del sitio web o de las páginas que lo componen: • Alcance • Objetivos particulares de una sede (dominios/comunidades). Distintos modelos de metadatos (Web disciplinar) • A qué usuarios están dirigidos (valoración) • Descripción multilingüe • Usuarios / utilidad de los datos • Dos niveles: • Nivel de descripción del recurso: formal • Nivel de descripción temática: ontologías, tesauros (metadatos dependientes del contenido)

  14. Metadatos para el diseño de sedes web Agregación y sindicación de contenidos • Parte de la AI en CMS y Bloggers. • Importancia en la actualización de contenidos. Compartir información de noticias • RSS (Rich/RDF Site Summary): formato de intercambio de contenidos para crear canales de publicación que pueden leerse con programas específicos tipo: NewsGator, Freereader (ej.) • Conlleva otro tipo de “visibilidad” Web.

  15. Metadatos para el diseño de sedes web Accesibilidad • Los metadatos mejoran la accesibilidad al contenido: • WCAG (Web Content Accesibility Guidelines) http://www.w3.org/TR/WAI-WEBCONTENT/ Pauta 13: Proporcione mecanismos claros de navegación. Verificación 13.2. Proporcione metadatos para añadir información semántica a las páginas y sitios web. (Nivel AA). • Acceso vs. Accesibilidad: “estar” accesible (disponible) / “ser” accesible.

  16. Metadatos para el diseño de sedes web Accesibilidad • EARL: Evaluation And Report Language 1.0 Schema • Documento de trabajo del W3C: http://www.w3.org/TR/EARL10/ • Es un lenguaje (vocabulario RDF Resource Description Framework) para expresar un tipo de metainformación específica: los resultados de los test de accesibilidad. • EARL es un lenguaje sencillo que permite establecer resultados de test para cualquier cuestión de accesibilidad analizada (web, herramienta de autor, etc.) según un conjunto de criterios. • Al igual que otras expresiones RDF está compuesto de tres elementos atributo-propiedad-valor (sujeto-verbo-predicado): Assertor-asserts-assertion. • Elementos básicos: Assertor, Assertion, TestSubject, TestMode, TestCase, TestResult, ValidityLevel, ConfidenceLevel, Software y WebContent.

  17. Metadatos para el diseño de sedes web Web Semántica (SW) • Conjunto de tecnologías para la organización y representación del conocimiento digital. • Objetivos: • Proporcionar un acceso inteligente a la información heterogénea y distribuida en la WWW, posibilitando a los agentes de software mediar entre las necesidades de los usuarios y los recursos de información disponibles. • Creación de una Web de datos con significado, de tal forma que un programa de ordenador pueda aprender tanto acerca de lo que quieren decir los datos, como acerca de la información necesaria para procesarlos. • Procesamiento global e interoperable de la información Web (marcado semántico XML + estructuras de metadatos). http://www.w3.org/2001/sw/

  18. Metadatos para el diseño de sedes web Web Semántica (SW) • Lenguajes formales como: DAML+OIL, RDF, OWL • Metadatos y esquemas de metadatos (DCMI: infraestructura operacional de la SW). • Ontologías: • tanto específicas de un dominio, como ontologías de alto nivel, de tal forma que se proporcionen relaciones entre ontologías para la recuperación, el intercambio y la integración de la información interdisciplinar en la Web http://www.w3.org/2001/sw/

  19. Metadatos para el diseño de sedes web Web Semántica (SW) http://www.w3.org/2001/sw/

  20. Metadatos para el diseño de sedes web Servicios Web (WS) http://www.w3.org/2002/ws/ • Los Servicios Web son aplicaciones de software que pueden localizarse y recuperarse, describirse y accederse gracias a XML y a protocolos web normalizados [HTTP y SOAP], a través de intranets, extranets y de Internet. • Objetivo: permitir que un usuario (humano o aplicación software) pueda lanzar una búsqueda de información sobre gestores de contenidos en un dominio de aplicación (agencias de noticias, portales B2B, etc.). • Funciones de los metadatos en WS: • Sindicación • Transformación de datos • Traducción a otros idiomas • Creación y autoría de contenidos distribuidos (interoperabilidad). • XML+distribución de contenidos+gestión de metadatos.

  21. Recordemos...DIMENSIONES DEL DISEÑO DE SEDES WEB Recordemos...DIMENSIONES DEL DISEÑO DE SEDES WEB programación BACK-END software hardware Contenidos estructura navegación rotulado búsqueda y feedback FRONT-END (Arquitectura de la Información) prototipado

  22. http://dublincore.org/index.shtml.rdf Ejemplo de codificación de metadatos en una sede Web (DCMI)

  23. Ejemplo de codificación de metadatos en una sede Web (DCMI) http://dublincore.org/index.shtml.rdf

  24. Ejemplo de codificación de metadatos en una sede Web (DCMI) Metadatos descriptivos embebidos (HTML) Metadatos descriptivos (RDF vinculado link rel) Metadatos para la sindicación de noticias (RSS)

  25. Ejemplo de codificación de metadatos en una sede Web (DCMI) http://dublincore.org/news.rss Metadatos para la sindicación de noticias (RSS)

  26. Edición digital: Publicación de contenidos Organización de contenidos Identificar y localizar cada DLO Descripción de DLOs (Metadatos) Preservar y conservar el cont. digital Facilitar la accesibilidad Recuperación de DLOs Interoperabilidad entre sistemas distribuidos Visión particular de la AI y función de los metadatos

  27. Tipos de metadatos • Clasificación Funcional: • Administrativos • Descriptivos • Conservación • Técnicos • Uso • Esquema Dublin Core: • Administrativos • Descriptivos • Estructurales

  28. Estado actual de la teoría de metadatos La estructura y semántica de los modelos de metadatos aplicados a la recuperación es factible, aplicable y operativa en entornos de información abarcables, definidos y finitos (p. ej. una sede Web).

  29. Búsqueda en BD propia Búsqueda texto completo Búsqueda local Búsqueda en SRII Búsqueda global Integrada Búsqueda global Definición de tipos de metadatos (finalidad) 3 Niveles de metainformación: • Metadatos recuperación-sistema • Metaetiquetas de búsqueda Web • Metadatos de usuario/servicio

  30. METADATOS Y METAINFORMACIÓN EN LA AI Marcado semántico y procedural

  31. WWW: Marcado/edición digital • Marcado de procedimiento o procesado (procedural): relativo a la apariencia física o de formato, restrictivo a cada sistema de edición electrónica de documentos, que no tiene ninguna implicación expresa para el contenido del documento. • Marcado descriptivo o declarativo: identifica los elementos estructurales de un documento, determinando su estructura lógica. Se describe la estructura y/o el contenido de un documento • el contenido de los documentos marcados descriptivamente puede reutilizarse con distintas finalidades (p. ej., la identificación de los elementos que describen un documento desde el punto de vista bibliográfico: título, autor, etc., y/o de contenido= Metadatos: marcado semántico).

  32. Metainformación & Marcado Semántica que no se ve (metadatos) ESTRUCTURA Lenguajes de marcado: HTML XHTML XML SMIL/SVG PRESENTACIÓN Hojas de estilo CSS XSLT

  33. WWW: Lenguajes de marcado • HTML • Estándar para formatear la información publicada en Ia Web, distribuida a través de HTTP. • Diseñado principalmente para visualización de datos y se centra en cómo aparece la información, no en su estructura. • Pobre mecanismo de descripción: metaetiquetas. • XML • Subconjunto/simplificación de SGML: Lenguaje de marcas que añade información estructural y semántica (metadatos) a los propios datos. • Enfocado a la descripción, no a la visualización. • Metalenguaje que sirve para definir otros lenguajes de propósito específico (v.g., XHTML, WML, XSL, RDF, etc.) • Múltiples representaciones de la información a través de metadatos.

  34. HTML SGML Perfiles de aplicación RDF: metamodelo de metadatos XML DCMI Modelos/formatos/esquemas... ...estándares de metadatos XML Metadatos de propósito general • XML autodescriptivo • Etiquetas <meta> HTML • DCMI Metadatos de propósito específico • TEI-H • Otros esquemas: VRA, DIG35, MPEG7, EdNA, IMS, AGLS, GILS, FGDC • DCMI RDFMS RDFS

  35. METADATOS Y METAINFORMACIÓN EN LA AI Descripción e indización de contenidos de la sede: DCMI + estructuras de codificación de metadatos

  36. Metadatos de propósito general: DCMI • Un mecanismo básico de descripción que: • Puede usarse en todos los dominios. • Para todo tipo de recursos. • Es sencillo, pero potente. • Puede extenderse fácilmente. • Puede trabajar conjuntamente con otras soluciones específicas. • Para ayudar a la recuperación de información en la Web

  37. Dublin Core - DCMI (1995-2003) • Nace de la imposibilidad de catalogar la Web. • Para mejorar la recuperación de información a través de la inclusión de catalogación de metadatos de autor embebidos. • Inicialmente: 13 elementos para describir recursos/ 15 elementos (1996). • DCq (Dublin Core Qualified) • Integración RDF.

  38. Metadatos Dublin Core • 15 elementos básicos: • Título, Creador, Colaborador, Editor, Fecha de publicación, Identificador (URI), Materia, Descripción, Cobertura, Tipo de recurso, Idioma, Formato, Fuente, Relación con otros documentos, Derechos. • Detalles adicionales: Cualificadores • Matizaciones: p.ej. Date.Created (fecha de creación), Relation.IsPartOf (relacionado por ser parte de) • Vocabularios controlados (p.ej. Encabezamientos de materia normalizados, clasificaciones, nombres geográficos) • Tipos de datos (formatos de fecha/tiempo, tipos MIME)

  39. Tabla de elementos de Dublin Core Contenido Propiedad Intelectual Temporalidad Ejemplo Title Creator Date Subject Publisher Type Description Contributor Format Source Rights Identifier Language Relation Coverage

  40. Dublin Core en la Web • Estándar de metadatos con más éxito en la Web • Uso creciente en dominios específicos: • Información del Sector Público y del Estado • Gestión del conocimiento corporativo • Fundamento esencial en la Web Semántica

  41. Críticas al DC (1997-98) • Motores de búsqueda no soportan DC (sólo algunos search engines) • Falta de reglas y principios directores que aseguren la calidad del contenido. • No responsabilidad formal. • Ausencia de masa crítica.

  42. Fortalezas del DC (2000-05) • Simplicidad. • Responsabilidad formal consorciada: DCMI • Independencia sintáctica. • Integración en la nueva estructuración de la información (XML/RDF) • Norma ANSI/NISO Z39.85-2001. • Norma ISO 15836-2003 (08/04). • PNE 15836-2005 (Aenor, en español)

  43. Actividades de la DCMI • Desarrollar y mantener estándares. • Dar soporte al desarrollo de herramientas, servicios e infraestructuras. • Establecer un gran alcance educativo. • Establecer relaciones entre comunidades de información (interoperabilidad).

  44. Principales temas • Expresar metadatos Dublin Core metadata en (X)HTML, XML, RDF/XML, etc. • Extensión y uso del DC a dominios específicos de información (Perfiles de aplicación). • El Registro del esquema DCMI (diccionario). • Citación, Agentes, Colecciones. • Soporte para el desarrollo de herramientas.

  45. Relaciones de la DCMI • IMS y IEEE/Learning Object Metadata • Discutiendo la cooperación y armonización • MARC y MODS • Discutiendo la transformación-compatibilidad [mapping] de estándares • OAI (Iniciativa de Archivos Abiertos) • Coordinando especificaciones y guías • Instituciones de normalización formal: ISO, NISO, CEN

  46. Información útil • Especificaciones • Conjunto de elementos, calificadores, vocabularios • Guías de uso General • “Utilización del Dublin Core” • Guías de codificación • (X)HTML, RFC2413 (en revisión) • XML, Recomendación de la DCMI, Abril 2003 • RDF, Recomendación de la DCMI, Julio de 2002 DCMI:http://dublincore.org Mirror en español: http://es.dublincore.org Lista DCMI-ES: http://www.rediris.es/list/info/dcmi-es.es.html

  47. DC-Lib: Perfil de aplicación de Dublin Core para bibliotecas Perfil de Aplicación (AP): • Un perfil de aplicación es un esquema (schema) de metadatos que consiste en un conjunto de elementos trazados o seleccionados a partir de uno o varios espacios de nombres (namespaces), combinados por los desarrolladores de un determinado formato (como el DC) y optimizados para una aplicación particular, como por ejemplo las bibliotecas (library application profile)  DC-Lib • Usos posibles DC-Lib: • servir de formato de intercambio entre diversos sistemas que empleen estándares de metadatos distintos • recolectar metadatos de fuentes de datos dentro y fuera del ámbito bibliotecario • apoyar la creación simple de registros catalográficos de la biblioteca para recursos de una variedad de sistemas • exponer datos MARC a otras comunidades (con conversión a DC) • permitir la adquisición de metadatos de identificación de recursos para creadores no bibliotecarios que usen DC.

  48. DC-Lib: Perfil de aplicación de Dublin Core para bibliotecas • DC-Lib se compone de varios namespaces: • Dublin Core Metadata Element Set, Versión 1.1 [http://purl.org/dc/elements/1.1/] • Cualificadores Dublin Core [http://purl.org/dc/terms/] • Dublin Core Type Vocabulary [http://dublincore.org/usage/terms/dcmitype/] • Dublin Core schemes de codificación • [http://dublincore.org/usage/terms/dc/current-schemes/] • Elementos MODS (Metadata Objects Description Schema) [http://www.loc.gov/mods] : Location y Edition • Elementos DC-Ed (Perfil de Aplicación de DC para Educación) [http://dublincore.org/groups/education/]: Audience.

  49. Metadatos: propósito específico • Algunos dominios científicos (Internet communities) tienen mecanismos de descripción sofisticados, que plasman en sus sedes Web: • Bibliotecas (MARC, Z39.50) • Archivos (EAD) • Educación (IMS, IEEE/LOM) • Información Geográfica (FGDC, ISO19115) • Estos estándares específicos pueden transformarse al Dublin Core (p. ej. OAI)

  50. DIG35 IMAGEN VRA TEI-H HUMANIDADES Dominios GEOESPACIAL FGDC AGLS GOBIERNO GILS DCMI EDUCACIÓN EdNA IMS Rec. de Inf. Valoración PICS OAI Interoperabilidad Conservación Accesibilidad INDECS Comercio-E Usos genéricos Papel de los metadatos Tipos de esquemas de metadatos (dominio) Rec. de Inf. Creación de datos Gestión de datos

More Related