1 / 46

CLARIN - ES

CLARIN - ES. Fase Preparatoria CLARIN en España. Índice. Infraestructura CLARIN Antecedentes El proyecto CLARIN Objetivos y plan de trabajo. INFRAESTRUCTURA CLARIN. Basarse en tecnología grid, metadatos y servicios-web

cecile
Download Presentation

CLARIN - ES

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. CLARIN - ES Fase Preparatoria CLARIN en España Clarin – ES Barcelona, 19-12-2007

  2. Índice • Infraestructura CLARIN • Antecedentes • El proyecto CLARIN • Objetivos y plan de trabajo Clarin – ES Barcelona, 19-12-2007

  3. INFRAESTRUCTURA CLARIN Basarse en tecnología grid, metadatos y servicios-web - para garantizar la interoperabilidad que haga de un conjunto de elementos sin relación, diferentes y remotos, un sistema estructurado de componentes funcionales interconectados, y - para facilitar la identificación, la ubicación, el acceso y la explotación de recursos lingüísticos. Clarin – ES Barcelona, 19-12-2007

  4. Una infraestructura? Clarin – ES Barcelona, 19-12-2007

  5. Recursos Lingüísticos Clarin – ES Barcelona, 19-12-2007

  6. Antecedentes • Archivo y gestión de datos lingüísticos: LAT, LAMUS, • Estandarización: EAGLES, ISLE, LIRICS-ISO • Prueba de concepto: IMDI, DAM-LR • Proyecto aprobado: • ESFRI: European Strategy Forum on Research Infrastructures • 7PM de la UE Capacities • AACC, Infraestructuras Científicas y Tecnológicas Clarin – ES Barcelona, 19-12-2007

  7. Proyecto CLARIN.eu • Conseguir el apoyo de suficientes estados miembros: 22 estados en el consorcio, con apoyo expreso de sus gobiernos. • En España, hubo que demostrar el interés y la viabilidad. Se consiguió gracias a las cartas de apoyo recibidas. Clarin – ES Barcelona, 19-12-2007

  8. Centro TALP, UPC Laboratorio de Lingüística Informática , UAM Dep. de Filología Española, UAB Departamento de Traducción y Lingüística, UVigo Departamento de Lengua Española, USantiago Grupo IXA, Facultad de Informática, UPV Real Academia Española Institut d’Estudis Catalans Dep. de Humanidades, U Castilla la Mancha Dep. de Humanidades, U Carlos III Dep. de Humanidades, UPF Avales iniciales de CLARIN-ES Clarin – ES Barcelona, 19-12-2007

  9. El proyecto CLARIN-ES MEC: Acciones Complementarias para Realización de actividades de carácter técnico de elementos o paquetes de trabajo correspondientes a la fase preparatoria de los proyectos de instalaciones científico-tecnológicas incluidas en la “Hoja de Ruta” del Foro Europeo Estratégico sobre Infraestructuras de Investigación (ESFRI). Dirección General de Política Tecnológica Subdirección Gral. de promoción e infraestructuras tecnológicas y grandes instalaciones. Clarin – ES Barcelona, 19-12-2007

  10. Plan de trabajo (EU) • WP1 – Management of the project • WP2 – Technical Infrastructure • WP3 – Humanities overview • WP5 – LRT overview • WP6 – Information gathering & dissemination • WP7 – Intellectual Property Rigth Issues • WP8 – Construction & Explotation Agreement Clarin – ES Barcelona, 19-12-2007

  11. Objetivos de la Fase Preparatoria • Acuerdo documentado y consensuado • Construcción de una maqueta: • Evaluar el coste de construcción • Solucionar problemas técnicos • Tener en cuenta todas las lenguas de la UE • Planificación detallada del desarrollo Clarin – ES Barcelona, 19-12-2007

  12. Planificación Clarin • Construcción de CLARIN 2011-2015: integración de recursos y tecnología desarrollo de aplicaciones piloto • Explotación del recurso 2016 - ... : desarrollo de aplicaciones • Hay que garantizar el mantenimiento de los servicios y recursos: CENTROS PERSISTENTES Clarin – ES Barcelona, 19-12-2007

  13. Plan de trabajo (ES) • Difusión y creación de comunidades – Recopilación de información sobre usuarios y proveedores posibles • Demostradores en el ámbito de humanidades: crear interés • Integración de RRLL españoles en la maqueta europea [de todas las lenguas del estado] Clarin – ES Barcelona, 19-12-2007

  14. Detalles técnicos de CLARIN Clarin – ES Barcelona, 19-12-2007

  15. Índice • Integración en la Federación Clarin • Metadatos y estándares considerados • Ejemplos de herramientas posibles Clarin – ES Barcelona, 19-12-2007

  16. Federación Clarin (1) • Despliegue de la red “grid”: funcionalidades, identificación específica de recursos, y protocolos de sincronización, identificación y autenticación. • Compartir metadatos para la descripción de los recursos y las herramientas de búsqueda y localización de recursos que los utilizan • Compartir metadatos para describir los contenidos lingüísticos, y poder construir, gracias a la interoperabilidad, herramientas de acceso, análisis y explotación . Clarin – ES Barcelona, 19-12-2007

  17. Funcionalidades GRID Clarin – ES Barcelona, 19-12-2007

  18. Federación Clarin (2) • Despliegue de la red “grid”: funcionalidades, identificación específica de recursos, y protocolos de sincronización, identificación y autenticación. • Compartir metadatos para la descripción de los recursos y las herramientas de búsqueda y localización de recursos que los utilizan. • Compartir metadatos para describir los contenidos lingüísticos, y poder construir, gracias a la interoperabilidad, herramientas de acceso, análisis y explotación . Clarin – ES Barcelona, 19-12-2007

  19. Metadatos Clarin – ES Barcelona, 19-12-2007

  20. Ejemplo de metadatos (2) Clarin – ES Barcelona, 19-12-2007

  21. Ejemplo de metadatos (3) Clarin – ES Barcelona, 19-12-2007

  22. Federación Clarin (3) • Despliegue de la red “grid”: funcionalidades, identificación específica de recursos, y protocolos de sincronización, identificación y autenticación. • Compartir metadatos para la descripción de los recursos y las herramientas de búsqueda y localización de recursos que los utilizan • Compartir metadatos para describir los contenidos lingüísticos, y poder construir, gracias a la interoperabilidad, herramientas de acceso, análisis y explotación . Clarin – ES Barcelona, 19-12-2007

  23. Estándares para la descripción de contenidos lingüísticos • EAGLES, ISLE, LIRICS, ISO: • codificación morfosintáctica, sintáctica y semántica; • Para corpus y léxico - LMF • Data Category Registry, de ISO • Para descripción de voz SAMPA • queda trabajo, el problema es la definición!!! Clarin – ES Barcelona, 19-12-2007

  24. Ejemplo del Lexical Markup Framework ISO TC37/SC 4 part of speech grammaticalcategory wordclass Category assigned to a word based on its grammatical and semantic properties NOTE: ISO 12620 provides a comprehensive list of values for European languages. Examples of such values are: /noun/ and /verb/.

  25. LMFEstructura Clarin – ES Barcelona, 19-12-2007

  26. Data Category Registry Clarin – ES Barcelona, 19-12-2007

  27. Federación Clarin (4) • Posibles aplicaciones que acceden a diferentes recursos y herramientas de análisis • Creación de un corpus de conversaciones entre personas de 16 a 18 años con ejemplos de abertura vocálica para marcar el plural en castellano peninsular • “Query expansion” para hacer búsquedas en textos históricos Clarin – ES Barcelona, 19-12-2007

  28. Ejemplo de herramienta Clarin – ES Barcelona, 19-12-2007

  29. Ejemplo de herramienta • Pero serán herramientas de las de aquí a diez años!! • Los instrumentos de análisis y explotación serán herramientas basadas en tecnologías lingüísticas. Analizar los artículos de opinión de un periódico X y obtener la distribución temporal de los marcadores discursivos de opinión negativa sobre el tema “educación” en los últimos diez meses. Clarin – ES Barcelona, 19-12-2007

  30. Definición de aplicaciones básicas • Importancia de los usuarios • Necesitamos saber sus procesos más repetidos y sus necesidades más futuribles!!! • Acceso y uso de instrumentos de explotación y análisis mediante tecnología lingüística • Creando la e-ciencia en humanidades y ciencias sociales Clarin – ES Barcelona, 19-12-2007

  31. Resumiendo … Clarin – ES Barcelona, 19-12-2007

  32. Tipología de centros CLARIN • Proveedor de RRLL: datos y tecnología • Archivos CLARIN, que garanticen la persistencia • Centros de entrada al sistema (portales) • Creadores de aplicaciones que exploten los RRLL Clarin – ES Barcelona, 19-12-2007

  33. Proveedores de recursos • Describir sus recursos con los metadatos usados en CLARIN • Convertir sus recursos en “interoperativos”: que puedan ser input/output de procesos. • Convertir sus herramientas/aplicaciones para que acepten i/o CLARIN Clarin – ES Barcelona, 19-12-2007

  34. Gracias! Clarin – ES Barcelona, 19-12-2007

  35. Índice • Objetivos de la Fase Preparatoria • Organización en España • Calendario • Canales de comunicación Clarin – ES Barcelona, 19-12-2007

  36. Objetivos Fase Preparatoria • Obtener apoyo y financiación del Estado español para la construcción de Clarin 2011-2015 • Obtener financiación para el mantenimiento y explotación de Clarin 2016 - .... Clarin – ES Barcelona, 19-12-2007

  37. Necesitamos • Suficiente respaldo para demostrar que en España hay una masa crítica de usuarios y proveedores. • Documentación: • Planificación detallada de la construcción (incluya centros proveedores, aplicaciones piloto, etc.) • Evaluación económica de los costes Clarin – ES Barcelona, 19-12-2007

  38. Estructurar la colaboración de organismos españoles para: • participación en la solicitud del proyecto español • evaluación del coste (económico y temporal) de la integración de los recursos/servicios • evaluación del coste (económico y temporal) del mantenimiento del recurso/servicio • desarrollo del modelo de organización español (con el modelo europeo, o no) Clarin – ES Barcelona, 19-12-2007

  39. FP: Evaluación y planificación • Integración: • Evaluar el coste de la integración de un centro en la red CLARIN (autenticación, etc.) • Evaluar el coste de la integración de los recursos/servicios: descripción y estandarización. • Garantizar la persistencia del recurso/servicio Clarin – ES Barcelona, 19-12-2007

  40. FP: Organización de comunidades • Invitación a proponer recursos/aplicaciones para su integración • Búsqueda y recopilación de datos para hacer una lista definitiva de integrables que conste en la solicitud • Estos recursos entrarán en la planificación y evaluación de costes Clarin – ES Barcelona, 19-12-2007

  41. Organización en España FP:propuestas.... • Firma de un convenio bilateral (UPF-X) que declare el compromiso de los centros en la construcción de CLARIN • Interés en integrar recursos y/o aplicaciones • Interés en solicitar aplicaciones propias • Acuerdo con los usuarios? • Para discutirlo en el coloquio ... Clarin – ES Barcelona, 19-12-2007

  42. Calendario • Enero 2008 – Inicio CLARIN.eu • Abril 2008 – 1 Lista Centros CLARIN-ES • Junio 2008 – CLARIN-ES (2) AACC • Junio 2008 - Requisitos del Registro Clarin – ES Barcelona, 19-12-2007

  43. Canales de comunicación Página web • Información y enlaces • Módulo foros • Módulo usuarios: danos una idea, dinos un posible usuario • Módulo descripción de recursos (en construcción) Clarin – ES Barcelona, 19-12-2007

More Related