1 / 27

Margarita Alonso Ramos Master LUP 2012

Diccionario o Base de datos léxicos. Margarita Alonso Ramos Master LUP 2012. Organización de la exposición. 1. Qué es un léxico computacional 2. Cómo representar la información léxica 3. Aplicaciones de la LexComp 4. Proyectos de LexComp. 1. Qué es un léxico computacional

sinead
Download Presentation

Margarita Alonso Ramos Master LUP 2012

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Diccionario o Base de datos léxicos Margarita Alonso Ramos Master LUP 2012

  2. Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información léxica 3. Aplicaciones de la LexComp 4. Proyectos de LexComp 1. Qué es un léxico computacional • Qué elementos son una unidad léxica • Qué información contiene una entrada lexicográfica

  3. 1. ¿Qué es un léxico computacional? No es solo un diccionario en soporte informático http://elies.rediris.es/elies24/pampillon.htm Los diccionarios en línea o en CD pueden ser una buena herramienta pero el usuario es un humano, no un sistema http://www.diccionarios.com/consultas.php# http://www.ideasafines.com.ar/buscador-ideas-relacionadas.php VOLGA: http://www.realacademiagalega.org/volga/index.jsp DRAE: www.rae.es DicoPortugués: http://www.priberam.pt/dlpo/dlpo.aspx WordReference: http://www.wordreference.com/es/ Bilingüe inglés: http://www.babylon.com/definition/give/Spanish Cambridge: http://dictionary.cambridge.org Merrian-Webster: www.m-w.com/cgi-bin/dictionary?book=Dictionary&va=purchase&x=0&y= htttp://oesi.cervantes.es/TLTODOS/recursos_linguisticos_1.htm

  4. 1. ¿Qué es un léxico computacional? Un “almacén” de información léxica accesible por medios manuales o automáticos para sistemas de PLN

  5. 1.1.¿Qué se entiende por unidad léxica? Unidades léxicas (UL): sentidos o acepciones Actuar 1intr. Ejercer una persona o cosa actos propios de su naturaleza 2 Ejercer las funciones propias de un oficio: ~ de secretario. 3 Representar en el teatro o en el cine. 4 Trabajar en un espectáculo público. 5 Defender, en las universidades, conclusiones públicas o practicar ejercicios de oposición. 6 DER. Realizar actuaciones Concepto de acepción (polisemia): Difícil delimitación Diferente según el objetivo aplicativo

  6. ¿Qué se entiende por unidad léxica? (2) Granularidad en la diferenciación de sentidos (diccionarios) libro monosémico cerdomonolingües: animal, carne, piel, .... bilingües (desajustes: pig, pork) El tipo semánticono implica que haya una o más acepciones. diferentes sentidos matices de un mismo sentido ¿?

  7. 1.2. ¿Qué información contienen ? Dependiendo de los objetivos del léxico: • La trascripción fonética • La categoría gramatical y paradigma morfológico • dar {vdtr}, 1ªconj. • La estructura argumental, patrón sintáctico-semántico básico • SYNSEM | LOC HEAD • | MAJOR V • | SUBCAT = <SN [1], SN[2], SP [3]> • SEM [dar agente [1], tema [2], beneficiario [3]]

  8. ¿Qué información contienen ? • Información semántica: tipo semántico definido en una ontología. chico [HUMANO] ordenador [ARTEFACTO] • Restricciones selectivas • Relaciones léxicas: • Paradigmáticas: sinonimia, antonimia, hiponimia • Sintagmáticas: colocaciones • Las equivalencias con otras lenguas, ...

  9. Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información léxica 3. Aplicaciones de la LexComp 4. Proyectos de LexComp 2. Cómo representar la información léxica

  10. 2. ¿Cómo representar la información? • Bases de datos • Modelos textuales • Bases de conocimiento léxico • Ontologías

  11. Modelos de representación computacionales Bases de datos relacionales las entradas se representan en tablas • cada tabla consta de diversos rasgos que toman valores • Cat = N • Gen = Fem ventajas • software convencional de gestión de base de datos (Access de Microsoft) • mantenimiento, eficiencia y facilidad de interrogación • gran capacidad expresiva limitaciones: - falta de estructura jerárquica • excesiva uniformidad • poco apropiadas para los rasgos de tipo textual

  12. Modelos de representación computacionales Modelos textuales Corpus en bruto: • Frecuencias léxicas • Coapariciones de dos o más palabras Corpus etiquetados: • morfológicamente • sintácticamente • semánticamente • identificación de colocaciones

  13. Modelos de representación computacionales Representaciones orientadas a objetos NOMBRE-F-REG cat= n tipo = común género= femenino morfología= NFAAS CLASE CLASE EJEMPLARES casas es-un: NOMBRE-F-REG número= plural casa es-un: NOMBRE-F-REG número= singular

  14. + lengua + lengua + lengua + semítica + semítica Modelos de representación computacionales Ontologías semántica basada en una ontología lengua semítica cada sentido se diferencia por uno o más rasgos árabe

  15. + lengua + lengua + lengua + semítica + semítica semántica basada en una ontología lenguaje lengua programación indo-europea semítica hebreo árabe ... + árabe

  16. Modelos de representación computacionales Ontologías WordNet - Red de conocimiento léxico-semántica - Relaciones semánticas: sinonimia, hiperonimia, hiponimia, meronimia... - Unidad de descripción: synset

  17. Modelos de representación computacionales Redes semánticas vehículo es-un automóvil 1 ; coche 2 ; carro 2 es-un se-compone-de motor rueda volante ambulancia es-un es-un ranchera;furgón taxi

  18. Modelos de representación computacionales Problemas incompleto: dominios poco o nada representados sentidos básicos que no aparecen Granularidad excesiva: Hombre= el que sirve en el ejército (10) opuesto a hembra opuesto a esposa carácter de hombre ... Criterio poco claro de sinonimia hiperonimia/hiponimia

  19. Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información 3. Aplicaciones de la LexComp

  20. Aplicaciones • Técnicas que incorporan conocimiento lingüístico • Sistemas de tratamiento de la información • Extracción deinformación • Recuperación deinformación • TA • Aplicaciones: usuario final • Lexicografía • Autoaprendizaje, • Buscadores, etc. • Recursos (léxicos)

  21. Aplicaciones (1) Clasificación

  22. Aplicaciones (2) Clasificación semántica

  23. Aplicaciones(3) Traducción Automática Diccionario monolingüe ("llegir" VST ALO [raíz] "lleg" ARGS ((($SUBJ N1 (TYPE P1)) OPT ($DOBJ N1 (TYPE P0) N0 (FCP 0) (MD-0 IND)))) CL [modelo de flexion] (IR-E) CMT [prototipo flexivo] "Model: servir" ON CO PLC (NF) TAL [admite -eix-] -EIX AUTHOR "elisabel" DATE "1-Mar-99" SITE "FB52")

  24. Aplicaciones(5) Traducción Automática Diccionario Bilingüe Incita/SailLabs "fer" VST --> "retroceder" VST = Tests (XFR-VST-CTEST :MW T :FIXEXPR T :EXPR "enrere") Comment "no ens farem enrere =no retrocederemos" << Fb52 FB52 Elisabel 23-Mar-99 >> "fer" VST --> "llegar" VST = Tests(XFR-VST-CTEST :MW T :FIXEXPR T : EXPR "tard") Comment "fer tard =llegar tarde" << Fb52 FB52 Elisabel 24-Mar-99 >> "fer" VST --> "pesar" VST = << Fb52 FB52 Elisabel 23-Mar-99 >>

  25. Organización de la exposición 1. Qué es un léxico computacional 2. Cómo representar la información 3. Aplicaciones de la Lexicografía computacional 4. Proyectos

  26. 4. Proyectos lexicográficos • DiCE (Diccionario de colocaciones del español) http://www.dicesp.es • DiCoInfo (Dicctionario de informática) http://olst.ling.umontreal.ca/cgi-bin/dicoinfo/search.cgi?ui=es • EuroWordNet http://adimen.si.ehu.es/cgi-bin/wei/public/wei.consult.perl • FrameNet http://framenet.icsi.berkeley.edu • Spanish FrameNet http://sato.fm.senshu-u.ac.jp/sfn20/notes/index2.html

More Related