1 / 10

ANÁLISIS MORFOLÓGICO

ANÁLISIS MORFOLÓGICO. Carlos Mario Zapata J. GENERALIDADES. Identificación de mecanismos para crear palabras y formas de palabras de manera sistemática. Procesamiento de las palabras de manera tanto escrita como hablada.

lala
Download Presentation

ANÁLISIS MORFOLÓGICO

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ANÁLISIS MORFOLÓGICO Carlos Mario Zapata J. Lingüística Computacional

  2. GENERALIDADES • Identificación de mecanismos para crear palabras y formas de palabras de manera sistemática. • Procesamiento de las palabras de manera tanto escrita como hablada. • Usos: corrección de palabras (spelling), separación de palabras (hyphenation), conjugadores de verbos, etiquetación de corpus (tagging), traducción automática, etc. • Es más fácil para humanos que para computadores. • Existen diferencias sustanciales entre los morfemas para diferentes idiomas. • I speak – hablo; I will speak – hablaré; book – hon – libro; books – hon – libros. Lingüística Computacional

  3. DEFINICIONES • Morfema: unidad más pequeña a la que se puede asignar un significado. Unidad mínima para el análisis gramatical. • Flexivos: indican número, tiempo, género y persona (-a, -s, etc.) • Derivativos o Afijos: elementos que acompañan a la raíz y que suelen aportar significados adicionales. Pueden ser prefijos, sufijos e infijos. • Diminutivos • Aumentativos • Despectivos • Gentilicios Lingüística Computacional

  4. DEFINICIONES • Lexema: unidad fundamental del léxico de una lengua, el cual aporta el significado básico de la palabra. • Lema: la entrada en un diccionario. • Raíz: Formante común al conjunto de formas léxicas o palabras que pertenecen al mismo lexema. • Palabra: unidad que sirve para construir frases u oraciones (frases con sentido gramatical completo). • Sencilla: un solo morfema. Ej: de, dos, y, que, no. • Varios morfemas: otr-a-s (una raíz y dos afijos). Lingüística Computacional

  5. DEFINICIONES • Morfo: la realización de parte de una palabra. • El atlas, los atlas • El mejor, la mejor • Alomorfo: variación en la forma de los morfemas como consecuencia del contexto fonológico. • Ej: in: • i- ante /l/ o /r/: ilegal, irreal. • Im- ante /p/ o /b/: imposible, imborrable. • In- en los casos restantes. • Caber, cupo y quepo Lingüística Computacional

  6. TIPOS DE LENGUAJES • Tipos de Lenguajes: • Aislados (Chino mandarín): no hay afijos. La única operación morfológica es la composición (unión de dos lexemas para producir una palabra nueva). • junzi 'señor, caballero' que deriva de jun 'señor, noble' y zi 'niño' • Aglutinadores (Turco, Finlandés): cada característica se expresa con un afijo. • evlerinizden o "de sus casas", se compone de los morfemas, ev-ler-INIZ-den con los significados casa-plural-su-de. Lingüística Computacional

  7. TIPOS DE LENGUAJES • Tipos de Lenguajes: • Inflexionales (Indo-Europeos, Castellano): Se basan en la inflexión (modificación de un lexema mediante sufijos sin dar lugar a un lexema nuevo) • Inflexiones verbales: pens-ar, pens-ó, pens-ará • Inflexiones nominales: gat-o, gat-a, gat-a-s • Inflexiones radicales: niñ-o, niñ-era, niñ-ería • Polisintéticos (Lenguajes Inuit): Mucha más información morfológica. 'qanik', quiere decir "copos de nieve en el aire", y 'aput', "la nieve en el suelo“ • Derivación: modificación de un lexema mediante prefijos y sufijos para dar un nuevo lexema. Ej.: cuchillo-cuchillada Lingüística Computacional

  8. IMPORTANCIA DEL ANÁLISIS MORFOLÓGICO • Complejidad de los lenguajes que se van usando para PLN. Ej: Finlandés, Español. • Reducción del volumen del diccionario. • Prerrequisito para el análisis sintáctico. Lingüística Computacional

  9. IDENTIFICACIÓN: PALABRAS ENTRADA SEGMENTACIÓN: LEXEMAS Y AFIJOS LEMATIZACIÓN: COMO APARECE EN DICCIONARIO CONCATENACIÓN: RELACIÓN MEDIANTE REGLAS MORFOSINTÁCTICAS CATEGORIZACIÓN: ASIGNACIÓN CATEGORÍA GRAMATICAL ETIQUETADO: INFORMACIÓN RELEVANTE MORFOLOGÍA COMPUTACIONAL Lingüística Computacional

  10. ANÁLISIS MORFOLÓGICO • Texto de entrada: “El asistente liquida las facturas” Lingüística Computacional

More Related