1 / 12

Grup d ’ Hist òria i Contacte de Lleng ü es (GHCL)

Grup d ’ Hist òria i Contacte de Lleng ü es (GHCL). Coloma Lleal Galceran (dir.) Emilia Anglada Arboix, Paloma Arroyo Vega, Esther Blasco Mateo, Mar Cruz Pi ñ ol, Mar Forment Fern á ndez, Ignacio V á zquez Di é guez. Al í cia Dom è nech, M ó nica Gonz á lez, Laura Romero (bec à ries).

dionysius
Download Presentation

Grup d ’ Hist òria i Contacte de Lleng ü es (GHCL)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Grup d’Història i Contacte de Llengües(GHCL) Coloma Lleal Galceran (dir.) Emilia Anglada Arboix, Paloma Arroyo Vega, Esther Blasco Mateo, Mar Cruz Piñol, Mar Forment Fernández, Ignacio Vázquez Diéguez. Alícia Domènech, Mónica González, Laura Romero (becàries) Departament de Filologia Hispànica Facultat de Filologia DICCIONARI ELECTRÒNIC DEL CASTELLÀ DEL SEGLE XV A LA CORONA D’ARAGÓ

  2. 1. DEL TEXT A LA BASE el text * selecció: textos del segle XV escrits en castellà a la Corona d’Aragó i conservats en manuscrits o incunables. * criteris de transcripció: fidelitat a l’original; mots aglutinats separats per punt volat; noms propis units; majúscules contextuals eliminades… la base inicial * camps inicials: forma i situació * camps afegits: vocable, funció i variant

  3. REPLACE ALL vocablo WITH “assi”, variante WITH forma, función WITH “adv.” FOR (forma=“assi” OR forma=“asi” OR forma=“assy” OR forma=“asy” OR forma=“ansi” OR forma=“ansy”) 2. LEMATITZACIÓ LOCATE FOR (“assemos ” $forma OR “assedes ” $forma OR “asseden ” $forma) DO WHILE NOT EOF() STORE TRIM(forma) TO mot STORE LEN(mot) TO mida REPLACE NEXT 1 función WITH “verbo”, vocablo WITH LEFT(mot,(mida-6))+“r”, variante WITH LEFT(mot,(mida-6))+“r” CONTINUE ENDDO Programa lematitzador a partir de: * lexicó: formes d’inventari tancat (articles, pro- noms, conjuncions, preposicions…) i formes lèxiques d’alta freqüència. * regles de derivació i flexió. {-oso, -ario, -ble…} adj. {-dad, -ez, -ura…} sust. fem. {-riamos, -assedes…} verb {-mente} adv. … * regles sintàctiques. distinció articles/pronoms (lo, la) distinció sust./verb… (canto) … * correcció ortogràfica i, a continució, revisió del text LOCATE FOR forma=(“el ” OR forma=“la ” OR forma=“lo ” OR forma=“los ” OR forma=“las ”) DO WHILE NOT EOF() SKIP IF función=“verbo” SKIP -1 REPLACE NEXT 1 vocablo WITH “el ella ello”, funciónWITH “pron. pers.” ELSE SKIP -1 REPLACE NEXT 1 vocablo WITH “el la lo”, función WITH “art.” ENDIF SKIP 2 CONTINUE ENDDO TOTAL DE FORMES LEMATITZADES AUTOMÀTICAMENT: 96,7% DEL TEXT

  4. 5: EL DICCIONARI: Base REUNIÓ Informació general

  5. Altres possibilitats de cerca: alguns exemples 1. Llistat de locucions locucions adverbials locucions sustantives

  6. 2. Llistat de neologismes Obtenció de llistats dels termes a partir de la data de primera documentació en el DCECH de Corominas-Pascual (en aquest cas, igual o posterior a 1400). Es marca en negreta la data de la primera documentació en el nostre corpus quan és igual o anterior a la del DCECH.

  7. 3. Famílies etimològiques Llistat dels termes del nostre corpus que parteixen d’una mateixa base etimològica.

  8. 4. Camps semàntics ‘document’

  9. ‘planta’ ‘documento’

More Related