grup d hist ria i contacte de lleng es ghcl n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Grup d ’ Hist òria i Contacte de Lleng ü es (GHCL) PowerPoint Presentation
Download Presentation
Grup d ’ Hist òria i Contacte de Lleng ü es (GHCL)

Loading in 2 Seconds...

play fullscreen
1 / 12

Grup d ’ Hist òria i Contacte de Lleng ü es (GHCL) - PowerPoint PPT Presentation


  • 111 Views
  • Uploaded on

Grup d ’ Hist òria i Contacte de Lleng ü es (GHCL). Coloma Lleal Galceran (dir.) Emilia Anglada Arboix, Paloma Arroyo Vega, Esther Blasco Mateo, Mar Cruz Pi ñ ol, Mar Forment Fern á ndez, Ignacio V á zquez Di é guez. Al í cia Dom è nech, M ó nica Gonz á lez, Laura Romero (bec à ries).

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Grup d ’ Hist òria i Contacte de Lleng ü es (GHCL)' - dionysius


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
grup d hist ria i contacte de lleng es ghcl
Grup d’Història i Contacte de Llengües(GHCL)

Coloma Lleal Galceran (dir.)

Emilia Anglada Arboix, Paloma Arroyo Vega, Esther Blasco Mateo,

Mar Cruz Piñol, Mar Forment Fernández, Ignacio Vázquez Diéguez.

Alícia Domènech, Mónica González, Laura Romero (becàries)

Departament de Filologia Hispànica

Facultat de Filologia

DICCIONARI ELECTRÒNIC DEL CASTELLÀ

DEL SEGLE XV A LA CORONA D’ARAGÓ

1 del text a la base

1. DEL TEXT A LA BASE

el text

* selecció: textos del segle XV escrits en castellà a la Corona d’Aragó i conservats en manuscrits o incunables.

* criteris de transcripció: fidelitat a l’original; mots aglutinats separats per punt volat; noms propis units; majúscules contextuals eliminades…

la base inicial

* camps inicials: forma i situació

* camps afegits: vocable, funció i variant

2 lematitzaci

REPLACE ALL vocablo WITH “assi”, variante WITH forma, función WITH “adv.”

FOR (forma=“assi” OR forma=“asi” OR forma=“assy” OR forma=“asy”

OR forma=“ansi” OR forma=“ansy”)

2. LEMATITZACIÓ

LOCATE FOR (“assemos ” $forma OR “assedes ” $forma OR “asseden ” $forma)

DO WHILE NOT EOF()

STORE TRIM(forma) TO mot

STORE LEN(mot) TO mida

REPLACE NEXT 1 función WITH “verbo”, vocablo WITH LEFT(mot,(mida-6))+“r”,

variante WITH LEFT(mot,(mida-6))+“r”

CONTINUE

ENDDO

Programa lematitzador a partir de:

* lexicó:

formes d’inventari tancat (articles, pro- noms, conjuncions, preposicions…) i formes lèxiques d’alta freqüència.

* regles de derivació i flexió.

{-oso, -ario, -ble…} adj.

{-dad, -ez, -ura…} sust. fem.

{-riamos, -assedes…} verb

{-mente} adv.

* regles sintàctiques.

distinció articles/pronoms (lo, la)

distinció sust./verb… (canto)

* correcció ortogràfica

i, a continució, revisió del text

LOCATE FOR forma=(“el ” OR forma=“la ” OR forma=“lo ” OR forma=“los ” OR forma=“las ”)

DO WHILE NOT EOF()

SKIP

IF función=“verbo”

SKIP -1

REPLACE NEXT 1 vocablo WITH “el ella ello”, funciónWITH “pron. pers.”

ELSE

SKIP -1

REPLACE NEXT 1 vocablo WITH “el la lo”, función WITH “art.”

ENDIF

SKIP 2

CONTINUE

ENDDO

TOTAL DE FORMES LEMATITZADES

AUTOMÀTICAMENT: 96,7% DEL TEXT

slide8

Altres possibilitats de cerca: alguns exemples

1. Llistat de locucions

locucions adverbials

locucions sustantives

slide9

2. Llistat de neologismes

Obtenció de llistats dels termes a partir de la data de primera documentació en el DCECH de Corominas-Pascual (en aquest cas, igual o posterior a 1400).

Es marca en negreta la data de la primera documentació en el nostre corpus quan és igual o anterior a la del DCECH.

slide10

3. Famílies etimològiques

Llistat dels termes del nostre corpus que parteixen d’una mateixa base etimològica.

slide11

4. Camps semàntics

‘document’

slide12

‘planta’

‘documento’