1 / 13

Korpuszmunkálatok 2001-2011

Korpuszmunkálatok 2001-2011. Pintér Tibor MTA Nyelvtudományi Intézet Gramma Nyelvi Iroda. Csak röviden. Múlt Jelen Jövő 10 percben. Kezdetek. 1998: Magyar nemzeti szövegtár kezdete

kenaz
Download Presentation

Korpuszmunkálatok 2001-2011

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Korpuszmunkálatok2001-2011 Pintér Tibor MTA Nyelvtudományi Intézet Gramma Nyelvi Iroda

  2. Csak röviden • Múlt • Jelen • Jövő • 10 percben A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  3. Kezdetek • 1998: Magyar nemzeti szövegtár kezdete • A cél egy 100 millió szavas szövegkorpusz létrehozása volt, amely lehetőségeihez mérten reprezentatívan tartalmazza a mai magyar nyelv jellegzetes megnyilvánulásait. • 2002: Kárpát-medencei Magyar Nyelvi Korpusz kezdete • Az MNSzkiegészíítése a (majdnem) teljes Kárpát-medence magyar nyelvhasználatára kiterjedő gyűjtéssel. Itt a cél egy 15 millió szavas határon túli korpusz létrehozása volt. • 2005 november: Magyar Nemzeti Szövegtár • bemutatkozott a szlovákiai, kárpátaljai, erdélyi és vajdasági nyelvváltozatokkal kiegészült, valóban nemzetivé (nemzteibbé) váló korpusz A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  4. Esszencia • A Termini közreműködésével létrejött az első (és eddig egyetlen) robusztus magyar nyelvi korpusz, amely ht-sítve van: a standard mellett helyt kapott az fv, er, ka, va régió is (hiányzik azonban az öv, hv, mv). • Lehetővé vált a régiók közti lekérdezés, összehasonlítás (még ha az álom nem is színes). A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  5. Kaszárnya A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  6. KWIC konkordancia • Annotálása révén nemcsak lexikológiai, lexikográfiai, hanem morfológiai relevanciával is bír (HuMor és nem Termini). A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  7. Hibája/hibái? A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  8. Nemcsak szorosan vett tudomány • Összekovácsolta az akkor még kibontakozó-félben lévő intézményes együttműködést Terminin belül és a Termini–NYTUD-on belül • Alapot adott a további együttműködéshez • ht-online, www.helyesiras.hu (?) • Személyes szakmai és nem szakmai kapcsolatok A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  9. Számok A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  10. Lekérdezés A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  11. A jövő • Mnsz II. – a többi régió is kell (7 db), mohóság és kiegyensúlyozottság • Sikeres együttműködés más adatbázisoknál is, a siker itt sem kizárt, bár valószínűleg az eddigihez képest más jellegű együttműködés keretén belül • Új korpusz? • Ht-online „háttér-online” munkái • A ht-online példamondatait tartalmazó honlapok begyűjtése (később esetleges feldolgozása) A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  12. Tabula gratulatoria A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

  13. Köszönöm a figyelmet!!! A Termini Magyar Nyelvi Kutatóhálózat tíz éve, 2001-2011

More Related