150 likes | 264 Views
Lexikografické zdroje na stránkách ÚJČ AV ČR. Seminář: CJA014/A Současný český jazyk – lexikologie Autor: Lucie Jiráková, UČO 40264 Datum: 24. 3. 2014. Webové stránky ÚJČ AV ČR. Ústav pro jazyk český Akademie věd České republiky, v. v. i. (veřejná výzkumná instituce)
E N D
Lexikografické zdrojena stránkách ÚJČ AV ČR Seminář: CJA014/A Současný český jazyk – lexikologie Autor: Lucie Jiráková, UČO 40264 Datum: 24. 3. 2014
Webové stránky ÚJČ AV ČR • Ústav pro jazyk český Akademie věd České republiky, v. v. i. (veřejná výzkumná instituce) • http://www.ujc.cas.cz • Lexikografické informace dostupné: • Z hlavní strany webu • Z jednotlivých podsekcí webu • Ze samostatné specializované podsekce webu – Lexiko Lexikografické zdroje na stránkách ÚJČ
Lexiko • „Webové hnízdo o novodobé české slovní zásobě a výkladových slovnících“ • Prezentace výsledků práce oddělení současné lexikologie a lexikografie ÚJČ AV ČR • Výzkumný záměr: Vytvoření databáze lexikální zásoby českého jazyka počátku 21. století • Graficky a koncepčně nepříliš zdařilý web http://lexiko.ujc.cas.cz Lexikografické zdroje na stránkách ÚJČ
Lexiko – vybrané sekce • Lístkový lexikální archiv, tvořený od r. 1911 Kanceláří Slovníku jazyka českého při ČAVU (Česká akademie věd a umění) za účelem sestavení reprezentativního slovníku češtiny (PSJČ); dnes je archiv digitalizovaný • Elektronický neologický archiv, zachycující od r. 1991 nové lexikální jevy; částečně zpřístupněn jako databáze Neomat • Přehledné informace o všech slovnících vydaných ve spolupráci s ÚJČ • Vyhledávání ve všech dostupných elektronických slovnících a databázích • Vyhledávání pouze v heslech (ne v heslových statích) • Nelze použít regulární výrazy • Lze vypnout rozlišení velikosti písmen a diakritiky • Reálně dostupné pouze tři slovníky (PSJČ, SSJČ, Neomat) Lexikografické zdroje na stránkách ÚJČ
Příruční slovník jazyka českého (PSJČ) • Rozsáhlý výkladový slovník (1935–1957), 8 dílů v 9 svazcích a dodatky (nebyly vydány) • Základním materiálem při stavbě slovníku byl lístkový lexikální archiv • Digitalizovaná podoba zpřístupněna v r. 2007 • Propojeno s elektronickou verzí lístkového lexikálního archivu • Vyhledávání: • Záleží na velikosti písmen („kočka“ není totéž co „Kočka“) • Lze vyhledávat v heslech nebo heslových statích • Lze zadat konkrétní tvar nebo regulární výraz http://psjc.ujc.cas.cz/ http://bara.ujc.cas.cz/psjc/ Lexikografické zdroje na stránkách ÚJČ
Regulární výrazy • . Tečka = libovolný jeden znak • ko.a vyhledá koza, kola, kopa, … • [] Hranaté závorky = kterýkoli ze znaků v závorce • ko[zs]a vyhledá koza, kosa • * Hvězdička = libovolný počet opakování předcházejícího znaku (včetně nulového) • zo* vyhledá z, zoo • Symboly lze kombinovat: • ko[stbkč]*a vyhledá kosa, koka, kočka, kobka, kostka, … • Ko.*a vyhledá kosa, koka, kočka, kobka, kostka, kostra, kocábka, kobližka, kocourkovština, … Lexikografické zdroje na stránkách ÚJČ
Slovník spisovného jazyka českého (SSJČ) • Velký kodifikační slovník (1. vydání 1960–1971, 2. vydání 1989) • Digitalizovaná podoba zpřístupněna v r. 2011 • Jednoduché vyhledávání: • Záleží na velikosti písmen („kočka“ není totéž co „Kočka“) • Lze vyhledávat v heslech nebo v heslech i heslových statích • Lze vyhledávat celé slovo nebo jeho část • Nelze použít regulární výrazy http://ssjc.ujc.cas.cz/ http://bara.ujc.cas.cz/ssjc/ Lexikografické zdroje na stránkách ÚJČ
Databáze Neomat • Excerpční databáze neologického lexikálního materiálu (od zač. 90. let 20. století); zaměření na nová slova, významy a víceslovné jednotky; excerpována literatura všech funkčních stylů (beletrie a překladová literatura okrajově) • Na základě první části vznikla díla: • Nová slova v češtině. Slovník neologizmů 1 (1998) • Nová slova v češtině. Slovník neologizmů 2 (2004) • Sborník statí Neologizmy v dnešní češtině (2005) • Zveřejněná část databáze obsahuje 202 340 databázových záznamů (64 161 lexikálních jednotek) • Moderní databázový systém EDA; před vyhledáváním nutno přijmout podmínky jeho použití • Možnost tisku výsledků vyhledávání nebo exportu do souboru (formát CSV), rozšířené vyhledávání podle řady kritérií (zdroj, autor, slovní druh, …), možnost filtrování výsledků, podrobná nápověda s příklady http://neologismy.cz/ Lexikografické zdroje na stránkách ÚJČ
Databáze Pralex (demoverze) • Rozsáhlá lexikální databáze Pralex (Pražský lexikon) • Komplexní příprava na tvorbu moderního výkladového slovníku češtiny • Velký objem utříděného jazykového materiálu, popsaného a okomentovaného z různých aspektů; určeno pro vědecké účely, především pro další lexikografickou práci • Po vytěžení bude pravděpodobně zveřejněna • Demoverze: • Zpřístupněna v r. 2011 • Obsahuje cca 350 ukázkových hesel • Nutná instalace; funguje jako doplněk do prohlížeče Mozilla Firefox (starší verze) http://lexiko.ujc.cas.cz/index.php?page=23 Lexikografické zdroje na stránkách ÚJČ
Ostatní lexikografické zdroje přístupnéze stránek ÚJČ Internetová jazyková příručka (slovníková část) Česko-německý slovník Fr. Št. Kotta Český jazykový atlas (lexikální část) Vokabulář webový Lexikografické zdroje na stránkách ÚJČ
Internetová jazyková příručkaSlovníková část • http://prirucka.ujc.cas.cz/ • Přes 60 tisíc slovníkových hesel • Vychází z hesláře školního vydání Pravidel českého pravopisu (PČP), Slovníku spisovné češtiny pro školu a veřejnost (SSČ), výběrově jsou včleněna hesla z Nového akademického slovníku cizích slov (NASCS), ze slovníků neologismů Nová slova v češtině 1, 2 a výrazy z poradenské databáze • Obsahuje především údaje, na něž se tazatelé v jazykové poradně opakovaně ptají, tj. nikoli ty, které lze ve slovnících obvykle nalézt (výslovnost, slovnědruhová charakteristika, význam, odvozená slova, dokladová spojení, …) • Heslové slovo obsahuje odkazy na výkladovou část a nově také definice ze SSČ a SSJČ Lexikografické zdroje na stránkách ÚJČ
Česko-německý slovník Fr. Št. Kotta • http://kott.ujc.cas.cz/ • Autor: František Štěpán Kott (1825–1915), český filolog a lexikograf • Česko-německý slovník zvláště grammaticko-fraseologický (1878–1893), 5 dílů • Obsáhlé doplňky (1896) • Obsahuje množství českých frazeologických obratů a jejich německých ekvivalentů, lidových a nářečních výrazů, technických termínů, synonym, toponym, cizích jmen a jejich skloňování, etymologických výkladů, pořekadel, přísloví… • Možnost vyhledávat heslo (včetně odkazu na scan stránky slovníku) nebo zobrazit seznam hesel Lexikografické zdroje na stránkách ÚJČ
Český jazykový atlasLexikální část • http://cja.ujc.cas.cz/cja • Český jazykový atlas (1992–2005) • V současnosti se pracuje na vytvoření elektronické verze atlasu, v budoucnu interaktivní • Digitalizovány zatím pouze první dva díly věnované vybraným okruhům lexikální zásoby (první svazek – místní a domácí prostředí, člověk; druhý svazek – zahrada a sad, živočišstvo, les a rostlinstvo, krajina, čas a počasí, vesnice dříve a nyní, zábavy a zvyky) • Autor: dialektologické oddělení ÚJČ Lexikografické zdroje na stránkách ÚJČ
Vokabulář webový • „Webové hnízdo pramenů k poznání historické češtiny“ • http://vokabular.ujc.cas.cz/ • Od r. 2006 zpřístupňuje především slovní zásobu historické češtiny • Vyhledávání v sedmi staročeských slovnících (Malý staročeský slovník, pracovní heslář k lístkové kartotéce Staročeského slovníku, Slovník staročeský J. Gebauera, Staročeský slovník: sešit 1–26, Slovníček staré češtiny Fr. Šimka, Index Slovníku staročeských osobních jmen J. Svobody, Elektronický slovník staré češtiny, digitalizovaná lístková kartotéka J. Gebauera) • Autor: oddělení vývoje jazyka ÚJČ Lexikografické zdroje na stránkách ÚJČ
Výhody online zdrojů • Snadná dostupnost prostřednictvím Internetu • Většinou jsou zdarma, bez registrace a bez nutnosti instalace speciálního software • Aktualizovatelnost • Výrazně pohodlnější vyhledávání (rychlost, regulární výrazy) • Obvykle je dostupná dobrá nápověda a doplňkové informace o slovníku Lexikografické zdroje na stránkách ÚJČ