450 likes | 628 Views
Zpracování informací a znalostí Informační a citační analýza. Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství. Informační a citační analýza. Cíle a metody Bradfordův a Zipfův zákon Hodnocení časopisů Citační rejstříky Poznámka – page rank.
E N D
Zpracování informací a znalostíInformační a citační analýza Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství
Informační a citační analýza • Cíle a metody • Bradfordův a Zipfův zákon • Hodnocení časopisů • Citační rejstříky • Poznámka – page rank
Informační analýza Získávání informací analýzou formálních bibliografických údajů (nejedná se o vyhodnocování obsahu).
Informační analýza – jednotka zpracování Bibliografický záznam • údaje o autorech • název dokumentu, • charakteristika obsahu, • nakladatelství • vydání (pořadí, datum,...) • rozsah • ISBN, ISSN • ... • citace
Informační analýza – základní metody • Frekvenční analýza – • zjišťují se četnosti výskytu různých údajů v souboru záznamů • Citační analýza – • zjišťují se návaznosti mezi záznamy v souboru
Citační analýza • které prameny jsou v dokumentu citovány • ve kterých dokumentech je pramen citován • které dokumenty jsou citovány hodně / málo • které citace se objevují často spolu • kteří autoři se objevují často spolu či se navzájem citují • které prameny jsou klíčové pro určitý obor / téma
Bibliometrie Cílem bibliometrie je osvětlit proces psané komunikace a i zaměření vědecké discipliny (do té míry, jak se odráží v psané komunikaci) pomocí kvantitativní analýzy rozličných složek psané komunikace. Literatura: KÖNIGOVÁ, M.: Úvod do bibliometrie. Praha, Česká informační společnost, 1993, 74 s.
Cíle informačních analýz • Sledování úrovně a trendů rozvoje (obory, země, regiony, ...) • Hodnocení výsledků a přínosu vědy (obory, kolektivy) • Profilování a optimalizace informačních fondů • vytipování nejvhodnějších zdrojů informací • inovace fondu vzhledem k rozvoji oboru • vytipování a odstranění zbytečných zdrojů informací • rozbory spokojenosti uživatelů
Informační a citační analýza • Cíle a metody • Bradfordův a Zipfův zákon • Hodnocení časopisů • Citační rejstříky • Poznámka – page rank
Bradfordův zákon (1) • Bradfordovo rozdělení se týká rozložení článků k dané tématice v časopisech. • Křivka vyjadřující závislost celkového počtu článků na logaritmu počtu časopisů, ve kterých se tyto články vyskytují, má charakteristický tvar, nezávislý na tématice článků.
Bradfordův zákon (2) • Všechny články lze rozdělit na jádro a dvě zóny tak, že jádro i každá zóna obsahují přibližně třetinu ze všech článků. • Články z jádra jsou publikovány v časopisech věnujících se dané tématice. • Články z první zóny jsou publikovány v n-krát větším počtu průřezových časopisů a časopisů hraničních oborů. • Články z druhé zóny jsou rozptýleny v přibližně n2 – krát větším počtu časopisů než má jádro.
Zipfův zákon • Týká se závislosti frekvence slov a pořadí slov v textu podle frekvence • Fs ... frekvence slova S v textu • Rs ... pořadí slova S podle frekvence • Zipfův zákon: Fs * Rs = konstanta (přibližně)
Informační a citační analýza • Cíle a metody • Bradfordův a Zipfův zákon • Hodnocení časopisů • Citační rejstříky • Poznámka – page rank
Hodnocení časopisů (1) DOPAD (sociální viditelnost) • počet ročníků • rozsah (počet článků za rok) • náklad • počet předplatitelů • …
Hodnocení časopisů (2) KVALITA • Impact faktor (faktor vlivu), viz též http://www.vse.cz/obecne/impactfk.php3 • Další kriteria, viz např. bod 4 na http://www.vse.cz/impakt-faktor/impakt-priklady.php
Hodnocení časopisů FAKTOR VLIVU (Impact factor, IF) • průměrný počet citací jinde na články vyšlé v časopise v předcházejících dvou letech Příklad: Impakt faktor časopisu za rok 2007 = počet citací zveřejněných v roce 2007 na články vydané vletech 2005 a 2006 počet všech článků vyšlých v časopise v letech 2005 a 2006
Informační a citační analýza • Cíle a metody • Bradfordův a Zipfův zákon • Hodnocení časopisů • Citační rejstříky • Poznámka – page rank
Citační rejstříky • Příklad problému • Google – Scholar • Web of Knowledge • Science Citation Index • Social Sciences Citation Index • Art & Humanities Citation Index • Scopus • Citeseer • DBLP
Citační rejstříky – příklad problému Zajímá nás článek CHEN H.: Knowledge based document retrieval: Framework and design. Journal of Information Science, 18, 1992 s. 293 - 314. Elsevier Viz skripta: Rauch, J.: Metody zpracování informací II (kapitola 12, Znalostní systém METACAT pro vyhledávání dokumentů) ??? KDO CITOVAL ???
Google – Scholar, příklad použití http://scholar.google.com http://scholar.google.com/advanced_scholar_search?hl=en&lr=
Web of Science – related records Článek 1 ….. Literatura: [1]A …. [2]PG … [3]U … [4] UJ … [5]C … [6] PR … [7] KO … [8] SD … [9] AD … Článek 2 ….. Literatura: [1]A …. [2] GH … [3] WX … [4] C … [5] L … [6] KO … [7] JK … [8] IP … [9] AD … Citují společné prameny
Related records – příklad Článek 1 Článek 2
Citační rejstříky - Scopus http://www.vse.cz/zdroje/vypis.php?ID_zdroje=90 http://www.scopus.com/scopus/home.url
Citační rejstříky - Citeseer http://citeseer.ist.psu.edu/
Citační rejstříky - DBLP http://www.informatik.uni-trier.de/~ley/db/
Informační a citační analýza • Cíle a metody • Bradfordův a Zipfův zákon • Hodnocení časopisů • Citační rejstříky • Poznámka – page rank
Poznámka: page rank http://pagerank.suchmaschinen-doktor.de/index.html
Poznámka: page rank http://pagerank.suchmaschinen-doktor.de/index/examples.html
Poznámka: page rank http://ilps.science.uva.nl/Teaching/II0607/twiki/pub/Main/CourseSchedule/ii0607-week-05-01-8up.pdf