290 likes | 469 Views
Topic Maps. Kristína Machová Miloš Kuba. Osnova:. História Čo je Topic Maps (TM) Základné stavebné kameňe TM Príklad TM Model TM Téma vs. predmet Identifikátory tém PSI Topic Maps vs. sémantický web Príklady využitia TM Syntax XTM – príklad Software. História.
E N D
Topic Maps Kristína Machová Miloš Kuba
Osnova: • História • Čo je Topic Maps (TM) • Základné stavebné kameňe TM • Príklad TM • Model TM • Téma vs. predmet • Identifikátory tém • PSI • Topic Maps vs. sémantický web • Príklady využitia TM • Syntax XTM – príklad • Software
História • - začiatok 90. rokov – DEC a O´Reilly zdieľajú unixovú • dokumentáciu a chcú vytvorit unifikovaný register • problém začal byť riešený s využitím HyTime a vzniká • prvá idea Topic Maps (map tém) • 1996 – vývoj TM je prenesený na pôdu ISO • 2000 – ISO/IEC13250:2000 Topic Maps • - základný model Topic Maps • - syntax založená na HyTime a SGML (HyTM) • - syntax nebola založená na XML, pre odkazy • sa používal HyTime, syntax nebola pevne daná
História • - po roku 2000 vznikla potreba XML syntaxe pre lepšiu • integráciu s webom, preto bol vytvorený formát XTM v rámci • iniciatívy TopicMaps.org • 2003 – ISO/IEC 13250:2003 TopicMaps – revidovaná • verzia standardu, ktorá zahrňuje XTM
Čo je Topic Maps • Medzinárodná norma (ISO 13250:2003) pre reprezentáciu • a zdieľanie znalostí s dôrazom na možnosť vyhľadávania • informácií. • Mapy tém sú vlastne trochu štrukturovanejšími sémantickými • sieťami. • Možnosti využitia map tém: • organizácia rozsiahlych zdrojov informácií • agregácia informácií v distribuovanom prostredí • modelovanie zložitých pravidiel, procesov, atď. • podpora navigácie a vyhľadávania v rozsiahlych • kolekciách dokumentov • - ...
Základné stavebné kameňe Topic Maps • Topic Maps ponúka prostriedky pre reprezentáciu znalostí • a ich vzťahu k popisovaným informačným zdrojom. • Preto model Topic Maps má dve vrstvy: • Spodnú vrstvu originálnych informačných zdrojov (obsah) • Hornú vrstvu mapy znalostí (register) • Spodná vrstva modelu obsahuje samotný obsah, obvykle • má digitálnu podobu, ale nemusí. Môže to byť akýkoľvek • formát, text, zvuk, video, graf, obrázok ... • V praxi sa obvykle jedná o informačné zdroje, pre ktoré • chceme zlepšiť navigáciu a vyhľadávanie.
Základné stavebné kameňe Topic Maps Horná vrstva „znalostná vrstva“ obsahuje témy (topics) a vzťahy (associations) medzi nimi.
Základné stavebné kamene Témy (topics) • Témy (topics) • reprezentujú jednotlivé predmety, ktoré sa vyskytujú • vo vrstve informácií • predstavujú konceptuálne pojmy – triedy, inštancie, • vlastnosti, atď. • téma môže mať niekoľko tzv. typov tém (topic types) • téme môže byť priradených niekoľko mien (napr. • prezývka, formálne meno, prihlasovacie meno, atď.), • každé z nich v niekoľkých variantach.
Základné stavebné kameňe Vzťahy (associations) • Vzťahy (associations) • reprezentujú vzťahy medzi jednotlivými témami – analógia • n-árnych relácií • vzťahu je priradený tzv. typ vzťahov, ktorý je témou • (typ témy je špeciálnym typom vzťahov). • témy vystupujú vo vzťahoch v tzv. úlohách vzťahov • tiež úlohe vzťahov je priradený typ úlohy vzťahov.
Základné stavebné kameňe Výskyty (occurences) • Vrstvy sú prepojené pomocou výskytov (occurences). • Výskyt • zachytáva vzťah medzi témou a súvisiacim informačným • zdrojom • téma je s výskytom zviazaná pomocou tzv. úlohy (role), • ktorá určuje typ výskytu (web. stránka, článok, kniha, a pod.) Dva druhy výskytov: interné – reprezentujú vlastnosti témy a sú uložené priamo v mape tém externé – odkazy na externé informačné zdroje (URL)
Základné stavebné kameňeTopic Maps - zhrnutie Každá mapa tém sa skladá z nasledujúcich troch typov objektov: témy, vzťahy , výskyty TAO=Topics+Associations+Occurences Ontológia Každý zo základných objektov mapy tém môže mať typ. V našom príklade teda: typy tém: herec, režisér, film, osoba typy vzťahov: hraje v, režíroval typy výskytov: životopis, fotografie, číslo filmového pásu v archíve, rok natočenia Typy sú témy v rovnakej mape tém: Kouř je téma typu film film je takisto téma Každá mapa tém obsahuje svoju ontológiu.
Príklad Topic Maps Príklad grafu vygenerovaného programom TM4L
Téma vs. predmet • Téma vždy zastupuje nejaký predmet o ktorom sa chceme • vyjadrovať. • Predmet je súčasť reálneho sveta, ktorý popisujeme v mape • tém. • Každú tému reprezentuje práve jeden predmet. Každý • predmet je v mape tém reprezentovaný len jednou témou. • Téma je miestom v mape tém, kde sú pomocou vzťahov • a výskytov dostupné všetky známe informácie o danom • predmete. • Predmet môže byť hocičo – osoba, vec, koncept, entita, • proces.
Identifikátory tém • Témy reprezentujú predmety. • Jednoduché názvy (mená) sa použiť nedajú, lebo môžu • nastať problémy so synonymami, homonymami, • jazykovými verziami. • Tento problém riešia identifikátory. • Ak predmet je informačný zdroj • - identifikátorom je lokátor predmetu • Ak predmet nie je informačný zdroj • - identifikátorom je identifikátor predmetu
Identifikátory tém Lokátor predmetu • Lokátor predmetu (subject locator) • - je dostupný v nejakom počítačovom systéme, a je preto • adresovateľný • - adresa adresovateľného predmetu môže byť použitá • k jeho jednoznačnej identifikácii • má najčastejšie tvar URL adresy • Príklad: • chcem v mape tém reprezentovať domovsku stránku • Technickej Univerzity • - použijem k tomu jej URL adresu: http://www.tuke.sk
Identifikátory tém Identifikátor predmetu • Identifikátor predmetu (subject identifier) • Identita väčšiny predmetov môže byť vyjadrená len • nepriamo. • Nejaký informačný zdroj (obrázok, životopis, ...) môže človeku slúžiť ako indikácia skutočnej identity predmetu. Takému zdroju sa hovorí indikátor predmetu. Indikátor je inf. zdroj a je teda adresovateľný. Adresa indikátora predmetu tak nepriamo identifikuje tento predmet. • Adrese indikátoru sa hovorí identifikátor predmetu. • Príklad: • Chcem v mape tém reprezentovať reálneho herca Jaroslava Duška (nie je informačný zdroj a nemá svoju adresu). • Stránka http://www.osobnosti.cz/jaroslav-dusek.php obsahuje základné údaje o hercovi – je identifikátorom predmetu „Jaroslav Dušek“ v mape tém.
PSI • Pre globálne zdieľanie map tém je potreba používať jednotné indikátory. • Sada takýchto indikátorov sa volá PSI (Published Subject Indicator) – zverejnený indikátor predmetov. • V takýchto sadách sa nachádza indikátor nejakého predmetu, ktorý môžeme používať naprieč rôznymi aplikáciami. • Sadu PSI si može vytvorit ktokoľvek a môže mu pritom pomôcť organizácia, ktorá sa zaoberá sadami PSI: OASIS a ktorá ma doporučenia pre vytváranie sád PSI. • Taktiež ma existujúce sady PSI dostupné na • http://psi.oasis-open.org
Topic Maps vs. sémantický web • Prečo dva štandardy? • Topic maps vznikli v roku 2000, sw v r. 1999, keď sa o sebe • komunity dozvedeli, bolo už príliš neskoro na zjednotenie. • V mnohom sú tieto technológie podobné, lenže niektoré • ich technické aspekty sťažujú ich integráciu. Vo väčšine • prípadov sa dá prevádzať obojsmerná konverzia dát medzi • mapami tém a RDF. • RDF je pomerne nízkoúrovňové, zatiaľ čo mapy tém sú pre • ľudí intuitívnejšie. Adresovanie predmetov v RDF je • zložitejšie. • V RDF sú výroky vždy binárne a orientované • Mapy tém majú vzťahy vždy obojsmerné, môžu byť N-árne • a orientácia je nahradzovaná úlohami (roľami)
Príklady využitia map tém • správa taxonómií • Štátna správa aj komerčné firmy používajú rozsiahle • klasifikačné schémy. Mapy tém ponúkajú omnoho viac • ako taxonómiu a môžu byť v budúcnosti rozširované. • 2. integrácia knižničných katalógov • Mapy tém umožňujú zlúčenie viac nezávislých katalógov. • 3. sémantické portály • Mapa tém môže slúžiť k definovaniu informačnej • architektúry webu. • 4.E-learning • Mapy tém zachycujú vzťahy medzi znalosťami (témami). • ...
Syntax XTM - príklad Najjednoduchejšia XTM: <?xml version="1.0" encoding="UTF-8"?> <topicMap xmlns="http://www.topicmaps.org/xtm/1.0/" xmlns:xlink="http://www.w3.org/1999/xlink"> </topicMap> Vytvoríme si topik: <?xml version="1.0" encoding="UTF-8"?> <topicMap xmlns="http://www.topicmaps.org/xtm/1.0/" xmlns:xlink="http://www.w3.org/1999/xlink"> <topic id="jano"> <baseName> <baseNameString>Jano Hruska</baseNameString> </baseName> </topic> </topicMap>
Syntax XTM - príklad Priradíme typ topiku: <?xml version="1.0" encoding="UTF-8"?> <topicMap xmlns="http://www.topicmaps.org/xtm/1.0/" xmlns:xlink="http://www.w3.org/1999/xlink"> <topic id="jano"> <instanceOf> <topicRef xlink:href="#ucitel"/> </instanceOf> <baseName> <baseNameString>Jano Hruska</baseNameString> </baseName> </topic> </topicMap> Príklad je ale nekompletný, keďže referencia „ucitel“ neexistuje. Ale naš topik „jano“ je typu „ucitel“.
Syntax XTM - príklad Takže si skompletizujeme XTM a doplnime si mapu o tri nové topiky ... <topic id="ucitel"> <baseName> <baseNameString>ucitel</baseNameString> </baseName> </topic> <topic id="tu_ke"> <instanceOf> <topicRef xlink:href="#skola"/> </instanceOf> <baseName> <baseNameString>Technicka Univerzita Kosice</baseNameString> </baseName> </topic> <topic id="skola"> <baseName> <baseNameString>vysoka skola</baseNameString> </baseName> </topic> </topicMap>
Syntax XTM - príklad Pridáme udalosti ... <topic id="tu_ke"> <instanceOf> <topicRef xlink:href="#skola"/> </instanceOf> <baseName> <baseNameString>Technicka Univerzita Kosice</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#website"/> </instanceOf> <resourceRef xlink:href="http://www.tuke.sk/"/> </occurrence> </topic> ...
Syntax XTM - príklad A nakoniec vytvoríme asociácie (priradenia) <association id="jano-tu_ke-assoc"> <instanceOf> <topicRef xlink:href="#zamestnanie"/> </instanceOf> <member> <roleSpec><topicRef xlink:href="#zamestnanec"/></roleSpec> <topicRef xlink:href="#jano"/> </member> <member> <roleSpec><topicRef xlink:href="#zamestnavatel"/></roleSpec> <topicRef xlink:href="#tu_ke"/> </member> </association>
Software Ak si tento príklad uložíme na disk s koncovkou XTM, môžeme si ho pozrieť pomocou open-source, alebo aj pomocou komerčného softwaru. Open-source: 1. Od ONTOPIE - Ontopoly – obecný editor map tém - Omnigator – prehliadač map tém - Vizigator – vizualizačný nástroj 2. TM4L – Topic maps for E-learnig 3. TM4J – Topic maps for java – topic maps engine založený na jave 4. a veľa ďalších Niečo komerčné: TMcore05 (TM engine) – platforma .NET