vyu itie prepojen ch d t v digit lnej kni nici n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Využitie prepojených dát v digitálnej knižnici PowerPoint Presentation
Download Presentation
Využitie prepojených dát v digitálnej knižnici

Loading in 2 Seconds...

play fullscreen
1 / 9

Využitie prepojených dát v digitálnej knižnici - PowerPoint PPT Presentation


  • 107 Views
  • Updated on

Využitie prepojených dát v digitálnej knižnici. Michal Holub školiteľka: prof. Mária Bieliková. holub@fiit.stuba.sk. FIIT STU. Motivácia. Digi tálne knižnice – rozsiahla doména, veľa dát Problémy s vyhľadávaním – tvorba a odporúčanie dopytov navigovaním – získanie prehľadu oblasti

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

Využitie prepojených dát v digitálnej knižnici


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
    Presentation Transcript
    1. Využitie prepojených dátv digitálnej knižnici Michal Holub školiteľka: prof. Mária Bieliková holub@fiit.stuba.sk FIIT STU

    2. Motivácia • Digitálne knižnice – rozsiahla doména, veľa dát • Problémy s • vyhľadávaním – tvorba a odporúčanie dopytov • navigovaním – získanie prehľadu oblasti • Potrebujeme • doménový model s rôznymi typmi vzťahov • model používateľa Holub, Bieliková - WIKT 2012

    3. Digitálne knižnice • Články, autori, časopisy, konferencie • Organizácie • Vydavateľstvá • Pracoviská (fakulty, ústavy) • Reprezentácia pomocou LinkedData • Pracujeme s ACM DigitalLibrary Holub, Bieliková - WIKT 2012

    4. Získavanie meta(dát) • Webový preliezač – sťahúň • Podľa ID získavame články • 1 článok = 1 HTML stránka • Zacielenie na aktivitu používateľa • Annota – sledujeme navštívené stránky v ACM • Sťahujeme primárne okolie navštívených ID • Parsovanie HTML na serveri • Získame • údaje o článku, abstrakt, referencie, KW, ACM triedy Holub, Bieliková - WIKT 2012

    5. Reprezentácia meta(dát) • RDF rámec: subjekt – predikát – objekt • Slovník BIBO – TheBibliographicOntology rdf:Resource book ID bibo:authorList property partOf link bibo:Article rdf:Resource author ID Holub, Bieliková - WIKT 2012

    6. Model používateľa • Aktivity pri práci s DL • Používame nástroj Annota • Zaznamenávame • Čas, skrolovanie • Vyznačený a skopírovaný text • Vyhľadávané výrazy • Zoznam zobrazených výsledkov • Zisťovanie záujmu o daný článok Holub, Bieliková - WIKT 2012

    7. Aplikácie – vyhľadávanie • SPARQL – náročný pre bežné vyhľadávanie • KW – nedostatočná vyjadrovacia sila • Preklad pseudo-prirodzeného jazyka do SPARQL • Articles by Peter Brusilovskyaboutadaptivelearning • Predspracovaniedatasetu • Rozloženie dopytu na časti • Konštrukcia SPARQL dopytu a vyhľadanie Holub, Bieliková - WIKT 2012

    8. Vyhľadávanie – kroky • Predspracovanie datasetu • Subjekty – konštrukcia slovníka prípustných entít • WordNet na rozšírenie termov o príbuzné slová • Keď hľadám paper a v datasete mám article • LinkedDatadatasety (DBpedia, YAGO) • Objekty – konštrukcia slovníka prípustných hodnôt • Prepájanie slov z dopytu na predikáty • Rozloženie dopytu • Stanford NLP na určenie slovných druhov Holub, Bieliková - WIKT 2012

    9. Zhrnutie • Hľadanie vzťahov – doménový model • Doména digitálnych knižníc • Linked Data • Jednoduchšie vzťahy • Získané z webu (RDF) • Zložitejšie vzťahy • Analýza správania používateľov • Použitie pri navigácii a vyhľadávaní Holub, Bieliková - WIKT 2012