1 / 13

Zjednotené vyhľadávanie nad prepojenými dátami na webe

Zjednotené vyhľadávanie nad prepojenými dátami na webe. Bc. Peter Macko. Vedúci: Ing. Michal Holub. Aký problém riešime?. Písanie dopytov pre sémantický web SPARQL – príliš zložitý Nutné poznať štruktúru dát N utné poznať syntax jazyka Slabá podpora vyhľadávačov

konane
Download Presentation

Zjednotené vyhľadávanie nad prepojenými dátami na webe

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Zjednotené vyhľadávanie nad prepojenými dátami na webe Bc. Peter Macko Vedúci: Ing. Michal Holub

  2. Aký problém riešime? • Písanie dopytov pre sémantický web • SPARQL – príliš zložitý • Nutné poznať štruktúru dát • Nutné poznať syntax jazyka • Slabá podpora vyhľadávačov • Využitie potenciálu prepojených dát Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub

  3. Naše riešenie Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Písanie dopytov v prirodzenom jazyku (Angličtina) • Využitie logických,množinových operátorov • Predspracovanie prepojených dát • Bez nutnosti poznania štruktúry • Usmernenie používateľa formou nápovedy • Podobný problém riešený v oblasti objektovo-relačných databáz • Nedostatok informácií o dátach

  4. Schéma fungovania Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub

  5. Predspracovanie dátového zdroja Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Tvorba lexikónov • Entít a vlastností objektov • Hodnôt objektov • Váhovanie výrazov • Hľadanie synoným • Hľadanie podobných slov (nadskupiny, podskupiny)

  6. Prvotné kroky metódy Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Rozhranie • Zachytenie dopytu (využitie rozšírenia Annota) • Predspracovanie dopytu • Rozdelenie dopytu • Odstránenie štylistických znakov

  7. Konvertovač na onto-slovník Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Analýza štruktúry vety • Transformácia slov z dopytu na slová zo slovníka • Využitie lexikónov • Podľa predspracovaného váhovania • Citlivosť na podmienky a množinové operácie

  8. Extraktor trojíc Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Využíva sadu pravidiel • Podľa typu entity • Identifikuje premenné pre SPARQL dopyt • Identifikuje hľadanú entitu z dopytu • Využíva extraktor filtra • Vyčleňuje podmienky a množinové operácie • Spracovanie <, >, =, AND, OR, Most, Less, ...

  9. Záverečné fázy metódy Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • SPARQL Transformácia • Transformácia trojíc • Transformácia filtra • Manažér dátového zdroja • Vykonanie SPARQL dopytu

  10. Príklady dopytov Akt:Person Akt:Conference Atk:has-author Atk:published-at Akt:Article-Reference Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Papers by Tvarozek from WWW • Lexikónu hodnôt + váhovanie • Dohľadanie zamlčaných členov

  11. Overenie jednotlivých častí metódy Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Transformátor na onto-slovník • Overenie váhovania transformácie • Systém vytvorí usporiadanie • Experti ohodnotia poradie relevancie • Overenie extraktoratrojíc • Porovnanie extrakcie trojíc expertom a našim nástrojom • Upravovač dopytov • Meranie času, za ktorý expert upravil dopyt našim nástrojom

  12. Overenie celkového systému Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Využitie dátovej množiny z projektu • Testovanie času konštrukcie dopytu • Porovnanie času tvorby SPARQL našou metódou a expertom • Porovnanie sa s existujúcimi riešeniami • Nasadenie na portáli ACM • Nasadenie cez rozšírenie Annota • Riadený experiment - so spätnou väzbou • Neriadený experiment – dlhší časový úsek

  13. Zhrnutie Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Písanie dopytov v prirodzenom jazyku • Dôraz na predspracovanie + váhovanie dátového zdroja + analýzu vety • Usmernenie používateľa pri písaní • Overenie metódy • Jednotlivé časti • Celková funkcionalita

More Related