semsets model pre s mantick vyh ad vanie zoznamov ent t n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
SemSets Model pre sémantické vyhľadávanie zoznamov entít PowerPoint Presentation
Download Presentation
SemSets Model pre sémantické vyhľadávanie zoznamov entít

Loading in 2 Seconds...

play fullscreen
1 / 37

SemSets Model pre sémantické vyhľadávanie zoznamov entít - PowerPoint PPT Presentation


  • 96 Views
  • Uploaded on

SemSets Model pre sémantické vyhľadávanie zoznamov entít. Marek Ciglan Ústav informatiky SAV. Obsah. Sémantické vyhľadávanie – úvod Klasifikácia sémantických dopytov Sémantické vyhľadávanie množín Graf s atribútmi ako znalostná báza SemSets Model Vyhľadávanie v dokumentoch entít

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

SemSets Model pre sémantické vyhľadávanie zoznamov entít


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
obsah
Obsah
  • Sémantické vyhľadávanie – úvod
  • Klasifikácia sémantických dopytov
  • Sémantické vyhľadávanie množín
  • Graf s atribútmi ako znalostná báza
  • SemSets Model
    • Vyhľadávanie v dokumentoch entít
    • Šírenie aktivácie po topológii znalostnej bázy
    • Identifikácia (sémantických množín) SemSets
  • Vyhodnotenie
    • Dátová množina - SemSearch 2011
    • Hodnotenie relevancie odpovedí
    • Výsledky

21 November 2011

s mantick vyh ad vanie vod
Sémantické vyhľadávanie – úvod
  • Sémantické dáta
    • Zväčša trojice (RDF)
  • Vyhľadávanie v sémantických dátach
    • - dopytovacie jazyky (napr. SPARQL)

<http://dbpedia.org/resource/Aristotle> <http://dbpedia.org/ontology/birthYear>

"-0384"^^<http://www.w3.org/2001/XMLSchema#gYear> .

<http://dbpedia.org/resource/Aristotle> <http://dbpedia.org/ontology/influenced> <http://dbpedia.org/resource/Western_philosophy>

SELECT ?abstract

FROM NAMED <http://dbpedia.org>

WHERE {

{ <http://dbpedia.org/resource/Civil_engineering> <http://dbpedia.org/ontology/abstract> ?abstract.

FILTER langMatches( lang(?abstract), 'en') }

}

21 November 2011

ad hoc vyh ad vanie v s mantick ch d tach
Ad-hoc vyhľadávanie v sémantických dátach
  • ad-hoc vyhľadávanie = vyhľadávanie pomocou kľúčových slov
  • Cieľ: použiť dopyty formulované pomocou kľúčových slov (jednoduché pre užívateľa) na získavanie informácií zo sémantických dát
  • Vstup: neštruktúrovaný dopyt zložený z kľúčových slov
  • Výstup: zoznam entít zo sémantickej databázy usporiadaný podľa relevancie k dopytu
  • Vyhodnotenie: všetky odpovede sú ohodnotené nezávislým posudzovateľom, so znalosťou o dopyte a očakávaných výsledkoch

21 November 2011

ad hoc vyh ad vanie v s mantick ch d tach1
Ad-hoc vyhľadávanie v sémantických dátach
  • ad-hoc vyhľadávanie = vyhľadávanie pomocou kľúčových slov
  • Cieľ: použiť dopyty formulované pomocou kľúčových slov (jednoduché pre užívateľa) na získavanie informácií zo sémantických dát
  • Vstup: neštruktúrovaný dopyt zložený z kľúčových slov
  • Výstup: zoznam entít zo sémantickej databázy usporiadaný podľa relevancie k dopytu
  • Vyhodnotenie: všetky odpovede sú ohodnotené nezávislým posudzovateľom, so znalosťou o dopyte a očakávaných výsledkoch

SELECT ?abstract

FROM NAMED <http://dbpedia.org>

WHERE {

{ <http://dbpedia.org/resource/Civil_engineering> <http://dbpedia.org/ontology/abstract> ?abstract.

FILTER langMatches( lang(?abstract), 'en') }

}

21 November 2011

ad hoc vyh ad vanie v s mantick ch d tach2
Ad-hoc vyhľadávanie v sémantických dátach
  • ad-hoc vyhľadávanie = vyhľadávanie pomocou kľúčových slov
  • Cieľ: použiť dopyty formulované pomocou kľúčových slov (jednoduché pre užívateľa) na získavanie informácií zo sémantických dát
  • Vstup: neštruktúrovaný dopyt zložený z kľúčových slov
  • Výstup: zoznam entít zo sémantickej databázy usporiadaný podľa relevancie k dopytu
  • Vyhodnotenie: všetky odpovede sú ohodnotené nezávislým posudzovateľom, so znalosťou o dopyte a očakávaných výsledkoch

SELECT ?abstract

FROM NAMED <http://dbpedia.org>

WHERE {

{ <http://dbpedia.org/resource/Civil_engineering> <http://dbpedia.org/ontology/abstract> ?abstract.

FILTER langMatches( lang(?abstract), 'en') }

}

Givemeenglishabstratfor Civil engineering

21 November 2011

klasifik cia ad hoc dopytov zo s mantick ch
Klasifikácia ad-hoc dopytov zo sémantických
  • Dopyty na entity
    • Príklad: 1978 cj5 jeep, KARL BENZ, MIT
  • Dopyty na množiny entít
    • Príklad: republics of the former Yugoslavia, astronauts who walked on the Moon
  • Dopyty na vzťah medzi entitami
    • Príklad:
      • whatistherelationbetween X and Y
  • Dopyty na atribúty entít
    • Príklad:
      • zipcodewatervilleMaine,
      • heightof Kriváň
  • Iné ad-hoc dopyty

[J. Pound, P. Mika, and H. Zaragoza. Ad-hocobjectretrievalin the web of data. In Proceedings of WWW’10, 2010.]

21 November 2011

klasifik cia ad hoc dopytov zo s mantick ch1
Klasifikácia ad-hoc dopytov zo sémantických
  • Dopyty na entity
    • Príklad: 1978 cj5 jeep, KARL BENZ, MIT
  • Dopyty na množiny entít
    • Príklad: republics of the former Yugoslavia, astronauts who walked on the Moon
  • Dopyty na vzťah medzi entitami
    • Príklad:
      • whatistherelationbetween X and Y
  • Dopyty na atribúty entít
    • Príklad:
      • zipcodewatervilleMaine,
      • heightof Kriváň
  • Iné ad-hoc dopyty

[J. Pound, P. Mika, and H. Zaragoza. Ad-hocobjectretrievalin the web of data. In Proceedings of WWW’10, 2010.]

21 November 2011

s mantick vyh ad vanie mno n
Sémantické vyhľadávanie množín
  • Príklad dopytu: astronauts who walked on the Moon

21 November 2011

s mantick vyh ad vanie mno n1
Sémantické vyhľadávanie množín
  • Príklad dopytu: astronauts who walked on the Moon

21 November 2011

s mantick vyh ad vanie mno n2
Sémantické vyhľadávanie množín
  • Príklad dopytu: astronauts who walked on the Moon
  • Armstrong, NeilAlden
  • Aldrin, EdwinEugene, Jr.
  • Conrad, Charles Peter, Jr.
  • Bean, Alan Lavern
  • Shepard, Alan Bartlett, Jr.
  • Mitchell, EdgarDean
  • Scott, DavidRandolph
  • Irwin, JamesBenson
  • Young, JohnWatts
  • Duke, CharlesMoss, Jr.
  • Cernan, EugeneAndrew
  • Schmitt, HarrisonHagan

21 November 2011

graf s atrib tmi ako znalostn b za
Graf s atribútmi ako znalostná báza
  • Sémantické dáta ako množina trojíc:
  • Sémantické dáta ako atribútový graf:

<http://dbpedia.org/resource/Aristotle> <http://dbpedia.org/ontology/birthYear>

"-0384"^^<http://www.w3.org/2001/XMLSchema#gYear> .

<http://dbpedia.org/resource/Aristotle> <http://dbpedia.org/ontology/influenced> <http://dbpedia.org/resource/Western_philosophy>

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

L1

L3

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

L2

L1

21 November 2011

graf s atrib tmi ako znalostn b za1
Graf s atribútmi ako znalostná báza
  • Sémantické dáta ako množina trojíc:
  • Sémantické dáta ako atribútový graf:

<http://dbpedia.org/resource/Aristotle> <http://dbpedia.org/ontology/birthYear>

"-0384"^^<http://www.w3.org/2001/XMLSchema#gYear> .

<http://dbpedia.org/resource/Aristotle> <http://dbpedia.org/ontology/influenced> <http://dbpedia.org/resource/Western_philosophy>

Aristotle

birthYear:-0384

Western_philosophy

influenced

21 November 2011

semsets model
SemSets model
  • SemSets model je model pre vyhľadávanie sémantických množín
  • Odpovedať na otázky ako: „republics of the former Yugoslavia“ , „astronauts who walked on the Moon“
  • Využíva:
    • Metódy získavania informácií
    • Grafovú štruktúru znalostnej bázy
    • Informácie o sémantických množinách znalostnej bázy

21 November 2011

dbpedia
DBpedia
  • Projekt s cieľom extrahovať štruktúrované informácie z Wikipédie

http://wiki.dbpedia.org/

21 November 2011

semsets vyh ad vanie v dokumentoch ent t
SemSets – vyhľadávanie v dokumentoch entít
  • Využiť štandardné metódy získavania infomácií
  • Namiesto dokumentov máme atribútový graf
  • Nutnosť transformovať vrcholy atribútového grafu na dokumenty

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

L1

L3

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

L2

L1

21 November 2011

semsets vyh ad vanie v dokumentoch ent t1
SemSets – vyhľadávanie v dokumentoch entít
  • Využiť štandardné metódy získavania infomácií
  • Namiesto dokumentov máme atribútový graf
  • Nutnosť transformovať vrcholy atribútového grafu na dokumenty

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

L1

L3

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

Emtita K1

Attr I1: val

Attr I2: val

Attr I2: val

L2

L1

21 November 2011

semsets vyh ad vanie v dokumentoch ent t t
SemSets – vyhľadávanie v dokumentoch entítt
  • Príklad: „astronauts who walked on the Moon“
  • Medzivýsledok:
    • TheWonderofItAll (2007 film)
    • List of spacewalkers,
    • Moon Landing (musicdrama),
    • List of Apollo astronauts,
    • Harrison Schmitt

21 November 2011

semsets renie aktiv cie5
SemSets – šírenie aktivácie
  • Príklad: „astronauts who walked on the Moon“
  • Medzivýsledok:
    • Astronaut,
    • NASA,
    • Moon,
    • Apollo 15,
    • Apollo 12,
    • Apollo 11,
    • List of Apollo astronauts,
    • Apollo program,
    • BuzzAldrin,
    • Apollo17,
    • EugeneCernan

21 November 2011

semsets sk re s mantick ch mno n
SemSets – skóre sémantických množín
  • Predpokladáme existenciu sémantických množín obsahujúcich sémanticky podobné/príbuzné entity
  • Príklad pre DBpediu: entity patriace do jednej kategórie vo Wikipédii tvoria sémantickú množinu
  • Proces:
    • Kandidátsku množinu entít porovnáme so sémantickými množinami
    • Spočítame zlomok členov sémantických množín v kandidátskej množine
    • Vyberieme sémantické množiny, ktoré pravdepodobne obsahujú odpoveď na danú otázku

21 November 2011

semsets sk re s mantick ch mno n2
SemSets – skóre sémantických množín

SemSet 1

Card: 24

P: 0.125

21 November 2011

semsets sk re s mantick ch mno n3
SemSets – skóre sémantických množín

SemSet 1

Card: 24

P: 0.125

SemSet 2

Card: 5

P: 0.6

21 November 2011

semsets sk re s mantick ch mno n4
SemSets – skóre sémantických množín

SemSet 1

Card: 24

P: 0.125

SemSet 2

Card: 5

P: 0.6

SemSet 1

Card: 4

P: 0.75

21 November 2011

semsets sk re s mantick ch mno n5
SemSets – skóre sémantických množín
  • Príklad: „astronauts who walked on the Moon“
  • Medzivýsledok:
    • Category: People who have walked on the Moon,
    • Category: Skylab program
  • Váhovanie skóre podľa textovej podobnosti dopytu a dokumentov jednotlivých sémantických množín

21 November 2011

semsets sk re s mantick ch mno n6
SemSets – skóre sémantických množín
  • Príklad: „astronauts who walked on the Moon“
  • Medzivýsledok:
  • Armstrong, NeilAlden
  • Aldrin, EdwinEugene, Jr.
  • Conrad, Charles Peter, Jr.
  • Bean, Alan Lavern
  • Shepard, Alan Bartlett, Jr.
  • Mitchell, EdgarDean
  • Scott, DavidRandolph
  • Irwin, JamesBenson
  • Young, JohnWatts
  • Duke, CharlesMoss, Jr.
  • Cernan, EugeneAndrew
  • Schmitt, HarrisonHagan

21 November 2011

kon trukcia s mantick ch mno n
Konštrukcia sémantických množín
  • 2 prístupy:
    • Množiny definuje expert
    • Automatckydetekovať zo znalostnej bázy

21 November 2011

vyhodnotenie
Vyhodnotenie
  • Dátová množina – Yahoo! SemSearch 2011 challenge
  • Dopyty:
    • 50 dopytov na zoznamy entít
    • Vybraných z logov webového vyhľadávača
    • Vyhodnotenie odpovedí:
      • Amazon’s MechanicalTurk
      • Cloudsourcingsolution
      • Prostredie pre human intelligance computation
      • Ľudia (za finančnú odmenu) vykoávajú zadanú úlohu
      • Odpovede hodnotené 3 stuňami

21 November 2011

vyhodnotenie1
Vyhodnotenie

21 November 2011

vyhodnotenie2
Vyhodnotenie
  • Čiastočné funkcie SemSets modelu

21 November 2011

vyhodnotenie3
Vyhodnotenie
  • Vplyv použitého modelu na získavanie informácií

21 November 2011

zhrnutie
Zhrnutie
  • Predstavili sme úlohu ad-hoc vyhľadávania v sémantických dátach
  • Predstavili sme SemSets model pre vyhľadávanie zoznamu entít zo sémantických dát
  • SemSets model využíva:
    • Štandardné metódy vyhľadávania informácií
    • Šírenie aktivácie v topológii grafu definovaného znalostnou bázou
    • Informácie o sémantických množinách v znalostnej bázy
  • Vyhodnotenie: metóda má state-of-the-art presnosť na SemSearch 2011 data sete

21 November 2011