Avtonomen sistem za zdru evanje podatkovnih omre ij
Download
1 / 13

Avtonomen sistem za združevanje podatkovnih omrežij - PowerPoint PPT Presentation


  • 94 Views
  • Uploaded on

Avtonomen sistem za združevanje podatkovnih omrežij. Tomaž Kuralt. Motivacija. Uvrstitev problema. Razločevanje entitet Uporaba različnih metrik Atributne metrike Relacijske metrike Težave obstoječih pristopov Dvoumnost Utežitev metrik Nastavitev meje podobnosti. Sistem.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Avtonomen sistem za združevanje podatkovnih omrežij' - blaine


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript


Uvrstitev problema
Uvrstitev problema

  • Razločevanje entitet

  • Uporaba različnihmetrik

    • Atributne metrike

    • Relacijske metrike

  • Težave obstoječih pristopov

    • Dvoumnost

    • Utežitev metrik

    • Nastavitev meje podobnosti



Predprocesiranje
Predprocesiranje

  • Izračun statistik iz podanega nabora podatkov

  • Nastavitev potrebnih parametrov

    • Ocena dvoumnosti

    • Utežitev atributov

    • Izbira atributa za Grupiranje


Grupiranje
Grupiranje

  • Zmanjšanje časovne zahtevnosti

  • Reference razvrstimo v skupine

  • Nadaljna primerjava le med pari, ki so znotraj istih skupin


Vzpostavitev za etnega stanja
Vzpostavitev začetnega stanja

  • Omrežja so nepovezana

  • Vzpostavimo začetno stanje povezanega omrežja

    • Enostavna shema

    • Relacijska shema


Iterativno zdru evanje
Iterativno združevanje

  • Podana omrežja zlivamo v eno omrežje

  • Algoritem:

    • Poiščemo vse pare podobnih referenc

    • Izračunamo njihovo podobnostno vrednost:

    • Ponavljamo:

      • Obravnamo par z največjo sim(ci,cj)

      • Če presodimo, da predstavljata isto entiteto ju združimo

      • Posodobimo sim(ci,cj) ostalim parom


Izdelava napovedi
Izdelava napovedi

  • Uporaba klasifikacije za izdelavo napovedi o združitvi

  • Vektor: [d1,d2,d3...,f1,f2,f3...,L]

  • Odločitve metrik

  • Kontekstualne lastnosti

    • Dvoumnost

    • Dolžina geodetke

    • ...


Rezultati realni podatki
Rezultati – realni podatki

  • Facebook & Twitter

    • F1=0,835 (s=0,139)

  • CiteSeer

    • F1=0,896 (s=0,011)


Rezultati sinteti ni podatki
Rezultati – sintetični podatki

  • Kakovost združevanja v odvisnosti od šuma

  • Kakovost združevanja v odvisnosti od strukturne podobnosti


Sklep
Sklep

  • Zadovoljni z rezultati

  • Pazljivost pri interpretaciji rezultatov

  • Možne izboljšave in razširitve sistema

    • Izgradnja več klasifikatorjev

    • Prevedba omrežij na skupno sintakso

    • Predstavitev resnične entitete v rezultatu



ad