Enhancing Spatial Association Rule Mining
180 likes | 277 Views
Learn about spatial association rules, support and confidence metrics, hierarchy structuring, ILP algorithms, and challenges in mining strong spatial rules. Expllore examples and algorithms to improve data analysis.
Enhancing Spatial Association Rule Mining
E N D
Presentation Transcript
Spatial Association Rule • X → Y • P1 .. Pm → Q1 .. Qn (c%) • Los predicaat: 1-predicate • Set van P1 t/m Pk: k-predicate
Support & confidence • sup(X → Y) • de kans dat de implicatie voorkomt in de dataset • conf(X → Y) = sup(X → Y) / sup(X)
Sterkte van een regel • Sterk = relaties in een regel komen vaker voor • Sterk = hoge support en confidence • … maar hoe hoog?
Minimum support/confidence • Input voor mining algoritme • Voor elk niveau in de hiërarchie • minsup[l] • minconf[l]
Voorbeelden (1) • Spatial antecedenten, non-spatial consequent • is_a(x, house) close_to(x, beach) → is_expensive(x) (85%)
Voorbeelden (2) • (Non)-spatial antecedenten, spatial consequent • is_a(x, gas_station) → close_to(x, highway) (50%)
Voorbeelden (3) • Combineren van support & confidence • is_a(A, large_town) intersects(A,B) adjacent_to(A, C) → is_a(B,motorway), C!=B, is_a(C,sea) (36%,80%
Hiërarchieën (1) • Data structureren in spatial hierarchy • Efficiënter • Processing gaat ‘top-down’ • Progressief zoeken • (road (national_highway (A27, A2, …), provincial_highway (N238, N235, …), city_street (Oudegracht, Heidelberglaan, …), …), …)
Hiërarchieën (2) water river sea lake Rijn Large lake Waddenzee Noordzee IJsselmeer
ILP Algoritme (1) • Gebaseerd op ILP • Inductive Logic Programming • ‘feature extraction’ om een deductive database te krijgen • Logische variant van relational database
ILP Algoritme (2) • Spatial observations • O[Amsterdam | Amsterdam]is_a(Amsterdam, large_town)intersects(Amsterdam, A2)intersects(Amsterdam, A10)close_to(Amsterdam, Schiphol)…
ILP Algoritme (3) • O[Schiphol | Amsterdam]is_a(Schiphol, airport)intersects(Schiphol, A4)… • O[s] = O[s|s] O[ri|s’]
ILP Algoritme (4) • Twee subproblemen • Find large/frequent spatial patterns • Generate strong spatial association rules • Prunen
Algoritme #2 (1) • Vindt sterke multi-level spatial association rules • Beperking zoekruimte • Relevant object set • Concept hierarchies • minsup/minconf
Algoritme #2 (2) • Predicaten berekenen op hoog niveau (lage resolutie) • Prunen adhv minsup[1] • Overblijvende predicaten berekenen op lagere niveaus
Algoritme #2 (3) • Alle k-predicates (voor alle k’s) berekenen • Prunen adhv minconf[l]
Conclusie • Veel problemen • Schaalbaarheid • Ontbrekende data • Nog veel user input nodig • O.a. minsup/minconf • Aantal oplossingen • Maar niet eenduidig