240 likes | 320 Views
Can Kayal ı. OWL-Ontologieabgleich. partielle. Hybride,. für Dienstselektierung. im semantischen Web. Inhalt. Einführung OWL und OWL-S Semantischer Dienstabgleich OWLS-MX Ontologieabgleich OWLS-MX 2.0 Zusammenfassung. Geld. Flugticket. Ticketkauf. Datum. Thing. Ort. Ort.
E N D
Can Kayalı OWL-Ontologieabgleich partielle Hybride, für Dienstselektierung im semantischen Web
Inhalt • Einführung • OWL und OWL-S • Semantischer Dienstabgleich • OWLS-MX • Ontologieabgleich • OWLS-MX 2.0 • Zusammenfassung
Geld Flugticket Ticketkauf Datum Thing Ort Ort Geld Fahrzeug kostet Auto Fahrrad meinBMX OWL und OWL-S http://www.daml.org/services/owl-s/1.1/ http://www.w3.org/TR/owl-features
Inserate (advertisements) Inserate (advertisements) Inserate Thing Geld Fahrzeug kostet Auto Fahrrad Semantischer Dienstabgleich Matchmaker Geld Anfrage Fahrzeug Geld Fahrzeug Treffer Geld Auto Treffer Quittung
Inhalt • Einführung • OWL und OWL-S • Semantischer Dienstabgleich • OWLS-MX • Ontologieabgleich • OWLS-MX 2.0 • Zusammenfassung
OWLS-MX Ansatz • Abgleichfilter • exact • plug-in • subsumes • subsumed_by • nearest_neighbour • Erst logischer Abgleich; danach Fehlerkorrektur mittels syntaktischer Analyse • Automated Semantic Web Service Discovery with OWLS-MX, Klusch et. al Anfrage Dienst subsumed_by 0,85 Syntaktische Filter werden ebenfalls verwendet
Rüsseltier Zahl Addition Zahl Zahl Negation Zahl Zahl Subtraktion Zahl Zahl Zahl Elefant Zahl Addition Zahl Zahl Afrikanischer Elefant Wald- elefant Asiatischer Elefant Menschen Auto Autovermieten Geld Deutsche Japaner Datum Thing Auto Autoverkauf Geld Saarländer Pfälzer Lebewesen Satellitenschüsselreiniger OWLS-MX Nachteile Gründe für “false positives” • Granularität • Kein 1-1-Abgleich von Konzepten • Nichtabgeglichene Konzepte werden nicht analysiert • Nur Signaturabgleich Gründe für “false negatives” • Granularität • Ausschließlich Subsumptionsbeziehung
Inhalt • Einführung • OWL und OWL-S • Semantischer Dienstabgleich • OWLS-MX • Ontologieabgleich • OWLS-MX 2.0 • Zusammenfassung
Ontologieabgleich neu • Systeme • COMA++, Anchor-Prompt, OLA, ... • Surveys, Bücher • Ontology Matching • Contests (OAEI) • ISWC, ESWC • www.ontologymatching.org • Heterogenität von Ontologien • Verschiedene Sprachen, Terminologien, Modellierungen • “Ontology matching, alignment, mapping, merging” • An analysis of Ontology Mismatches; Heterogenity versus Interoperability, Visser et. al neu
Ähnlichkeit • Elementebene • Stringbasiert: Edit distance, N-grams, prefix, suffix z.B. yznisch - zynisch • Sprachbasiert: Stemmer, Wortart z.B. go - going • Bedingungsbasiert: Datentypvergleich z.B. 9/11 – 11. September • Bedeutungsbasiert: WordNet-Hierarchiedistanz z.B. Auto - Fahrzeug • Spezifische Thesauri: Abkürzungen, Domänenspezifisches Wissen z.B. ROI • Features of Similarity, Tversky • Simpack: A Generic Java Library for Similiarity Measures in Ontologies, Bernstein et al.
Ähnlichkeit von Konzepten Thing Fahrzeug Geld Auto Fahrrad Cabrio Steilheck Ontology-Based Similarity Between Text Documents on Manifold, Shadbolt et al.
Inhalt • Einführung • OWL und OWL-S • Semantischer Dienstabgleich • OWLS-MX • Ontologieabgleich • OWLS-MX 2.0 • Zusammenfassung
Ähnlichkeit von Diensten • Ähnlichkeitsmetriken für Diensten • Personalisiert, syntaktisch (Cosinus, LOI, Jensen-Shannon) • Ähnlichkeiten von Konzepten kombinieren • Bipartite Graphen, “maximum matching“ [Karp 74] • Eingabeabgleich, Ausgabeabgleich, Aggregation Person Fieber HerzFq Krankenhaus messFieber Pyrexia Krankenhaus Fieber Patient Arzt Chirurg
Pyrexia Fieber 0,9 Person Kranken haus 0,7 1,0 HerzFq Person Kranken haus Pyrexia Fieber Kranken haus Patient 0.9 0,7 1,0 0,6 0,6 Kranken haus Patient 0,8 HerzFq Arzt Chirurg 0,9 Arzt Chirurg 0,9 Bipartiter Abgleich sim(R,S) • Ähnlichkeiten größer als einem Schwellenwert werden berechnet • Maximaler Abgleich wird berechnet • Abgleichwert wird berechnet als Abgleichergebnis / Anzahl abgeglichener Kanten (2,6 / 3 = 0,87) • Ausgabekonzepten werden auch dementsprechend abgeglichen • Beide Ergebnisse sind aggregiert: result = ¢ inputresult + ¢ outputresult + = 1 (z.B. 0,5 ¢ 0,87 + 0,5 ¢ 0.9 = 0,8895)
Person Hospital LSC equal Hospital Patient Doctor Surgeon Pyrexia Fever equal LSC Person Hospital LSC equal HeartFq Pyrexia Fever equal Hospital Patient LSC HeartFq Doctor Surgeon LSC Bipartiter Abgleich degree(R,S) • Die terminologischen Beziehungen zwischen den Eingabekonzepten werden berechnet • Maximaler Abgleich wird berechnet (equal > LSC > subsumes) • Abgleichwert ist die minimale Kantenwert wenn alle grüne Kanten abgeglichen sind. (Ausnahme bei partiellem Abgleich) • Ausgabekonzepten werden dementsprechend abgeglichen • Beide Ergebnisse sind aggregiert: result = min(resin, resout) (z.B. min(LSC, equal) = LSC)
Partieller Abgleich • Wähle 2 [0,1] • Matchmaker toleriert einen Nichtabgleich von maximal der Konzepte • Die Gruppenähnlichkeit von den nicht abgeglichenen Konzepten zu den abgeglichenen Konzepten ist das Abgleichergebnis • Wenn = 1, dann purer logischer Abgleich für die logischen Filter • Wenn = 0, dann kein logischer Abgleich, nur hybride Ähnlichkeiten werden verwendet
Hybrider Abgleich • Ähnlichkeitsmetriken sind: • Syntaktische Ähnlichkeit • Eigenschaftsbasierte Ähnlichkeit • Ontologie-Distanz • WordNet-Ähnlichkeit • …
DRAFT OWLS-MX 2.0 Screenshot
OWLS-MX 2.0 Gegeben: Ontology O, Anfrage R, Menge von Diensten D, , , Matchermenge M Gesucht: relevante Dienste 2D • 8S2D berechne relaxierte degree(r,s) • Für hybride Filter berechne sim(r,s) • Ordne die Ergebnisse nach Grad und Wert
Inhalt • Einführung • OWL und OWL-S • Semantischer Dienstabgleich • OWLS-MX • Ontologieabgleich • OWLS-MX 2.0 • Zusammenfassung
Relevante Arbeiten • Dienstselektierung: • OWL-S/UDDI Matchmaker (CMU) • OWLSM (TU Berlin) • Automatic Composition and Selection of Semantic Web Services, Springer LNCS • Ontologieabgleich: • COMA++ (U Leipzig) • Anchor/PROMPT (Stanford) • OLA (INRIA Rhône-Alpes/Université de Montreal) • Ontology Matching, Euzenat, Shvaiko • A Survey of Schema-based Matching Approaches, Euzenat, Shvaiko • Semantic Integration: A Survey of Ontology-based Approaches, Noy • Ontology Mapping: The State of the Art, Kalfoglou, Schorlemmer
Zusammenfassung • Partielle Abgleiche werden erlaubt um die Ausbeute zu erhöhen • Hybride Filter tendieren dazu, die Genauigkeit zu erhöhen • Bessere Genauigkeit und Ausbeute • Gute Basis für Personalisierung nach Präferenzen, vergangenen Aktionen • Kompliziert • Semantische Kombination von Ähnlichkeitsmetriken