1 / 14

Catalog Integration Made Easy

Catalog Integration Made Easy. P.J. Marrón, G. Lausen und M. Weber Universität Freiburg. eCatalogs sind die Grundlage des eBusiness. Gewünscht sind integrierte Kataloge. … diese funktionieren aber derzeit noch nicht zufriedenstellend: Physische Integration hat Nachteile,

Download Presentation

Catalog Integration Made Easy

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Catalog Integration Made Easy P.J. Marrón, G. Lausen und M. Weber Universität Freiburg

  2. eCatalogs sind die Grundlage des eBusiness. Gewünscht sind integrierte Kataloge. … diese funktionieren aber derzeit noch nicht zufriedenstellend: Physische Integration hat Nachteile, Logische Integration ebenso. Schön wäre eine Integration (fast) ohne Aufwand. Integration elektronischer Kataloge • das genau kann eine adaptive Auswertung leisten.

  3. jammer name company Anfrage: /department/mobile//jammer/price ? lokaler Katalog globaler Katalog products department computing jammer mobile … company name price product personel price

  4. Adaptive Auswertung von XPath XPath XPath Subanfrage-Transformationen Bewertung von Transformationen Integration elektronischer Katalog Architektur Experimente Zusammenfassung Übersicht

  5. Eine XPath-Query Q ist ein Location-Path der Form: L1/L2/.../Ln, wobei jedes Li eine Funktion geschrieben als Location-Step. (i) XPath Ein Location-Step hat die Form: axis::nodetest[predicate-expression] Jeder Location-Step Li definiert eine XPath-Subquery qi der Form: qi = (Ci, Li, Ci+1 ), wobei Ci der Input-Kontext und Ci+1 der Ausgabe-Kontext. • Für das Resultat res(Q) der Query Q gilt: • res(Q) = Ln(Cn) = Cn+1. • Der Ausgabe-Kontext einer Subquery ist induktiv definiert zu: • C1 = root, • Ci+1 = Li(Ci), 1 <= i <= n.

  6. A A Anfrage: /A/B/C B angenommene Dokumentenstruktur: (ii) XPath Subanfrage-Transformation C tatsächliche Struktur: A D "eliminate" A "eliminate" "generalize" /A/C C B /A/C /A//B/C C "generalize and eliminate" B C /A//B Transformation Transformation Transformation

  7. No transformation (n): verarbeite Subanfrage unverändert, Subquery generalization (g): ändern der Achse: child  descendent parent  ancestor Subquery elimination (e): übergehe die Subanfrage. (ii) Subanfrage Transformation:

  8. Seiqi = (Ci, Li, Ci+1 ). Anwendung der 3 Transformationsregeln "keine Transformation", "Generalisierung", und "Eliminierung" ergibt 3 Versionen von qi mit den entsprechenden Ausgabe-Kontexten NCi+1, GCi+1, ECi+1. Somit: Ci+1 = NCi+1 UGCi+1UECi+1. Bewertung der Antworten in Ci+1 mittels einer Fitness-Funktion in Abhängigkeit der angewandten Transformationsregel und der bereits berechneten Bewertung des Eingabe-Kontextes Ci. (iii) Bewertung von Transformationen

  9. Jeder Knoten n erhält einen Fitnesswert vn. Sei Ci der aktuelle Eingabe-Kontext. Sei n є Ci und Ci+1= NCi+1U GCi+1 UECi+1.Sei m є Ci+1. vm ist das Maximum von: wenn m є NCi+1 , dann vm = b2 + vn. wenn m є GCi+1 , dann vm = b + vn. wenn m є ECi+1, dann vm = 1 + vn. Und b = 10. Verwendete Fitness-Funktion

  10. Wir müssen Worte aus {n, g, e}* bewerten. Intuitiv sollte „n“ >> „g“, „n“ >> e“ sein. Jedoch warum „g“ >> „e“? Formal können wir auf den Worten eine gewünschte Ordnung definieren und die Fitness Funktion entsprechend definieren (sofern unsere Ordnung konsistent mit „n“ >> „g“, „n“ >> e“ ist). Rechtfertigung der Fitness-Funktion

  11. eee < perm{g,e,e} < perm{e,g,g} < ggg < perm{e,e,n} < perm{e,n,g} < perm{g,g,n} < perm{e,n,n} < perm{n,n,g} < nnn Seien e, g, n die entsprechenden Fitnessbewertungen. Dann können sie berechnet werden wie folgt: 3e < 2e+g; n > g 2e+g < e+2g; g > e … n-3g+2e > 0 2n+g<3n Allgemein: n > g, g > e, n – qlg + (ql - 1) e > 0, wobei qlLänge der Anfrage. Beispiel einer Ordnung: n=5, g=2, e=1

  12. II. Integration elektronischer Kataloge local catalog L2 R(L2) Q(G) Q(G) Q(G) global catalog Schema G local catalog L3 local catalog L1 R(L1) R(L3) R(L1,L2,L3) Q(G)

  13. Kataloge: Fehlerraten (in %) bei Anfragen an den globalen Katalog Anfragen an einen lokalen Katalog

  14. XPath ist die derzeit am intensivsten studierte Anfragesprache für XML. Eine adaptive Auswertung von XPath ist praktisch gut motivierbar. Qualität der adaptiver Auswertung empirisch belegt. Verschiedene Möglichkeiten zur Verbesserungen des Verfahrens definiert und implementiert. Adaptive Auswertungstechnik verspricht eine effiziente und skalierbare Integration elektronischer Kataloge. III. Zusammenfassung

More Related