1 / 22

RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski

RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski. Inhalt. Speicherung: RDF Source related Storage System ( RDF-S3 ) Anfrage: easy RDF Query Language ( eRQL ) Darstellung und Ranking der Ergebnisse. Ausgangspunkt. Zentrale Speicherung

kawena
Download Presentation

RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. RDF-S3 und eRQL:RDF-Technologien für InformationsportaleKarsten Tolle undFabian Wleklinski

  2. Inhalt • Speicherung:RDF Source related Storage System (RDF-S3) • Anfrage:easy RDF Query Language (eRQL) • Darstellung und Ranking der Ergebnisse

  3. Ausgangspunkt Zentrale Speicherung Datenbanken, ad-hoc Anfragen Dezentrale Speicherung Agenten, Peer-Peer, Alert-Systeme

  4. Fehlende Quellinformationen • Im RDF Modell ist die Speicherung der Herkunft der Daten nicht vorgesehen. Diese Quellinformationen sind jedoch nützlich zur: • Überprüfung der Daten (Aktualität) • Bezug weiterer Informationen (HTML) • Glaubwürdigkeit • Jeder kann beliebige Aussagen ins Internet stellen.

  5. http://www.abc.com vom 23.09.2004 http://www.abc.com vom 23.09.2004 Glaubwürdigkeit • Stimmen die Angaben? ????

  6. RDF-S3 Eigenschaften • Speicherung der Quellinformation zu jedem RDF Tripel • Möglichkeit zum Löschen und Aktualisieren einzelner Quellen • Optimierung durch Kombination der Generischen- und Schemaspezifischen-Repräsentation der RDF-Daten innerhalb der Datenbank

  7. RDF-S3 Aufbau • hohe Datenqualität durch semantische Überprüfungsfunktionen, die der integrierte Validating RDF Parser (VRP) bietet

  8. RDF-S3 Demo

  9. Problem – Verständnis • Real-World-Beispiel: • Zur Erzeugung dieser Präsentation wurde die Länge der Tower Bridge gesucht • Suche mit "Tower Bridge" length lieferte eine Menge Ergebnisseiten, aber: • Einheiten verschieden (z. B. “Fuß”) oder fehlend • “Länge” einer Brücke? • Spannweite? Gesamtlänge? Länge der beweglichen Teile? …? • Zwei „Kontexte“ nötig: Einheit und Längendefinition

  10. Problem – Verständnis • RDF Aussagen können oft nur in ihrem Kontext verstanden werden • Beispiel: Width of Golden Gate Bridge? • 90!  90? 90 Meter, 90 Inch, 90 Feet?

  11. eRQL • Ziele • So einfach wie möglich! • Nutzung der Möglichkeitendurch die Speicherung derQuellinformation! • Darstellung der Ergebnissein ihrem Kontext (sieheGolden Gate Bridge Beispiel)! Ein-Wort-Abfragen Dokumenten-Modus PointOfInterest-Modus

  12. Ein-Wort-Anfrage SELECT ?s, ?p, ?o WHERE ?s =~ „bridge“ AND ?p =~ „bridge“ AND ?o =~ „bridge“ ?????? • Sehr einfach und ohne Vorwissen einsetzbar! • Idee: nicht komplizierter als Google • Beispiel: Tripel, die „bridge“ enthalten • eRQL: bridge • RQL: select * from {X}@P{Y} where @P like "*[bB][rR][iI][dD][gG][eE]*" or X like "*[bB][rR][iI][dD][gG][eE]*" or Y like "*[bB][rR][iI][dD][gG][eE]*" • RDQL: ähnlich wie RQL • Perl ähnliche Notation

  13. Dokumenten-Modus 0: weglassen 1: einschränken • Ermöglicht die Einschränkung auf ausgewählte Quellen (oder das Weglassen nicht vertrauenswürdiger Quellen) • Syntax: <Anfrage;Quellen-Liste;0|1> • Beispiel: <bridge;3,4;1> • In RQL nicht vorgesehen! • In RDQL können in der from-Klausel Einschränkungen definiert werden • Aber kein gezieltes Weglassen

  14. PointOfInterest-Modus • Gibt den internen Kontext (umgebener RDF Graph) der einzelnen Treffer mit an • Ergebnisse können besser verstanden werden (siehe Golden Gate Bridge) • Die Größe des zu zeigenden Kontextes wird in der Anfrage definiert • Beispiel: [bridge] ohne Kontext bridge Kontextgröße 1 (default) ~ bridge Kontextgröße 2 ~~ bridge Kontextgröße 3 ...

  15. Golden Gate Bridge s:width 90 s:widthofsidewalk 10.5 rdf:comment All units of measurements are feet. eRQL PointOfInterest • eRQL erweitert Fundstellen zu “POIs” • benachbarte Aussagen werden hinzugefügt • z. B. “comment” zu “Golden Gate Bridge” s:name

  16. 268 Golden Gate Bridge 90 eRQL PointOfInterest • POIs werden auch für Sub-Queries gebildet • "Golden Gate Bridge" OR "Tower Bridge" s:name Tower Bridge s:length s:width s:name

  17. eRQL PointOfInterest • POIs werden auch für Sub-Queries gebildet • "Golden Gate Bridge"ANDwidth • POIs für “Golden Gate Bridge” und “width” werden gebildet • Vereinigung der POIs, falls diese überlappen, sonst leer • übereinstimmend mit “Google-Query” s:name Golden Gate Bridge s:width 90

  18. eRqlEngine • eRQL-Prototyp • kein Datenbank-Backend • arbeitet mit RDF-Dateien • einfache Installation • Details und Download: • www.dbis.informatik.uni-frankfurt.de/~tolle/RDF/eRQL/ • www.wleklinski.de/rdf/

  19. eRQL Demo

  20. Zusammenfassung RDF-S3 und eRQL bieten: • Überprüfbare Daten  mehrGlaubwürdigkeit • Antworten mit Kontext  mehrVerständnis der Ergebnisse • Anfragen können auf ausgewählte Quellen eingeschränkt werden  bessere Ergebnisse • sehr einfach  kann ohne Vorwissen genutzt werden (wichtig für Portale)

  21. Zukünftige Ziele • Steigerung der Performance von RDF-S3 und eRQL • Weitere nützliche Anfragemöglichkeiten untersuchen • Verbesserung der Ergebnisdarstellung • Versionsunterstützung für Quellen unter RDF-S3 • ...

  22. Danke für die Aufmerksamkeit Fragen? • Weitere Infos und Downloads: http://www.dbis.informatik.uni-frankfurt.de/~tolle/rdf/ • Kontakt: Karsten Tolle: tolle@dbis.informatik.uni-frankfurt.de Fabian Wleklinski: wleklinski@eworks.de

More Related