1 / 48

Niko Kwekkeboom

Informatik-Seminar im Sommersemester 2007 Agenten im Semantic Web. Ontologien im Semantic Web Am Beispiel der KArsruhe ONtology and Semantic Web Infrastructure (KAON). Niko Kwekkeboom. Seminar im Sommersemester 2007: Agenten im Semantic Web. Gliederung. Einleitung Semantic Web Grundlagen

jenny
Download Presentation

Niko Kwekkeboom

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Informatik-Seminar im Sommersemester 2007 Agenten im Semantic Web Ontologien im Semantic Web Am Beispiel der KArsruhe ONtology and Semantic Web Infrastructure (KAON) Niko Kwekkeboom Seminar Agentim im Semantic Web| 2007-06-22

  2. Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 2

  3. Beispiel: Die -Suche • Suchbeispiel: „Golf“ • ~390.000.000 Treffer (20.06.2007) • Umfassen Golfsport, VW Golf, Golf von Mexico etc. 1. Einleitung 3

  4. Beispiel: Die -Suche • Suchmaschinen indizieren Webseiten • Schlüsselwörter, Häufigkeiten, Verlinkung • Ranking-Kriterien geheim • Suchmaschine abhängig von guten Nutzereingaben für qualitative Ergebnisse • Bedeutung der Suchbegriffe kann nicht interpretiert werden • Unzulänglichkeiten in den vorhandenen Suchmöglichkeiten 1. Einleitung 4

  5. Semantic Web – Status quo • Semantic Web nicht als Ablösung, sondern Erweiterung des bestehenden Webs gedacht • Aktuelles Web Sammlung von menschenverstehbaren Daten • Suchergebnisse bzw. Rechnerunterstützung im allgemeinen unbefriedigend „The Semantic Web is not a separate Web but an extension to the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation.” Tim Berners-Lee, Scientific American, May 2001 1. Einleitung 5

  6. Semantic Web – Ziel • Sprachentwicklung zur Darstellung von Informationen in maschinenverstehbarer Form • Ziel: Daten maschinenverstehbarer gestalten und somit die Mensch-Maschine- und die Maschine-Maschine-Kommunikation verbessern  Der Computer weiß, ob bei der Eingabe Golf als Auto, Sport oder Ort gemeint ist 1. Einleitung 6

  7. Semantic Web – Anmerkung • Semantic Web immer noch eher Idee als Technologie • Umsetzung steckt noch in den Ansätzen • Konzepte und Technologien noch in den „Kinderschuhen“ • Vor allem Standardisierung dringend nötig 1. Einleitung 7

  8. Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 8

  9. Semantic Web – Architektur • Schichtenmodell des Semantic Web: Trust Rules Proof Data Logic Data Digital Signature Ontologyvocabulary Self- desc. doc. RDF + RDFS XML + NS + xmlschema Unicode URI 2. Semantic Web Grundlagen 9

  10. Semantic Web – Architektur Grundlage • Unicode: Plattformunabhängige, eindeutiger Standard zur Zuordnung von Zeichen zu Zahlen • URI (Unified Resource Identifier): Identifizierung einer abstrakten oder physikalischen Ressource Erweiterung • XML (eXtensible Markup Language): Technologie zur Formatierung von Dokumenten mit flexibler Struktur (Gegensatz zu HTML) • xmlschema: Grammatik für XML-Dokumente, Regeln für syntaktischen Aufbau • Selbst XML-Dokument • Namensräume (NS) zur Verhinderung von Konflikten eingeführt XML + NS + xmlschema Unicode URI 2. Semantic Web Grundlagen 10

  11. Semantic Web – Architektur RDF + RDFS • RDF (Resource Description Framework) • Setzt auf XML auf • Modell zur Repräsentation vom Metadaten • Konstruktion aus Statements, bestehend aus: Ressourcen, Eigenschaften, Aussagen • RDFS (Resource Description Framework Schema): • Beschreibt die Semantik eines RDF-Dokumentes, Aufbaukriterien festgelegt • Ermöglicht Klassenbildung und somit Hierarchien und Ableitungen 2. Semantic Web Grundlagen 11

  12. Semantic Web – Ontologien Ontologyvocabulary • Ontology: Formale Beschreibung von Gegenständen und deren Beziehungen zueinander • Basierend auf RDF(S) und Erweiterung (RDF: Programmiersprache; Ontologie: Programm) • Meist lediglich kontrollierte Vokabularien • Komplexe Relationen über Relationen eher selten gebraucht • Zentraler Bestandteil der Vision des Semantic Web • Ziel: Schaffung einer gemeinsamen Sprache • Je nach Nutzen kategorisier- und einteilbar • Nicht „die eine“ Ontologie; OWL als Empfehlung des W3C 2. Semantic Web Grundlagen 12

  13. Semantic Web – Architektur • Keine technologischen Erweiterungen, sondern Regelung darunter liegender Schichten • Logic: Daten in maschinenverarbeitbarer Form, ermöglicht Anfragen mit boolschen Operatoren, Quantoren und Kardinalitätsbeschränkungen • Proof: Agenten befähigen angebotene Beweise selbstständig nachzuvollziehen Datenquellen für Nutzer ersichtlich • Trust: Korrekte Informationen nötig, in offener Architektur schwierig sicherzustellen „trusted rating services“ zur Bewertung von Quellen Rechtevergabe: „Wo darf ein Agent was?“ • Digital Signature: Zur Missbrauchsverhinderung des Semantic Webs verlässliche digitale Signatur erforderlich • Proof und Trust bisher nur rudimentär verwendet, in Zukunft steigende Wichtigkeit Trust Proof Logic Digital Sig. 2. Semantic Web Grundlagen 13

  14. Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 14

  15. Kommunikation • Zur Kommunikation ist eine gemeinsame Sprache nötig, d.h.: • Übereinkunft über gemeinsame Symbole und Begriffe (Index), • deren Bedeutung (Glossar), • Klassifikation von Begriffen (Taxonomie), • Assoziation bzw. Vernetzung von Begriffen (Thesaurus/Topic Map) • Regeln und Wissen (Erfahrungen) darüber, welche Vernetzungen zulässig und sinnvoll sind (Ontologie). • Trifft in besonderem Maße auf die Kommunikation mit Maschinen zu 3. Ontologien 15

  16. Ontologien – Definition • Wortursprung im Griechischen: „ontos“=„sein“, „logos“=„Wort“ • Ursprüngliche Bedeutung in der Philosophie: Lehre des Seins und Seienden(Abgrenzung von der Lehre der verschiedenen Lebewesen in den Naturwissenschaften) • Untersuchung und Beschreibung der Realitäten und der Existenz von Dingen • Dinge sind als Grundlage klar definiert und akzeptiert • Verwand mit der Erkenntnistheorie 3. Ontologien 16

  17. Ontologien – Definition: Informatik • In der Informatik umfasst der Begriff Ontologien Techniken zur formalen Modellierung von Begriffssystemen • Konstruktion daher stark kontextabhängig (Komplexität/Einsatzzweck) • Formalisiertes Modell der Welt (Domäne) oder ein Teil der Welt (Sudomäne) • Keine einheitlichen, allgemeinen, vollständigen Regeln zur Konstruktion  Hoher intellektueller und logistischer Aufwand 3. Ontologien 17

  18. Ontologien – Aufbau • Dreigeteilter Aufbau: 3. Ontologien 18

  19. Ontologien – Elemente 3. Ontologien 19

  20. Ontologien – Typen • Top-Level Onthology: Weitgehend domänenunabhängiges Weltwissen z.B. Zustand, Zeit, Prozess etc. (Bsp.: „CyC“ oder „WordNet“) • Task Ontology, Domain Model Ontology: Grundlegendes (Sub-)Domänen-Vokabular (Bsp.: „UMLS“ – Unified Medical Language System) • Application Ontology: Von Domäne und Aufgabe abhängige Konzepte und Definitionen, i.d.R. Spezialisierung der anderen Zwei (Bsp.: „KA2 Ontology“) Top-Level Ontology Domain Ontology Task Ontology Application Ontology 3. Ontologien 20

  21. Ontologien – Sprachen (Schichtstruktur) • 2 Kategorien • Traditionelle in HTML • Webbasierte auf XML • RDF/RDFS als Grundlage für: • OIL (Ontology Inference Language) – europäische Entwicklung • DAML (DARPA Agent Markup Language) – parallele amerikanische Entwicklung • Zusammenschluss zu OWL (Web Ontology Language) – gemeinsame Weiterentwicklung  Empfehlung des W3C für OWL (Februar 2004) OWL DAML & OIL DAML OIL RDFS RDF XHTML HTML XML 3. Ontologien 22

  22. Ontologie – Sprachen: OWL • Spezifikation des W3C zur Erstellung, Publikation und Verteilung von Ontologien anhand formaler Beschreibungssprache • Erlaubt Beschreibung von Wissen auf maschinenlesbare Weise;Abbildung in dieser Logik ermöglicht eine formale Syntax und lässt logisches Schließen zu • Leichte Verständlichkeit und hohe Kompatibilität durch starke Einbindung von RDF und XML Syntax • Ausdrucksmächtigkeit geht über RDF hinaus; Sprachkonstrukte werden eingeführt, um Ausdrücke ähnlich der Beschreibungslogik formulieren zu können • Zielsetzung:  „Die“ Ontologiesprache des Internet zu werden • Teilweise Anforderungen inkompatibel, daher Definiton in drei Versionen 3. Ontologien 23

  23. Ontologie – Sprachen: OWL • OWL Full: Sämtliche existierende Sprachkonstrukte Bedeutung von vordefinierten Konstrukten veränderbar Nachteil: Mit Logik-Kalkülen nichtmehr erschließbar • OWL DL: OWL Description Logic Verlangt Typenunterscheidung Klassen & Attribute brauchen eindeutige Zuordnung • OWL Lite: Eingeschränkter als OWL DL Klassen nur bezüglich Oberklasen definierbar Sämtliche Relationen und Restriktionen nur auf benannten Klassen anwendbar Nur Kardinalitäten 0 und 1  Einfache, leicht verständliche Implementierung vs. schwache Ausdrucksstärke OWL Full OWL DL OWL Lite 3. Ontologien 24

  24. Ontologie – Werkzeuge • Erfolg neuer Technologien hängt eng mit der Qualität verfügbarer Werkzeuge zusammen • Kategorien an Ontologie-Werkzeugen: • Entwicklungswerkzeuge • Kombinations- und Integrationswerkzeuge • Evaluationswerkzeuge • Annotationswerkzeuge • Speicher- und Anfragewerkzeuge • Lernwerkzeuge 3. Ontologien 26

  25. Ontologie – Probleme • Ontologien große Rolle bei der Entwicklung des Semantic Web • Entwicklung noch nicht ausgereift, somit problematisch • Keine „die“ Ontologie – fehlender Standard • Entwicklungstools für Ontologien noch in Entwicklungsphase 3. Ontologien 27

  26. Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 28

  27. KAON – Eckdaten • http://kaon.semanticweb.org • Java 1.4 Plattform • SQL-DB (JBoss/Tomcatopt.) • Open Source (GNU LGPL) • Begonnen 2001 • Version 1.27 (2005) 4. KAON 29

  28. KAON – Entwicklung • Entwickelt durch Forschungszentrum Informatik (FZI) Karlsruhe und AIFB (Institute of Applied Informatics and Formal Description Methods der Universität Karlsruhe) • Tool Suite zur Erstellung und Verwaltung von Ontologien (Open-Source Infrastruktur) • Module, zur Erstellung und Realisierung von ontologiebasierten Anwendungen • Unterstützt klassische Ontologien- und Wissensmanagement-Konzepte, sowie relationale Datenbanksysteme • Referenzanwendung: VISION-PortalSemantisches „browsing und querying“ PortalUnterstützt Wissensmanagement bezüglich Unternehmen, Projekten, Forschungsgebieten und Software(derzeit nicht verfügbar!) 4. KAON 30

  29. KAON – Ontologie Sprache • Sprache wurde inkrementell entwickelt um Skalierbarkeit mit großen Ontologien und Wissensdatenbanken zu erhalten • Zuerst einfache an RDFS orientierte Kernsprache („Karsruhe perspective on ontologies“) • Definition von Konzepten, Relationen und teilweise Befehle hierauf • Zentral: Unterstützung der Lexikalisierung von Konzepten und Relationen • Tools: Simple Onotology Editor (KAON SOEP), Datenbank Mapper (KAON REVERSE), Prototyp für Views auf Ontologien (KAON VIEWS) • Spätere Erweiterung („Ontology-Instance (OI) models“) • Unterstützung von logischen Axiomen (Symmetrie etc.), Modularisierung, strikte Trennung von Ontologien und Insanzen, übergreifende Objekte • Komplette Überarbeitung der KAON API • Neue Tools: KAON Portal, KAON OI-modeler 4. KAON 31

  30. KAON – Ontologie Sprache (2) • Versuch 2 Sprachen parallel zu unterstützen • Bisher entwickelte proprietäre Sprache • OWL • Voller Sprachumfang von OWL für viele Anwendungen nicht benötigt • Bsp.: TEXTONTO extrahiert (semi-automatisch) semantische Zusammenhänge aus Texten Komplexe OWL-Axiome hier überfordernd  Letztendlich gewinnt OWL Oberhand, daher neue Entwicklung 4. KAON 32

  31. KAON – Module • Frontend – Hauptsächlich 2 Darstellungsformen • OI-Modeler (oimodeler) • KAON Portal (kaonportal) • Core – 2 zentrale APIs • KAON Ontology Language (apionrdf, apiproxy, engineeringserver, kaonapi, query) • RDF (rdfapi, rdfcrawler, rdfserver) • Libraries – Verschiedene Bibliotheken innerhalb KAONS auch außerhalb nutzbar • z.B. datalog, guibase, etc. 4. KAON 33

  32. KAON – Vorführung: Workbench (OI-Modeler) 4. KAON 34

  33. Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 35

  34. Zur Erinnerung: OWL DL (Folie 24) • OWL Full: Sämtliche existierende Sprachkonstrukte Bedeutung von vordefinierten Konstrukten veränderbar Nachteil: Mit Logik-Kalkülen nichtmehr erschließbar • OWL DL: OWL Description Logic Verlangt Typenunterscheidung Klassen & Attribute brauchen eindeutige Zuordnung • OWL Lite: Eingeschränkter als OWL DL Klassen nur bezüglich Oberklasen definierbar Sämtliche Relationen und Restriktionen nur auf benannten Klassen anwendbar Nur Kardinalitäten 0 und 1  Einfache, leicht verständliche Implementierung vs. schwache Ausdrucksstärke OWL Full OWL DL OWL Lite 3. Ontologien 36

  35. KAON2 – Entwicklung • Seit Juli 2005 Nachfolger von KAON (letzte veröffentlichte Version von KAON) • Entwickelt von Forschungskooperation aus: • Forschungsgruppe Information Process Engineering (IPE) am Forschungszentrum Informatik (FZI Karlsruhe) • Institute of Applied Informatics and Formal Description Methods (AIFB) and der Universität Karlsruhe • Information Management Group (IMG) an der University of Manchester 5. KAON2 37

  36. KAON2 vs. KAON(1) • Unterscheidung durch unterstütze Ontologie Sprachen: • KAON verwendet proprietäre RDF(S) Erweiterungen • KAON2 basiert auf OWL-DL und F-Logic  Beide Systeme somit nicht kompatibel ! 5. KAON2 38

  37. KAON2 – Ausstattung • Entwicklungswerkzeug für Ontologien basierend auf (über APIs): • OWL-DL • SWRL (A Semantic Web Rule Language – OWL+RuleML) • F-Logic (Frame Logic) • Features • Eigener Ontologie-Server, der Remote Methoden Zugriffe zulässt (RMI) • Anfragewerkezeuge um kombinierende Abfragen zu erstellen (SPARQL Syntax) • DIG-Interface für externe Tool-Zugriffe (Bsp. Protégé) • Extraktions-Modul zur Entnahme von Instanzen aus relativen DB 5. KAON2 39

  38. KAON2 – Projekte • Entwicklung teilweise duch EU IST project DIP 507483 finanziert • Verwendet in: • EU IST project OntoGov • EU IST project SEKT (und erweitert) • BMBF project SmartWeb • DLP translator (Grundlage) 5. KAON2 40

  39. KAON2 – OWL-Tools • Version 0.27: 16 Funktionen (Auswahl): • dump: gibt die Axiome und Entitäten der Ontologie aus • latex: gibt die Axiome in lateX-integrierbarer Form aus • filter: entfernt alle Axiome eines Typs • count: gibt die Anzahl an Axiomen (oder Entitäten) zurück • diff: zeigt alle Axiome die eine Ontologie mehr als eine andere hat an • merge: gibt eine Ontologie mit allen Axiomen zweier Input-Ontologien zurück • deo: ersetzt “nominals” durch einfache Klassen (schwächt so die Ontologie) • populate: füllt eine Ontologie zufällig mit Instanzen • dlpconvert: wandelt eine DL Ontologie in Regeln um • satisfiable: prüft die Reichhaltigkeit einer Ontologie 5. KAON2 41

  40. KAON2 – Anmerkung • Kommerzielle Version OntoBroker OWL, für Wissenschaft kostenlos • Vollständig in Java 1.5 implementiert • Benötigt JDK zur Ausführung; zusätzlich Apache ANT für Beispiele • Keine Verarbeitung von „nominals“ (Excptions bei: owl:oneOfclass und owl:hasValue)Große Kardinalitäten können (abhängig von anderen Axiomen) nicht verarbeitet werdenSomit keine volle OWL DL Abdeckung! (OWL Lite voll abgedeckt) • Dokumentation bisher nur an Beispielen vorhanden 5. KAON2 42

  41. Und was macht die Konkurrenz? • Protégé sehr verbreitet • Gut dokumentiert • Volle OWL-Unterstützung • Open Source • Plugin-Nutzung • Schnittstelle zu KAON2 Weitere: • CyC – Abbildung Weltwissen • WordNet – Wörterbücher 5. KAON2 43

  42. Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 44

  43. Zusammenfassung • Ontologien als semantisch „reichste“ Ebene der Kommunikation • Ontologien als zentraler Aspekt des Semantic Web • OWL als W3C empfohlene Sprache für Ontologien • Erfolg neuer Technologien abhängig von verfügbaren Tools • Derzeit verfügbare Werkzeuge noch in den „Kinderschuhen“, nicht massentauglich • Viele Projekte/Forschung um dies zu ändern 6. Zusammenfassung

  44. Ausblick • Große Hürde: Anwender finden, die Mehraufwand betreiben um maschineninterpretierbare Webinhalte zu erstellen • Kritische Masse an verfügbaren Inhalten muss erreicht werden, bevor Technologien nutzbar werden • Gut entwickelte Ontologien nötig um mit semantischem Markup Bedeutung herzustellen • Standardisierung erforderlich um parallel Entwicklung nicht kompatibler Systeme zu verhindern 6. Zusammenfassung

  45. Das Semantic Web – Eine Vision • Semantisch angereicherte Daten im Web • Voll maschineninterpretierbare Daten, ermöglichen „Mitdenken“ des Rechners • Persönlicher Web Agent • Reiseplanung • Logistikplanung • Terminplanung • Fremdverfügbarkeit • Kooperative Web Agenten • etc 6. Zusammenfassung

  46. Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 48

  47. Fragen Nööö… 7. Fragen und Diskussion

  48. Diskussion • Welche Technologien außer Ontologien können noch einen großen Einfluss auf den Erfolg des Semantic Web haben? • Wo liegen die Vor- und Nachteile von modularen oder globalen Wissenssammlungen? Was überwiegt? 7. Fragen und Diskussion

More Related