1 / 27

Uso di basi di conoscenza relazionali in applicazioni di Web Semantico

Uso di basi di conoscenza relazionali in applicazioni di Web Semantico. Fabrizio Baldini fbaldini@dsi.unifi.it Carlo Torniai torniai@dsi.unifi.it Enrico Vicario vicario@dsi.unifi.it. Contenuti. Utilizzo di basi di dati in applicazioni orientate al Semantic Web Scenario

huey
Download Presentation

Uso di basi di conoscenza relazionali in applicazioni di Web Semantico

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Uso di basi di conoscenza relazionali in applicazioni di Web Semantico Fabrizio Baldini fbaldini@dsi.unifi.it Carlo Torniaitorniai@dsi.unifi.it Enrico Vicario vicario@dsi.unifi.it Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  2. Contenuti • Utilizzo di basi di dati in applicazioni orientate al Semantic Web • Scenario • Problematiche • Valutazione delle soluzioni • Conclusioni e prospettive • Tesi di Laurea per il corso di Ingegneria Informatica, A. Matteini e T. Papi “Semantic Web: analisi dei metodi e sperimentazione delle tecnologie” Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  3. Web vs Semantic Web • Web attuale • le informazioni non hannostruttura semantica • la semantica è human understandable • le applicazioni possono ‘comprendere’ solo la sintassi • Semantic Web • associa alle risorseuna struttura semantica • caratterizza le risorse e le relazioni associandogli un significato particolare Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  4. Il Semantic Web • Benefici relativi allo sviluppo di applicazioni orientate al Semantic Web • L’informazione machine understandable • Interscambio dati • Relazioni semantiche tra i contenuti • Navigazioni tematiche e correlazioni dinamichetra contenuti • Capacità di retrieval semantico dei contenuti • Capacità di arricchire la base di conoscenza con conoscenza inferita Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  5. Problematiche • Cosa implica sviluppare una applicazioneorientata al Semantic Web? • Linguaggi standardizzati • Carenza di strumenti di sviluppo e best practices relative • Basi di conoscenza prevalentemente relazionali • La struttura relazionale non è consistente con la struttura semantica di una base di conoscenza Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  6. Semantic Web e Database • Il Semantic Web non richiede necessariamente interazione con dB • i dati possono essere memorizzati in documenti RDF o OWL • I database sono la soluzione più diffusa per la gestione di basi di conoscenza persistenti • risulta importante prevedere un riuso di strutture dati preesistenti Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  7. Semantic Web e Database • Problema di mismatch tra l’organizzazione semantica delle risorse e quella relazionale dei database Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  8. Semantic Web e Database • Analisi delle soluzioni architetturali per: • rendere persistente su un database una base di conoscenza semantica • consentire modalità di accesso semanticoa database relazionali • Le soluzioni identificate ed implementate sono: • database con schema semantico • modelli persistenti di Jena • D2RMap e D2RQ Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  9. Soluzione A: Database con schema semantico • Usa un database relazionale con schema che emulala struttura di documenti RDF • Svantaggi: • Non utilizza le tecnologie raccomandate dal W3C • Non supporta interrogazioni RDQL (solo SQL) Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  10. Soluzione B: Modelli di Jena¹ • Jena è un framework per lo sviluppo di applicazioni orientate al Web Semantico • Fornisce API per la creazione, gestione e interrogazione di documenti RDF • Consente di gestire basi di conoscenza semantiche come modelli: • in memoria • persistenti (su dB) [¹] http://jena.sourceforge.net Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  11. Soluzione B: Modelli di Jena • Vantaggi: • semplicità di gestione • trasparenza nelle operazioni • Svantaggi: • errori di ridondanza nel modello • difficoltà di manipolazione del result set API modello persistente di Jena Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  12. Soluzione C: D2Rmap e D2RQ¹ • I dati esistenti sono memorizzati in database • Necessità di tecniche che consentano: • riutilizzo dei dati e delle strutture • associazione di una struttura semantica • Tecniche di mapping disponibili: • D2Rmap (batch) • D2RQ (runtime) [¹] D2Rmap e D2RQ, http://www.wiwiss.fu-berlin.de/suhl/bizer Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  13. Soluzione C1: D2Rmap • Converte un database relazionale in una base di conoscenza semantica • utilizza una mappa per la conversione • genera un documento RDF a partire dai dati contenuti nel dB Mappa Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  14. Soluzione C2: D2RQ • Permette di interrogare un database relazionale utilizzando il linguaggio RDQL • utilizza dinamicamente una mappaper l’accesso semantico al contenuto del database • restituisce degli statement • gestisce database relazionali come grafi RDFattraverso le API di Jena Mappa Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  15. Riepilogo architetture A P I Soluzione A Database relazionale con schema semantico Soluzione B Modello Persistente Jena Mappa Mappa Soluzione C1 Mapping D2RMap Soluzione C2 Mapping D2RQ Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  16. Sperimentazione architetture • Sperimentazione delle diverse architetture per valutarne • complessità di implementazione • applicabilità (vincoli di legacy, compatibilità organizzativa) • prestazioni • Applicazione relativa ad un contesto reale e con requisiti definiti Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  17. Contesto del SUAP • Sportello unico per la gestione delle autorizzazioni necessarie alle imprese per la produzione di beni e servizi • La struttura del dB del SUAP è stata utilizzata come riferimento sia in fase di progettazione che in fase di sviluppo Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  18. Valutazione architetture • Identificazione delle architetture possibili: • Valutazione qualitativa e quantitativa (sem) Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  19. Valutazione qualitativa • Soluzione database con schema semantico • Complessità implementativa limitata • Non utilizza gli strumenti del Semantic Webma ne emula esclusivamente il funzionamento • Ostacola l’interoperabilità dell’applicazione ? • Soluzione file RDF • Complessità implementativa più elevata rispetto alla prima soluzione • Utilizza strumenti del Semantic Web • Poca flessibilità data dal tipo di modello persistente (file system) • Soluzioni Jena e D2R • Utilizzano appieno strumenti del Semantic Web • Differiscono per complessità implementativa (gestione delle API di Jena + utilizzo di tools di mapping nel caso di D2R) • Differiscono per prestazioni • L’utilizzo di strumneti di mapping risponde a vincoli di legacy Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  20. Valutazione prestazioni • Architetture software analizzate: • modello persistente di Jena, D2RQ e documento RDF • Cosa ci aspettiamo? • tempi di risposta più elevati per la soluzione con D2RQ che prevede una funzione di mapping intermedia • Analisi del tempo di riposta delle query: • con 8 query differenti, ognuna ripetuta per 50 volte, su KB contenenti 150.000 e 750.000 statements • Analisi del tempo di caricamento in memoria dei dati: • ripetuto 30 volte per ogni architettura, su KB contenenti 150.000 e 750.000 statements Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  21. Valutazione prestazioni: risposta in msec La soluzione con RDF comporta i tempi di esecuzioni migliori per le query La soluzione con D2RQ comporta tempi di esecuzione mediamente migliori rispetto alla soluzione con Jena ma molto elevati per il caricamento dei dati contrariamente alle aspettative! Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  22. Sviluppo di una applicazione • Implementazione di una applicazione orientata al Semantic Web • Obiettivi: • analizzare i problemi implementativi in un contesto con requisiti definiti che non imponesse vincoli di legacy • utilizzare tecnologie di riferimento • Strumenti: • API Jena • Protégé Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  23. Schema architetturale • Struttura MVC (persistent model, Jsp, Servlet) • Soluzione con modelli persitenti di Jena Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  24. Esplorazione • Implementazione di un’applicazione Web che offre un’interfaccia grafica per l’esplorazione di una base di conoscenza semantica • Funzionalità • elaborare e formulare la query in base alla richiesta dell’utente • interrogare modelli, dopo averli importati in memoria • validare i contenuti • estrarre le informazioni d’interesse • presentare le informazioni ricavate Barra di navigazione che si aggiorna in base al contenuto della pagina, machine understandable Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  25. Transazioni • Web application per aggiornamento di una KB sulla base di un’ontologia predefinita • Requisiti: • Conformità dai dati all’ontologia • Implementazione: • sono stati implementati i metodi • per gestire la creazione del modulo di inserimento dati a partire dall’ontologia • per validare ed inserire effettivamente i dati immessi dall’utente Modulo che viene creato in funzione dell’ontologia Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  26. Conclusioni • Abbiamo individuato e sperimentato architetture software che permettono lo sviluppo di applicazioni di Web Semantico su basi di conoscenza di dimensioni e caratteristiche realistiche • La convenienza delle varie implementazioni dipende dai vincoli di legacy e dalla organizzazione del processo di alimentazione della base di conoscenza • Il limite di prestazione non sembra costituire un ostacolo alla applicazione a contesti realistici Dipartimento di Sistemi e Informatica Univsrsità di Firenze

  27. Prosepettive • Applicazione alla creazione di portali di supporto alla aggregazione e cooperazione nello sviluppo di basi di conoscenza • Capacità di adattamento all’evoluzione del modello ontologico • Qualità dell’informazione • Fattori umani e organizzativi • La filosofia del Semantic Web e l’utilizzo di ontologie ha preso piede non solamente per la descrizioni di contenuti Web • annotazione e retrieval di contenuti multimediali • descrizione semantica di immagini, video, ecc. • La combinazione di contenuti descritti e correlati semanticamente può portare alla realizzazione di applicazioni fortemente interattive e con alto livello di usabilità Dipartimento di Sistemi e Informatica Univsrsità di Firenze

More Related