1 / 18

Patrice Buche 1 Juliette Dibie-Barthélemy 2 Ollivier Haemmerlé 2 Rallou Thomopoulos 3

A Data Warehouse that Gathers Several Formalisms to Capture Data Heterogeneity, Imprecision and Incompleteness in the Field of Food Safety. Patrice Buche 1 Juliette Dibie-Barthélemy 2 Ollivier Haemmerlé 2 Rallou Thomopoulos 3. 1 Unité INRA - Mét@Risk 16, rue Claude Bernard

allan
Download Presentation

Patrice Buche 1 Juliette Dibie-Barthélemy 2 Ollivier Haemmerlé 2 Rallou Thomopoulos 3

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. A Data Warehouse that Gathers Several Formalisms to Capture Data Heterogeneity, Imprecision and Incompleteness in the Field of Food Safety Patrice Buche1 Juliette Dibie-Barthélemy2 Ollivier Haemmerlé2 Rallou Thomopoulos3 1Unité INRA - Mét@Risk 16, rue Claude Bernard 75231 PARIS Cedex 05 2UMR INA P-G / INRA MIA UER d’informatique 16, rue Claude Bernard 75231 PARIS Cedex 05 3INRA / UMR IATE Bat. 31, 2 place Viala 34060 Montpellier Cedex 01 EDA’2005

  2. Plan de l’exposé • Contexte • Présentation du système MIEL++ • Le sous-système XML • Conclusion et perspectives

  3. Contexte • Application Analyse du risque chimique et microbiologique dans les aliments. Sym’Previus, Mét@risk • Données Données scientifiques provenant de la bibliographie internationale, de sources industrielles, institutionnelles, … • Notretravail: Créer un outil pour: • stocker les données; • interroger les données.

  4.  Requêtes floues sur un entrepôt de données ouvert sur le Web  Données représentées par des distributions de possibilité  Données faiblement structurées Contexte • Contenu des données Comportement de germes pathogènes (e.g.: Listeria) et prévalence de contaminants chimiques (e.g.: Mercure) • dans les matières premières et les produits transformés • au cours du processus de transformation (chauffage, conservation, …) et de distribution. • Spécificités des données • Incomplètes • Imprécises • Hétérogènes • Évolutives

  5. Plan de l’exposé • Contexte • Présentation du système MIEL++ • Le sous-système graphes conceptuels • Le sous-système XML • Conclusion et perspectives

  6. XML wrapper XML fragments Xquery query XML base MIEL++ : architecture globale MIEL++ graphical user interface queries answers Global schema Ontology Views RDB wrapper CG wrapper Query graph SQL query Answer graphs Tuples relational database conceptual graph base

  7. Food Milk Meat Poultry PasteurizedMilk SkimMilk WholeMilk HalfSkimMilk Pork Beef PasteurizedWholeMilk MIEL++ – Ontologie • Une taxonomie de termes Ensemble d’attributs interrogeables (aliments, contaminants...), chacun ayant un domaine de définition : • Numérique (valeur de pH), • symbolique (liste de noms d’auteurs), • symbolique hiérarchisé. • Un schéma relationnel: ensemble de relations définies dans les bases de données locales de l’entrepôt (la relation FoodpH)

  8. Vue dans laquelle la requête est posée Critères de sélection Attributs de projection MIEL++ – Syntaxe d’une requête {a1, …, ap | Vue(a1, …, an)(ap+1 vp+1)…(am vm)}1pmn

  9. (attr  val) 1 HumanBodyTemperature attribute name fuzzy set 0,36 0 34 35 36,5 37,2 37,5 41 43 °C Critères de sélection flous • Expressions de préférences • (Temperature  HumanBodyTemperature)

  10. MIEL++ – Forme d’une réponse • Réponse à une requête dans MIEL++ {a1, …, ap | Vue(a1, …, an)(ap+1 vp+1)…(am vm)}1pmn tuple {[a1, …, ap], d}

  11. Q Degrés d’adéquation d’une donnée floue à un critère flou • Les sous-ensembles flous à comparer doivent être définis sur le même domaine Degrés d’adéquation Degré de possibilité [Zadeh 78] Degré de nécessité [Dubois&Prade 88] Formule (Q;D) = sup (min (µQ; D)) N(Q;D) = 1 - (Q;D) = inf (max (µQ;1-D)) Exemple D Q D Signification mesure d’intersection mesure d’inclusion

  12. 0 0 πD µQ Substrate Substrate 0,6 0 0 0 0 0 Milk Milk Meat Meat Poultry Poultry 0,6 0,2 0,6 0,4 0,6 0 0,6 1 0 0 0 0 PasteurizedMilk PasteurizedMilk SkimMilk SkimMilk WholeMilk WholeMilk HalfSkimMilk HalfSkimMilk Pork Pork Beef Beef 0,4 1 PasteurizedWholeMilk PasteurizedWholeMilk Fermeture d’un sous-ensemble flou sur domaine hiérarchisé requête Q données D 1 1 0,4 0,6 0,2 0 0 SkimMilk PasteurizedMilk WholeMilk PasteurizedWholeMilk Milk D satisfait Q avec le degré de possibilité(Q,D) = sup (min (µQ ; πD)) = 0,6

  13. Plan de l’exposé • Contexte • Présentation du système MIEL++ • Le sous-système XML • Conclusion et perspectives

  14. Extraction de tableaux XML base sml sml sml Base XML floue: alimentation avec AQWEB FSML ontologie MIEL++ Base de données relationnelles Base de graphes conceptuels AlimentpH(Aliment, pH)

  15. Sélection des arbres vuesGénération de requêtes XML A1 = {w1, …, wn, 1} A2 = {x1, …, xn, 2} A3 = {y1, …, yn, 3} A4 = {z1, …, zn, 4} Valuation de la requête Exécution d’une requête XML Q1 : {a,b | V1(a,b,c) (c  HumanBodyTemperature)} Base XML

  16. Source Tableau Source Contenu Tableau Source ligneRel Contenu Tableau AlimentPH ligneRel Contenu pH ql+pl Aliment AlimentPH ligneRel finalVal ql+pl+sl originalVal ql+pl pH 6.6 AlimentPH Aliment pH ql Aliment DFS originalVal fromage de chèvre finalVal finalVal ql originalVal ql DFS ValF ValF DFS ValF ValF ValF Item fromage frais Item lait de chèvre MD 0.5 MD 0.5 Item fromage Item fromage Item MD 0.66 MD MD 1 Exécution d’une requête XML : un exemple Vue Requête Données La réponse : {=0.66, fromage de chèvre, 0.66/fromage+0.5/lait de chèvre, pH=6.6}

  17. Conclusion • MIEL++ : architecture médiateur • BD relationnelle étendue au flou (environ 10000 données), en production • GC étendus au flou (environ 150 graphes conceptuels), prototype avancé validé • XML flou (156 tableaux issus de documents scientifiques), étude de pertinence effectuée, prototype avancé en cours de finalisation

  18. Perspectives • Extension du langage MIEL++: jointure entre sources de données • Application au calcul de l’exposition des individus au risque chimique • 2 sources de données: • Base de contamination des aliments • Base de consommation des aliments par des individus • AQWEB: Prise en compte de l’incertitude dans la méthodologie d’annotation sémantique et conséquence sur l’interrogation MIEL++

More Related