1 / 45

Intégration de l'information géographique dans les entrepôts de données et l'analyse en ligne : de la modélisation à la

Intégration de l'information géographique dans les entrepôts de données et l'analyse en ligne : de la modélisation à la visualisation. Sandro Bimonte Directeurs de thèse : Anne Tchounikine, Robert Laurini LIRIS, INSA de Lyon. Introduction. Plan. Contexte

milek
Download Presentation

Intégration de l'information géographique dans les entrepôts de données et l'analyse en ligne : de la modélisation à la

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Intégration de l'information géographique dans les entrepôts de données et l'analyse en ligne : de la modélisation à la visualisation Sandro Bimonte Directeurs de thèse : Anne Tchounikine, Robert Laurini LIRIS, INSA de Lyon

  2. Introduction

  3. Plan • Contexte • Information géographique et analyse spatiale • Modèles multidimensionnels et analyse en ligne • OLAP Spatial • Contributions • OLAP Géographique • GeoCube: Un modèle conceptuel pour l’OLAP Géographique • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives

  4. Information géographique et analyse spatiale Contexte • « La représentation d’un objet ou d’un phénomène localisé dans l’espace » (Degrene et Salgé, 1997) • Multi-facettes • Spatiale : position, forme • Sémantique : propriétés, relations • Systèmes d'Informations Géographiques • Mémorisation • Visualisation • Analyse • Itérative • Flexible

  5. Modèles multidimensionnels et analyse en ligne Contexte • « Une collection de données, intégrées, non volatiles et historisées pour la prise de décision »(Inmon, 1996) • Hypercube • Fait, mesures et dimensions • Agrégation (SUM, MIN, MAX, AVG, COUNT) • L'analyse OLAP • Forage, coupe, pivot, etc. • Interactive • Chemins et donnéesd’analyse définis a priori • Systèmes d'Informations Décisionnels

  6. Giorgio de chirico, Les muses inquiétantes • Contexte • Information géographique et analyse spatiale • Modèles multidimensionnels et analyse en ligne • OLAP Spatial • Contributions • OLAP Géographique • GeoCube: Un modèle conceptuel pour l’OLAP Géographique • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives

  7. OLAP Spatial : Définition Contexte OLAP Spatial • « Une plate-forme visuelle spécialement conçue pour supporter l’analyse et l’exploration spatio-temporelles rapides et faciles des données multidimensionnelles composées de plusieurs niveaux d’agrégation à l’aide d’affichages cartographiques aussi bien qu’à l’aide de tableaux et diagrammes statistiques » (Bédard, 1997) • La représentation cartographique permet de • Visualiser la distribution spatiale des faits • Visualiser les relations [spatiales] entre les faits et les dimensions • Visualiser les faits à différentes granularités spatiales

  8. (Malinowski et Zimányi, 2004) Concepts principaux Contexte OLAP Spatial • Dimension spatiale • Dimension comportant des attributs spatiaux(Bédard et al., 2001), (Malinowski et Zimányi, 2005), (Fidalgo et al. 2004) • Opérateurs spatio-multidimensionnels • Naviguer dans la dimension spatiale (Rivest et al., 2005) … • Couper l’hypercube spatial (Scotch et Parmanto, 2005), (Matias et Moura-Pires, 2007) …

  9. (Malinowski et Zimányi, 2004) Concepts principaux Contexte OLAP Spatial • Mesure Spatiale • Liste d'objets spatiaux (Stefanovic et al., 2000), (Rivest et al., 2001), (Malinowski et Zimányi, 2004) • Résultat d'opérateurs spatiaux (Rivest et al., 2001), (Malinowski et Zimányi, 2004) • Agrégation Spatiale • Extension des fonctions d’agrégation OLAP (Shekar et al., 2001)…

  10. Outils SOLAP Contexte OLAP Spatial • Types de solutions SOLAP(Rivest et al., 2005) • OLAP-SIG Intégrées, OLAP dominantes, SIG dominantes • Repenser l’architecture des systèmes décisionnels • Client SOLAP • Synchronisation des composantes tabulaire, graphique et cartographique • Dimension spatiale : carte • Mesures : variables visuelles et/ou affichages graphiques Scotch, et al. 05 Bédard, et al. 05

  11. Les modèles SOLAP sont-ils l’intégration de l’information géographique et des modèles multidimensionnels ? Contexte OLAP Spatial Bilan Objectifs • Prise en compte des composantes • Spatiale • Sémantique

  12. L’analyse SOLAP est-elle l’intégration de l’analyse OLAP et spatiale ? Contexte OLAP Spatial Bilan Objectifs Introduire de la dynamique

  13. Vincent Van Gogh, Les Champs de blé aux corbeaux • Contexte • Contributions • OLAP Géographique • Dimension Géographique • Mesure Géographique • Opérateurs multidimensionnels Géographiques • GeoCube: Un modèle conceptuel pour l’OLAP Géographique • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives

  14. Cas d’étude Contributions OLAP Géographique • CORILA • Organisation pour la sauvegarde environnementale, architecturale et économique de la lagune de Venise • Fournir aux spécialistes environnementaux un système pour l’analyse spatio-multidimensionnelle de données environnementales • Données • mesures de pollution • date • polluants • unités lagunaires

  15. Unité Objet Géographique Contributions OLAP Géographique • Une entité du monde réel • Des attributs descriptifs et un attribut spatial • Donnée de l'univers d'analyse

  16. Dimension Géographique Contributions OLAP Géographique • Une dimension est dite «géographique» si les membres d’au moins un niveau sont des objets géographiques • Types de hiérarchie

  17. Dimension Géographique Contributions OLAP Géographique • Une dimension est dite «géographique» si les membres d’au moins un niveau sont des objets géographiques • Types de hiérarchie • Descriptive

  18. Zone Unit Dimension Géographique Contributions OLAP Géographique • Une dimension est dite «géographique» si les membres d’au moins un niveau sont des objets géographiques • Types de hiérarchie • Descriptive • Spatiale

  19. Dimension Géographique Contributions OLAP Géographique • Une dimension est dite «géographique» si les membres d’au moins un niveau sont des objets géographiques • Types de hiérarchie • Descriptive • Spatial • Généralisation

  20. Mesure Géographique Contributions OLAP Géographique • Une « mesure géographique » est un objet géographique qui peut appartenir à un ou plusieurs schémas hiérarchiques • Une fonction d’agrégation par attribut • Prise en compte de la hiérarchie

  21. Opérateurs Multidimensionnels Géographiques Contributions OLAP Géographique • Navigation • Forage, coupe • Navigation dans la hiérarchie de la mesure • Modification • Permutation mesure/dimension • Création dynamique de nouveaux membres

  22. Edvard Munch, Le Cri • Contexte • Contributions • OLAP Géographique • GeoCube : Un modèle conceptuel pour l’OLAP Géographique • Modèle de données : Entité, Hiérarchie, Cube de Base • Modèle d’interrogation : Mode d’Agrégation, Vue • Algèbre : Opérateurs • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives

  23. Entité et Hiérarchie GeoCube Modèle de données • Une Entité représente les mesures et/ou les membres de dimensions • Sunit = name_unit, geometry, salinity, listofplants, type, farea • t1 = ’Canal Fondello’, P1, 24, list(‘Spartima Marittima’, ‘Fullica’), ‘Commercial’, 245100 • Les Entités sont organisées en hiérarchies • Hlagoon_spatial= Llagoon_spatial, Sunit, Sall_unit, lagoon_spatialoù Llagoon_spatial = {Szone} et (Sunitlagoon_spatial Szone) et (Szonelagoon_spatial Sall_unit) Un Schéma d’Entité Se est un tuple a1, …an, [F] où  i  [1,…n], ai est un Attribut défini sur un domaine dom(ai) et F, s’il existe, est un tuple f1,f2,…fm où l  [1,…m], fl est une fonction définie sur un sous-ensemble des attributs a1, …an Un Schéma de Hiérarchie est un tuple Hh = L h, h, h, h où : • Lh est un ensemble de Schémas d’Entité, • h et h sont deux Schémas d’Entité et h contient une seule instance (‘all’), • h est un ordre partiel défini sur l’ensemble des niveaux de la hiérarchie L hhh et h forme un treillis où h et h sont respectivement l’extrémité inférieure et l’extrémité supérieure de l’ordre

  24. Entité et Hiérarchie : propriétés GeoCube Modèle de données • Entité • Utilisée comme mesure et/ou membre de dimension • Attributs et attributs dérivés • Hiérarchie d'entités • Non-stricte • Non-couvrante • Représentation graphique Schéma de Hiérarchie Instance de Hiérarchie

  25. Cube de Base GeoCube Modèle de données • Table de faits où toutes les dimensions sont aux niveaux les plus détaillés • BCcorila = Hpollutants, Htime, Hlagoon_spatial, Hrate,  où  : I(Spollutant)I(Sday)I(Sunit)I(Srate5) • Un Schéma de Cube de Base BCbc est un tuple H1,…Hm+1,  où : •  i  [1,…m+1], Hi est un Schéma de Hiérarchie et toutes les hiérarchies Hi sont disjointes •  est une fonction booléenne définie sur I(1)...I(m+1) ( est définie sur les niveaux bottom des hiérarchies H1,…Hm+1) Instance de BCcorila

  26. Cube de Base : propriétés GeoCube Modèle de données • Représentation symétrique des mesures et des dimensions • « Unités polluées par polluant, jour et par degrés de pollution » • « Polluants présents par unité, jour et par degrés de pollution » • Relations n-n entre faits et dimensions • Mazzorbo polluée par du Méthane et du Sulfure à hauteur de 30-34 mg/l • Mesures multi-valuées • Mazzorbo et Murano sont polluées par du Zinc à hauteur de 45-49 mg/l

  27. Mode d’Agrégation GeoCube Modèle d’Interrogation Un Mode d’Agrégation k est un tuple Sa, Sb, F où : • Sa est un Schéma d’Entité a1,…am, [Fa ] • Sb est un Schéma d’Entité b1,…bp, [Fb ] • F est ensemble de p fonctions ad hoc d’agrégation i L’agrégation de n instances t1,… tn de Sa en utilisant un Mode d’Agrégation k = Sa, Sb, F est une instance de tb Sb tb = val(b1),…val(bp),val(d1),…val(dm) tel que : •  i  [1,…l], val(di) = fi(val(br),…val(bk)) où r, k  [1,…m] si Fb existe • g

  28. Mode d’Agrégation : propriétés GeoCube Modèle d’Intérrogation • Une fonction d’agrégation pour chaque attribut de la mesure agrégée • Les fonctions d’agrégation sont définies par l’utilisateur • Les mesures agrégées sont éventuellement différentes des mesures détaillées • Nombre d'attributs différents • Types des attributs différents

  29. Vue GeoCube Modèle d’Intérrogation • Établit quelle Entité est utilisée comme mesure et comment l’agréger • Le Schéma de Vue représente le schéma d’un cuboïde • L’Instance de Vue représente les données du cuboïde

  30. Vue GeoCube Modèle d’Intérrogation • Établit quelle Entité est utilisée comme mesure et comment l’agréger • Le Schéma de Vue représente le schéma d’un cuboïde • L’Instance de Vue représente les données du cuboïde

  31. Vue GeoCube Modèle d’Intérrogation • Vcorila-unit-month=BCcorila,Spollutant,Smonth,Srate5, fusion-unit,  • « Unités agrégées par polluant, valeur de pollution et mois » Un Schéma de Vue Vv est un tuple BCbc, L, k,  où : • BCbc = Hb1,…Hbm+1,  est un Schéma de Cube de Base, • L est un tuple de Schémas d’Entité SL1,…SLm tel que •  i, j  [1,…m],  l et  p  [1,…m], tels que SLi  L(Hbl), SLj  L(Hbp) et l p • k est un Mode d’Agrégation Sf, Saf, F tel que  •  h  {Hb1,…Hbm+1} tel que Sf = h et  i [1,…m], Sf L(H(BCbc , SLi)) •  est une fonction booléenne définie sur I(SL1)…I(SLm)I(Saf)

  32. Algèbre GeoCube Algèbre • Modèle • Soit Vv = BCbc, L, k,  alors Op (Vv) [paramètres] = V’v = BC’bc, L’, ’k, ’ où ’ est calculée en utilisant l’algorithme de l’opérateur

  33. Roll-Up () GeoCube Algèbre • Monter dans une hiérarchie et agréger les mesures • Dimension "classique" et mesure géographique • "Unités agrégées de la lagune par polluant, degrés de pollution et par mois" • (Vcorila-unit)[Smonth] • Dimension géographique et mesure complexe • "Mesure pollution par zones, mois, et polluants" • (Vcorila-pollutant)[Smonth] • Sans comptage multiple

  34. Classify et Specialize GeoCube Algèbre • Naviguer dans la hiérarchie de la mesure • Classify • Toutes les descendants dans la table des faits • « Zones dont toutes les unités sont polluées, pour chaque jour et pour chaque polluant ? » • w(Vcorila-unit)[Szone,fusion-zone] • Specialize • Au moins un descendant dans la table des faits • « Zones dont au moins une unité est polluée, pour chaque jour et pour chaque polluant ? » • v(Vcorila-unit)[Szone,fusion-zone]

  35. Autres opérateurs…. GeoCube Algèbre • Slice () coupe l’hypercube • à l'aide de prédicats spatiaux ou alphanumériques • membres des dimensions ou mesures • Dice (h) élimine une dimension • Permute (P) change le sujet d'analyse • Le niveau le plus détaillé de la hiérarchie devient la nouvelle mesure • La hiérarchie associée à la mesure est utilisée comme axe d’analyse • OLAP-Buffer (b) créeunnouveau membre géographique • A l'aide d'un opérateur de transformation spatiale • Recalcul les valeurs des mesures associées

  36. Requêtes complexes GeoCube Algèbre • Agrégation sur cousins : Slice + RollUp • Agréger les mesures à travers le changement de granularité de la mesure : Specialize + Permute + Classify/Specialize

  37. Fernandez Arman, Tubes Rouges • Contexte • Contributions • OLAP Géographique • GeoCube: Un modèle conceptuel pour l’OLAP Géographique • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives

  38. GeWOlap Contributions GeWOlap • Un système pour l’OLAP Géographique • OLAP-SIG intégré • Interface web synchronisée • Fondé sur GeoCube • Mesures géographiques • Dimensions géographiques • Opérateurs multidimensionnels géographiques • Forage • Coupe • Modification Architécture

  39. Client GeWOlap Contributions GeWOlap

  40. Dimension Géographique Contributions GeWOlap GeWOlap Drill-downPosition

  41. Mesure Géographique Contributions GeWOlap

  42. Autres opérateurs... Slice predicate Overlay Buffer

  43. Pablo Picasso, L’usine de Horta de Hebro • Contexte • Analiyse en ligne • Analisy Multiidmensionnelle • OLAP Spatial • Contributions • OLAP Géographique • GeoCube: Un modèle conceptuel pour l’OLAP Géographique • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives

  44. Conclusion • Un nouveau paradigme d’analyse multidimensionnel • Un modèle conceptuel multidimensionnel et une algèbre • Un système de navigation dans un hypercube géographique • Intégration de la composante sémantique de l’information géographique • Intégration de la flexibilité de l’analyse spatiale • Contrôle de la sématique de l’agrégation • Politiques de pre-agrégation géographique • Modèle complexe pour le recalcul des mesures

  45. Perspectives • GeoCube • Additivité des mesures géographiques • Hiérarchies de généralisation • Visualisation • Géovisualisation • Règles de sémiologie • GeOlaPivot Table • Ouvertures thématiques • Composante temporelle de l’information géographique • OLAP Géographique Mobile

More Related