1 / 30

PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE. Laurent CARRARO mars 06. Plan. Introduction Formalisation Le phénomène réel Le simulateur Les problèmes à résoudre Métamodèles et géostatistique Modèles pour l’apprentissage Caractéristiques des expériences numériques

mikaia
Download Presentation

PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE Laurent CARRARO mars 06

  2. Plan • Introduction • Formalisation • Le phénomène réel • Le simulateur • Les problèmes à résoudre • Métamodèles et géostatistique • Modèles pour l’apprentissage • Caractéristiques des expériences numériques • Rappels de géostatistique • Computer experiments et géostatistique • Conclusions

  3. Plan • Introduction • Formalisation • Le phénomène réel • Le simulateur • Les problèmes à résoudre • Métamodèles et géostatistique • Modèles pour l’apprentissage • Caractéristiques des expériences numériques • Rappels de géostatistique • Computer experiments et géostatistique • Conclusions

  4. Exemple : exploration pétrolière Objectifs : • découvrir, évaluer et produire des réservoirs pétroliers. • objets complexes, difficilement accessibles, mal connus. • nécessité d’investir des sommes colossales. Risques financiers énormes nécessité de développer une méthode de gestion des incertitudes subsurface.

  5. Problèmes à résoudre • Trois types de problèmes • Propagation des incertitudes • Calage/qualification de codes • Optimisation • Enjeux et objectifs • Analyses de risques pour prise de décision • Maximiser la rentabilité

  6. Exploration pétrolière scénario(s) de production caractéristiques du réservoir SIMULATEUR évaluation de la production y1(t), y2(t),…, yn(t)

  7. Problèmes direct et inverse évaluation de la production caractéristiques du réservoir • En phase d’appréciation / développement • Quel impact les incertitudes sur les caractéristiques du réservoir peuvent avoir sur l’évaluation de la production et des réserves? Direct : propagation des incertitudes • En phase de production • Comment la connaissance de la production passée, avec ses erreurs de mesures, peut aider à mieux connaître les caractéristiques du réservoir et à affiner les prédictions de production? Inverse : calage

  8. Plan • Introduction • Formalisation • Le phénomène réel • Le simulateur • Les problèmes à résoudre • Métamodèles et géostatistique • Modèles pour l’apprentissage • Caractéristiques des expériences numériques • Rappels de géostatistique • Computer experiments et géostatistique • Conclusions

  9. Le phénomène réel Il est caractérisé par : • des variables d’intérêt yréel exemple : production de pétrole cumulée à venir • des variables d’environnement venv variables subies et mal connues, de grande dimension exemple : caractéristiques du sous-sol • des variables de contrôle ucont variables pouvant être fixées par l’utilisateur pour atteindre divers objectifs

  10. Le phénomène réel Variables d’environnement venv fréel Variables d’intérêt yréel Variables de contrôle ucont Ces variables sont liées selon le schéma fonctionnel suivant :

  11. Plan • Introduction • Formalisation • Le phénomène réel • Le simulateur • Les problèmes à résoudre • Métamodèles et géostatistique • Modèles pour l’apprentissage • Caractéristiques des expériences numériques • Rappels de géostatistique • Computer experiments et géostatistique • Conclusions

  12. Le simulateur • La fonction fréel est approchée par un simulateur. • Une nouvelle classe de variables, les variables de simulation, apparaît pour : • paramétrer le simulateur et/ou • l’ajuster (« tuning parameters ») • Ainsi : • ysim est laréponse estimée par le simulateur • uenv est une approximation des variables d’environnement de venv • ucont représente les variables de contrôle • usim est le vecteur des variables de simulation

  13. Variables de simulation usim Variables d’environnement uenv fsim Variables d’intérêt ysim Variables de contrôle ucont avec pour forme fonctionnelle : Le simulateur

  14. Plan • Introduction • Formalisation • Le phénomène réel • Le simulateur • Les problèmes à résoudre • Métamodèles et géostatistique • Modèles pour l’apprentissage • Caractéristiques des expériences numériques • Rappels de géostatistique • Computer experiments et géostatistique • Conclusions

  15. Les problèmes à résoudre • Propagation d’incertitudes Comment propager les incertitudes affectant la variable uenv sur la réponse ysim ? • Problèmes inverses Calage de paramètres / d’historique Les variables de contrôle sont fixées et le phénomène réel est observé. Comment ajuster les paramètres d’environnement et/ou de simulation pour reproduire les observations ? Optimisation des variables de contrôle Les variables de modélisation et d’environnement sont fixées et un ou plusieurs critères à maximiser introduits. Quel niveau des variables de contrôle ucont  maximise les critères ?

  16. Difficultés à surmonter • Dimension des variables du problème • Il faut réduire la taille des variables en présence • Analyses de sensibilités (globales) • Temps de calcul de fsim • Renault : simulation d’un cycle d’explosion dans un cylindre. Quelques heures de calcul pour simuler une fraction de secondes. • ONERA: une simulation de soufflerie à Mach 3 dure plusieurs semaines.

  17. Démarche adoptée • Approximation du simulateur • On remplace le simulateur fsim par une fonction plus simple, notée fapp. C’est la surface de réponse. • La réponse yapp donnée par la fonction fapp est liée aux variables d’environnement xenv, de contrôle ucont et d’approximation uapp par : • Plan d’expériences numériques • Pour construire la fonction approchée fapp, le simulateur est évalué sur un jeu de variables d’environnement, qui constitue un plan d’expériences numériques.

  18. En résumé Observations Réponses fréel Y fapp fsim Points d’évaluation du simulateur X

  19. Plan • Introduction • Formalisation • Le phénomène réel • Le simulateur • Les problèmes à résoudre • Métamodèles et géostatistique • Modèles pour l’apprentissage • Caractéristiques des expériences numériques • Rappels de géostatistique • Computer experiments et géostatistique • Conclusions

  20. Modèles pour l’apprentissage • Historiquement : reconnaissance des formes • Domaine frontière - data mining : • informatique • neurosciences • statistiques • Apprentissage supervisé : • apprendre une relation, une classification, • à partir d’une base d’exemples, • et d’informations a priori

  21. Quelques modèles du data mining • Modèles paramétriques : • Régression linéaire • Régression non linéaire • Modèles non paramétriques : • Lissage et splines • modèles semi-paramétriques (GAM, PPR…) • réseaux de neurones • machines à support vectoriel (SVM) • arbres de régression et forêts aléatoires • bagging et boosting

  22. Plan • Introduction • Formalisation • Le phénomène réel • Le simulateur • Les problèmes à résoudre • Métamodèles et géostatistique • Modèles pour l’apprentissage • Caractéristiques des expériences numériques • Rappels de géostatistique • Computer experiments et géostatistique • Conclusions

  23. Expériences numériques • Les variables d’environnement sont inconnues, mais on peut les fixer !! • Les points sur le bord du plan d’expériences sont de probabilité nulle. • Problème des plans d’expériences factoriels. • Répétabilité : fsim est une fonction !

  24. Plan • Introduction • Formalisation • Le phénomène réel • Le simulateur • Les problèmes à résoudre • Métamodèles et géostatistique • Modèles pour l’apprentissage • Caractéristiques des expériences numériques • Rappels de géostatistique • Computer experiments et géostatistique • Conclusions

  25. Rappels de géostatistique • Origine : statistique minière • Formalisme : • Variable régionalisée : z(x), x de dim 1,2 ou 3 • Hypothèse : z(x) est la réalisation d’une fonction aléatoire Z(x) • Observations : z(xi) ou z(xi)+i, pour 1in • Modèles stationnaires, avec dérive : Z(x) = t(x) + Y(x) • t est la tendance • Y est un processus stationnaire gaussien centré • cov(Y(x), Y(x+h)) = 2 R(h)

  26. Plan • Introduction • Formalisation • Le phénomène réel • Le simulateur • Les problèmes à résoudre • Métamodèles et géostatistique • Modèles pour l’apprentissage • Caractéristiques des expériences numériques • Rappels de géostatistique • Computer experiments et géostatistique • Conclusions

  27. Métamodèles et géostatistique • On écrit : fsim(uenv) = t(uenv) + y(uenv) • Commentaires : • L’alea sur y est une traduction de la régularité supposée de la fonction • le krigeage est une méthode d’interpolation • t est estimée par les techniques de data mining • R aussi, à partir de la nuée variographique • estimation du métamodèle et de son incertitude

  28. Plan • Introduction • Formalisation • Le phénomène réel • Le simulateur • Les problèmes à résoudre • Métamodèles et géostatistique • Modèles pour l’apprentissage • Caractéristiques des expériences numériques • Rappels de géostatistique • Computer experiments et géostatistique • Conclusions

  29. Conclusions… et perspectives • Projet DICE (Deep Inside Computer Experiments) • Géostatistique : • à adapter aux grandes dimensions • krigeage bayésien • Théorie des plans d’expériences à reconstruire dans ce contexte : • Suites à faible discrépance • Propriétés des projections des plans d’expériences sur des sous-espaces

  30. Eléments bibliographiques • Carraro L., Corre B., Helbert C., Roustant O. (2005), Construction d’un critère d’optimalité pour plans d’expériences numériques dans le cadre de la quantification d’incertitudes, Revue de Statistique Appliquée, LIII (4), p. 87-103. • Cressie N.A.C. (1993), Statistics for spatial data, Wiley series in probability and mathematical statistics. • Hastie T., Tibshirani R., Friedman J. (2001), The elements of statistical learning, Springer. • Jones D.R., Schonlau M., Welch W.J. (1998), Efficient global optimization of expensive black-box functions, J. of Global Optimization, 13, p. 455-492. • Oakley J.E., O'Hagan A. (2004), Probabilistic sensitivity analysis of complex models: a Bayesian approach, J. R. Statist. Soc. B, 66, 3, p. 751-769. • Sacks J., Welch W.J., Mitchell T.J., Wynn H.P. (1989), Design and analysis of computer experiments, Statist. Science, 4, p. 409-435. • Saltelli A., Tarantola S., Campolongo F., Ratto M. (2004) Sensitivity Analysis in Practice: A Guide to Assessing Scientific Models, Wiley. • Santner T.J., Williams B.J., Notz W.I. (2003), The design and analysis of computer experiments, Springer Series in Statistics. • Vapnik V. (1998), Statistical learning theory, Wiley. • Walter E., Pronzato L. (1994), Identification de modèles paramétriques à partir de données expérimentales, Masson.

More Related