1 / 30

Intérêt et principes des analyses multivariées

Intérêt et principes des analyses multivariées. FRT C7. Analyse multivariée par opposition à univariée en complément d’une analyse univariée. Rappel sur l’analyse univariée. Analyse univariée : relation entre 2 variables Principe : Hypothèse nulle d ’indépendance (H0)

joie
Download Presentation

Intérêt et principes des analyses multivariées

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Intérêt et principes des analyses multivariées FRT C7

  2. Analyse multivariée • par opposition à univariée • en complément d’une analyse univariée

  3. Rappel sur l’analyse univariée Analyse univariée : relation entre 2 variables • Principe : • Hypothèse nulle d ’indépendance (H0) • Hypothèse alternative de relation (H1) • entre une variable dépendante, à expliquer et une variable expliquante • Quantification de la différence entre l’observation et la théorie sous l’hypothèse nulle • test statistique dépend du type de variable

  4. Principaux tests d ’analyse univariée • 2 variables qualitatives (catégorielles) • guérison oui/nonvs traitement A/B • test du chi² ou test exact de Fisher

  5. Principaux tests d ’analyse univariée • 2 variables qualitatives (catégorielles) • guérison oui/nonvs traitement A/B • test du chi² ou test exact de Fisher • 1 variable qualitative et 1 variable quantitative • récidive oui/non vs taille initiale de la tumeur • Tests de comparaisons de moyenne : • distribution normale de la variable quantitative • 2 groupes : test t • > 2 groupes : analyse de variance (ANOVA) • petits effectifs ou distributions non normales • 2 groupes : test de Mann Whitney • > 2 groupes test de Kruskall Wallis

  6. Principaux tests d ’analyse univariée • 2 variables qualitatives (catégorielles) • guérison oui/nonvs traitement A/B • test du chi² ou test exact de Fisher • 1 variables qualitative et 1 variable quantitative • récidive oui/non vs taille initiale de la tumeur • test t (distrib. normale de la var quantitative) ou test de Mann Whitney (Kruskall Wallis) pour petits effectifs • 2 variables quantitatives • production d ’une protéine vs dose d’une substance • test du coefficient de régression r

  7. Principaux tests d ’analyse univariée • 2 variables qualitatives (catégorielles) • guérison oui/nonvs traitement A/B • test du chi² ou test exact de Fisher • 1 variables qualitative et 1 variable quantitative • récidive oui/non vs taille initiale de la tumeur • test t (distrib. normale de la var quantitative) ou test de Mann Whitney (Kruskall Wallis) pour petits effectifs • 2 variables quantitatives • production d ’une protéine vs dose d’une substance • test du coefficient de régression • 1 variable qualitative et 1 variable censurée • traitement A/B vs délai de récidive tumorale • test du log rank

  8. Estimation de courbes de survie par la méthode de Kaplan Meïer Taux de survie 100 % Traitement A Traitement B 50 % 3 9 12 6 Temps (mois)

  9. Principe de l ’analyseunidimensionnelle Sexe Age ? ? Réponse au traitement (Evènement à expliquer) ? Génotype viral Stade histologique ? ? ? ? Charge virale Ancienneté de l ’infection Mode de contamination

  10. Principe de l ’analyseunidimensionnelle Sexe Age S S Réponse au traitement (Evènement à expliquer) S Génotype viral Stade histologique S S NS S Charge virale Ancienneté de l ’infection Mode de contamination

  11. Intérêt de l ’analysemultidimensionnelle Sexe Age Réponse au traitement (Evènement à expliquer) Génotype viral Stade histologique S S S S Ancienneté de l ’infection S Mode de contamination S Charge virale

  12. Intérêt de l’analysemultivariée Sexe Age Réponse au traitement (Evènement à expliquer) Génotype viral Stade histologique Ancienneté de l ’infection Charge virale Mode de contamination Quels sont les facteurs indépendamment liés à l’événement ? Qui apportent chacun une part d’explication complémentaire ?  Stratégies thérapeutiques différentes en fonction de ces facteurs

  13. Types d’analyses multivariées • Analyses bivariées : relation entre 2 facteurs en prenant en compte un 3ème : (2 variables explicatives potentielles) • Test de Mantel-Haenszel • Analyse de variance à 2 facteurs • Test du Log rank ajusté

  14. Types d’analyses multivariées • Analyses bivariées : relation entre 2 facteurs en prenant en compte un 3ème : (2 variables explicatives potentielles) • Test de Mantel-Haenszel • Analyse de variance à 2 facteurs • Test du Log rank ajusté • analyses multidimensionnelles : font appel à des modèles mathématiques • Régression logistique • Modèle de Cox • Régression multiple • (analyse discriminante, analyse factorielle ….)

  15. Analyse bivariée : test de Mantel-Haenszel Question : en univariée traitt A > traitt B ; Vrai ou liée à une mauvaise répartition d’un facteur lié à la réponse au traitt ? Réponse: on étudie la relation réponse/traitt à chaque niveau du facteur : Strate Génotype 1 Strate génotype non 1 réponse réponse oui non oui non A pA1 A pAnon1 traitt traitt B pB1 B pBnon1 pA1 > pB1 pAnon1 > pBnon1 Conclusion : A > B indépendamment du génotype (à niveau égal de génotype)

  16. Figure 1 Non & occasional cannabis smokers Daily cannabis smokers 80 p=0.03 (Mantel-Haenszel statistics) 57.9% 60 Fibrosis > F2 (%) 44.4% 42.9% 40 22.6% 20 0 Age at biopsy (yrs)  40 > 40

  17. Exemple numérique Rep + Rep- TtA 70(60)(40)30 100 Tx rép 70 % vs 50 % TtB 50(60)(40)50 100 ² = 8,33 p < 0,001 120 80 200

  18. Exemple numérique Rep + Rep- Rep + Rep - TtA 70 30 100 Geno 1 60 60 120 TtB 50 50 100 Geno non1 60 20 80 120 80 200 120 80 200 Tx rep : 50 % vs 75 %, p< 0,001

  19. Exemple numérique Rep + Rep- Rep + Rep - TtA 70 30 100 Geno 1 60 60 120 TtB 50 50 100 Geno non1 60 20 80 120 80 200 120 80 200 Geno 1 Gnon 1 TtA 40 60 100 33 % vs 75 % de TtA TtB 80 20 100 p < 0,0001 120 80 200

  20. Exemple numérique Test de Mantel Haenszel Geno 1 Geno non1 Rep + Rep- Rep + Rep- TtA 20(20)20 40 TtA 50(45)(15)10 60 TtB 40(40)40 80 TtB 10(15) (5) 10 20 60 60 120 60 20 80 Rep+ Rep- TtA 70(65)(35)30 100 TtB 50(55)(45) 50 100 ² = 2,11 NS 120 80 200

  21. Analyse bivariée : ANOVA à 2 facteurs • Question :en univariée traitt A > traitt B sur la taille tumorale; Vrai ou liée à une mauvaise répartition d’un facteur lié à la réponse au traitt ? • Réponse :l ’ANOVA permet de tester : • l ’effet du traitement« à niveau égal » de l ’autre facteur • l ’effet de ce facteur, indépendamment du traitement • l ’interaction traitement x facteur : l ’effet du traitement est-il différent selon le niveau de l ’autre facteur ?

  22. Exemple d’ANOVA à 2 facteurs • Variable à expliquer : vitesse de progression de la fibrose après TH pour cirrhose C • 2 variables explicatives : • Le génotype viral VF gén1 > VF gén non1 • L’immunosuppresseur : VF ss tacrolimus > VF ss ciclosp • Résultats: ciclo tacro Vit Fibrosegéno non1 0.316 0.207 0.280 effet génotype géno 1 0.606 0.837 0.659 p = 0.008 0.540 0.627 0.562 interaction : p = 0.315 effet immunosup : p = 0.718

  23. Analyse bivariée : test du Log rank ajusté Taux de survie 100 % Traitement A sans métastase 50 % Traitement B sans métastase Traitement A avec métastases Traitement B avec métastases 0 % 1 3 2 4 5 Temps (ans) Permet de conclure A > B, qu’il y ait ou non des métastases initiales

  24. Stratification vs ajustement Stratification = prendre en compte un facteur lié au critère de jugement dans la méthodologie de l’étude Ajustement = technique  prendre en compte dans un test unique un facteur qui  la variabilité du critère,  pallier la répartition inégale d’un facteur pronostique StratificationAjustement randomisation randomisation parmi chaque strate sur l’ensemble    Ttt A Ttt B Ttt A Ttt B immunocompétent immunodéprimé

  25. Analyse multidimensionnelle : la régression logistique • Permet de prédire la probabilité d’un événement à l’aide de divers facteurs : quantitatifsou qualitatifs • Principe : à partir d’une série d’observations, on cherche à estimer les paramètres d’un modèle mathématique, prédisant au mieux la probabilité d’un événement : Proba (événement) = exp(u) / 1 + exp(u) u = fonction linéaire de la forme :  + i xi x = 0 ou 1 si qualitative, et valeur mesurée xi si quantitative i = coefficient associé au facteur : « poids du facteur » exp  = Odds ratio (OR) associé à une variable et ajusté sur les autres variables du modèle

  26. Régression logistique : exemple Facteur coef  DS p exp  (OR) IC 95% OR Traitement (A 0 1 ) B - 1,204 0,45 0,001 0,3 0,19 – 0,47 Génotype (1 0 1 ) non 1 1,335 0,54 0,002 3,8 2,21 – 6,52 Histologie (F0F1 0 1 ) F2F3F4 - 0,615 0,30 0,03 0,54 0,40 – 0,7 Charge virale (>6 logUI 0 1 ) <6 logUI 1,172 0,44 0,01 3,2 1,36 – 7,65 4 facteurs indépendamment liés à l’obtention d’une réponse

  27. Régression logistique : exemple Facteur coef  DS p exp  (OR) IC 95% OR Traitement (A 0 1 ) B - 1,204 0,45 0,001 0,3 0,19 – 0,47 Génotype (1 0 1 ) non 1 1,335 0,54 0,002 3,8 2,21 – 6,52 Histologie (F0F1 0 1 ) F2F3F4 - 0,615 0,30 0,03 0,54 0,40 – 0,7 Charge virale (>6 logUI 0 1 ) <6 logUI 1,172 0,44 0,01 3,2 1,36 – 7,65 4 facteurs indépendamment liés à l’obtention d’une réponse : - A > B; geno non1 > geno 1; F0F1 > F2F3F4; faible CV > forte CV

  28. Analyse multidimensionnelle : le modèle de Cox (modèle des risques instantanés proportionnels de Cox) • Objectif : évaluer les facteurs pronostiques de mortalité ou tout autre événement lié au temps • Principe : • On considère le risque instantané de décès (force de mortalité, hazard) = probabilité de mourir à l’instant t pour un sujet qui a survécu jusque là : (t) • Fonction du temps passé et de covariables (facteurs de risque x1, x2, …. xk) recueillis en début d’étude ou en cours d’étude • Hypothèse de proportionnalité des risques instantanés constante au cours du temps (ex : risque H = toujours 1,5 fois risque F) (t; x1,x2, … xk) = 0(t).f(x1,x2, … xk) où f(x1,x2, … xk) = exp(1x1+2x2+, …+ kxk)

  29. Analyse multidimensionnelle : le modèle de Cox (t) Placebo Traitement B Traitement A temps Le risque instantané de décès est proportionnel selon que les patients reçoivent A ou B : il est décroissant au cours du temps il n’est pas proportionnel sous placebo : le modèle de Cox n’est pas applicable

  30. En conclusion Dans toutes études : recueil de données pertinentes (essai thérapeutique, étude pronostique, étude explicative) • 1ére étape : analyse univariée • Permet de déterminer les variables qui semblent liées à l’événement • Étudie les relations entre les variables explicatives • 2ème étape : analyse multivariée • Permet de mettre en évidence les variables indépendamment liées à l’événement étudié et leur poids (coefficient , OR) • ATTENTION : le modèle déterminé à partir d’une série d’observations doit être validé sur d’autres séries indépendantes de données

More Related