0 likes | 1 Views
Notion de covariance et de corru00e9lation entre variables
E N D
Méthodes Quantitatives I Évaluation de la Relation entre Variables
Introduction • L'objectif de toute recherche quantitative est d'évaluer la relation entre variables… • Le degré de relation doit être quantifié… • La méthode utilisée dépend de la nature des données… • Quantitatives vs Quantitatives • Dichotomiques vs Quantitatives • Multinomiales vs Quantitatives • Dichotomiques vs Ordinales • Ordinales vs Ordinales… • Etc…
Quantification d’une relation RXY 0 : Centre de gravité du nuage de point... C’est le centroide... Moyenne de Y Moyenne de X
Illustrations… https://shiny.rit.albany.edu/stat/rectangles/ https://daniel-coulombe.shinyapps.io/Correlation/
Mesures du degré de relation entre deux variables: Covariance • Covariance entre X et Y: • Plus sa valeur est élevée (en valeur absolue), plus le degré de relation est important • Son signe indique la direction de la relation • Elle ne tient pas compte de la variabilité des scores: elle varie en fonction de l’unité de mesure
Notes sur la covariance • Transformations linéaires et covariance: • : La covariance d’une variable avec elle-même est la variance de cette variable • : La covariance entre X et Y est égale à la covariance entre Y et X • : L’ajout d’une constante à X (ou à Y) n’affecte pas la covariance entre ces deux variables • : La multiplication de X (ou de Y) par une constante c a pour effet de multiplier la covariance entre X et Y par la valeur de la constante • et finalement:
Matrice des Variances/Covariances TEST 1 = Névrotisme TEST 2 = Honnêteté TEST 3 = Introversion Variances Covariances (Test 1) (Test 2) (Test 3) (Test 1) Hors-Diagonale:Covariances (Test 2) Diagonale principale:Variances (Test 3)
Mesures du degré de relation entre deux variables: Corrélation • La covariance de ne peut pas être supérieure au produit des écarts-types de X et de Donc… • Corrélation entre X et Y: • Mesure standardisée de la force de la relation entre deux variables • Sa valeur est comprise entre -1 et +1
Le coefficient de corrélation Corrélation négative parfaite Corrélation positive parfaite Aucune corrélation -1.0 -.5 0 +.5 +1.0 Corrélations négatives croissantes Corrélations positives croissantes
Coefficient de corrélation: formulations alternatives • En termes de scores Z: • En termes de scores centrés: • En termes de scores bruts:
Types de relations r = -0,3 (g) r = 0,3 (h)
Propriétés du coefficient de corrélation • -1 r 1 • La valeur de r ne change pas si toutes les valeurs de l’une ou l’autre des variables changent d’échelle de mesure • rxy= ryx • r indique le degré de relation linéaire entre deux variables • Une corrélation faible n’implique pas l’absence de relation: la relation peut être curvilinéaire • Une corrélation n’implique pas un lien de causalité entre les deux variables
Exemple: Données brutes COVXY = 5.69 rXY= 0.82
Matrice des corrélations Diagonale: variances de scores standardisés... La variance totale est égale au nombre de variables...
Association: variables nominales • Données dichotomiques: • X = genre (0 = Homme, 1 = Femme) • Y = Résultat à un examen (0 = Échec, 1 = Succès) • Les données se résume en un tableau 2 x 2: • On obtient le même résultat en calculant le coefficient de corrélation de Bravais-Pearson à partir de ces données!
Corrélation entre variables ordinales:Rho de Spearman • Le (Rho) de Spearman: • Alternative au coefficient de corrélation de Bravais-Pearson, lorsque les variables sont au moins ordinales • -1 1 • Avantages: • Moins sensible au biais que les données extrêmes pourraient produire • Ne nécessite pas le postulat de normalité • Procédure: • Obtenir les rangs pour chaque variable, en tenant compte des égalités de rangs (‘Ties’) • Exemple:
Corrélation entre variables ordinales:Rho de Spearman • Procédure: • Obtenir les rangs pour chaque variable, en tenant compte des égalités de rangs (‘Ties’) • Calculer les différences entre les rangs pairés: • Le est donné par: • Note: • Lorsque des égalités de rangs (‘ties’) surviennent, une correction est suggérée... • ... mais elle a peu d’impact s’il n’y a pas de groupes de 3 observations égales, ou si moins de 25% des observations produisant des égalités de rang
Corrélation entre variables ordinales:Rho de Spearman • Exemple numérique: • Afin d’examiner la possibilité qu’un facteur génétique puisse avoir une certaine influence sur l’agressivité, on obtient un score de réaction face à un affront simulé auprès de 12 paires de jumeaux identiques. Les données recueillies sont présentées dans le tableau ci-contre, avec les calculs préliminaires. La corrélation de Pearson entre les rangs de X et de Y est égale à la corrélation de Spearman… Non corrigé
Corrélation entre variables ordinales: T de Kendall • Mesure du degré d'association sur la base de l'accord dans l'ordre des données: • La variable ordinale X est en ordre naturel (1, 2, …, nX) • Chaque donnée composant la variable ordinale Y est comparée aux valeurs suivantes: • Si Yi et Yj sont en ordre naturel, on attribue +1 à cette comparaison, sinon on lui attribue -1 • La somme des comparaisons obtenues (S) est divisée par ce total lorsque toutes les comparaisons sont positives, égal à:
Corrélation entre variables ordinales: T de Kendall • Exemple: • Considérant les valeurs de Y: • 2 vs 4: ordre naturel +1 • 2 vs 3: ordre naturel +1 • 2 vs 1: ordre non-naturel -1 • 4 vs 3: ordre non-naturel -1 • 4 vs 1: ordre non-naturel -1 • 3 vs 1: ordre non-naturel -1
Corrélation entre variables ordinales:T de Kendall • Exemple numérique: • Afin d’examiner la possibilité qu’un facteur génétique puisse avoir une certaine influence sur l’agressivité, on obtient un score de réaction face à un affront simulé auprès de 12 paires de jumeaux identiques. Les données recueillies sont présentées dans le tableau ci-contre, avec les calculs préliminaires.
JAMOVI: Rho de Spearman corrigé Le de Spearman est équivalent au de Bravais-Pearson, qui corrige implicitement sa valeur en présence d’égalités de rangs
Mesuresd’association • Différents indices de la relation entre deux variables s'appliquent selon la nature des variables en cause: Variable Y
Point bisérial • Indice de corrélation entre une variable dichotomique réelle (sans distribution continue sous-jacente), et une variable quantitative • Défini par: NOTE: le r de Pearson appliqué sur ces données donne le même résultat…
Rang bisérial • Indice de corrélation entre une variable dichotomique réelle (sans distribution continue sous-jacente), et une variable ordinale • Défini par: NOTE: le de Spearman appliqué sur ces données donne un résultat similaire…
Mesures d'association entre deux variables Interprétation
Quartet I Relation linéaire: corrélation appropriée…
Quartet II Relation curvilinéaire: corrélation inappropriée: la relation est sous-estimée…
Quartet III Relation linéaire: corrélation affectée par une donnée influente…
Quartet IV Relation due à un seul point: corrélation non-représentative des données…
Corrélation: Examen graphique • Le calcul de rxyexige la vérification graphique! • Exemple: rxy = 0.7, n = 50 pour chaque situation suivante:
Corrélation: Examen graphique • Le calcul de rxyexige la vérification graphique! • Exemple: rxy = 0.7, n = 50 pour chaque situation suivante:
Corrélation: Examen graphique • Le calcul de rxyexige la vérification graphique! • Exemple: rxy = 0.7, n = 50 pour chaque situation suivante: