Donnees centrees et normalite
This presentation is the property of its rightful owner.
Sponsored Links
1 / 61

DONNEES CENTREES et NORMALITE PowerPoint PPT Presentation


  • 51 Views
  • Uploaded on
  • Presentation posted in: General

DONNEES CENTREES et NORMALITE. UE 45.2CHIII. Pierre MORETTO, Université Paul Sabatier, Toulouse III. Données centrées et normalité. Les étapes. Indices centraux Dispersion Loi Normale (Equiprobabilité) Variables centrées réduites Normalité d’une distribution Détermination graphique

Download Presentation

DONNEES CENTREES et NORMALITE

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Donnees centrees et normalite

DONNEES CENTREESet NORMALITE

UE 45.2CHIII

Pierre MORETTO,

Université Paul Sabatier, Toulouse III.


Donn es centr es et normalit

Données centrées et normalité

Les étapes

  • Indices centraux

  • Dispersion

  • Loi Normale (Equiprobabilité)

  • Variables centrées réduites

  • Normalité d’une distribution

    • Détermination graphique

    • Détermination / indices

    • Test du ²


Indices centraux et de dispersion

Indices centraux et de dispersion

Mode, Médiane, Moyenne

Quartile, variance et écart-type


Indices centraux et de dispersion1

Indices centraux et de dispersion

Centraux

  • Mode: valeur la plus représentée

  • Médiane : valeur correspondant à un effectif cumulé de 50%

  • Moyenne:

Effectif (« verre  plein »)

Centre de classe

(« Position du verre sur le plateau »)


Indices centraux et de dispersion2

Indices centraux et de dispersion

Equilibre du plateau

Mode

Médiane

Moyenne


Indices centraux et de dispersion3

Indices centraux et de dispersion

Mode

Médiane

Moyenne


Indices centraux et de dispersion4

Indices centraux et de dispersion

Dispersion

  • Intervalle interquartile

  • Ecart-type


Indices centraux et de dispersion5

Indices centraux et de dispersion

50% de la population sur IQ

68.25% de la population sur  1 

IQ

IQ


Loi normale

Loi Normale

Equiprobabilité


Equiprobabilit

Equiprobabilité

  • Modèle mathématique

  • Equiprobabilité : Pr(A)=Pr(B)

  • Un exemple : Somme sur jets de 2 dés

    • Considérer la probabilité que la somme des 2 dés fasse : 0, 1, 2, … jusqu’à 14

      • Cad un % de chance .. Une fréquence probable

    • Tracer le diagramme en fréquence de ces lancers de dés.

      • Rappel: Pr(A et B) = Pr(A) x Pr(A/B)


Equiprobabilit1

Equiprobabilité

  • Sur somme de 2 dés: Pr(A et B) = Pr(A) x Pr(A/B)

  • Pr(0)=0

  • Pr(1)=0

  • Pr(2)=Pr(1et1)=Pr(1) x Pr(1/1)=2/6 x 1/6=2/36

  • Pr(3)=Pr(1et2)=2/36

  • Pr(4)=Pr(1et3)+Pr(2et2)=2/36+2/36=4/36

  • Pr(5)=Pr(1et4)+Pr(2et3)= 2/36+2/36=4/36

  • Pr(6)=Pr(1et5)+Pr(2et4)+Pr(3et3)=1/6

  • Pr(7)=Pr(1et6)+Pr(2et5)+Pr(3et4)=1/6


Equiprobabilit2

Equiprobabilité

  • Sur somme de 2 dés: Pr(A et B) = Pr(A) x Pr(A/B)

  • Pr(8)= Pr(2et6)+Pr(3et5)+Pr(4et4)=1/6

  • Pr(9)= Pr(3et6)+Pr(4et5)=4/36

  • Pr(10)=Pr(4et6 )+Pr(5et5)=4/36

  • Pr(11)=Pr(5et6)=2/36

  • Pr(12)=Pr(6et6)=2/36

  • Pr(13)=0

  • Pr(14)=0


Graphiquement

Graphiquement

Probabilités

Sommes possibles

« Courbe en cloche » …… Loi de Gauss


Loi normale laplace gauss

Loi Normale (Laplace-Gauss)

  • - Mode, Médiane et Moyenne sont confondus

  • - Symétrie / indices centraux

  • 1 ; 68.25% de la population

  • 2 ; 95.50% de la population


Loi de gauss

Loi de Gauss

  • Cette courbe en cloche illustre très fréquemment les comportements humains (neurosciences, physiologie, biomécanique, sociologie etc.)

Parlebas & Cyffers, (1992)


Variables centr es r duites

Variables centrées réduites


Variables centr es r duites1

Variables Centrées Réduites

VCR

Intérêts

  • L’écart centré réduit est défini pour pouvoir utiliser la Loi Normale

  • Situer un individu / groupe et selon différentes variables

  • Pouvoir donner le nombre d’individus dans un intervalle de performance


Table de la loi normale

Table de la loi normale

Loi Normale

VCR

-2 

-1 

+ 1 

+2 


Table de la loi normale1

Table de la loi normale

Variables normales centrées réduites

-2

-1

0

+1

+2


Table de la loi normale centr e r duite

Table de la Loi normale centrée réduite

Lecture:

Valeur d’ en additionnant colonne de gauche (dixième) et ligne du haut (centième)

Ex: Soit z =0.5 une valeur de 

A l’intersection de 0.5 (première colonne) et 0 (1ère ligne) :

La valeur est 0.1915 …. Soit 19.15% de la population

entre 0 et z.


Utilisation de l cart centr r duit

Utilisation de l’écart centré réduit

  • Situation d’un sujet / groupe selon différentes variables

  • Dénombrement dans un intervalle donné


Situation d un sujet groupe selon diff rentes variables

Situation d’un sujet / groupe selon différentes variables

Performance centrée réduites du sujet S1

Détente verticale

Squat

Saut en longueur

-2

-1

0

+1

+2

Profile des performances de l’athlète


D nombrement dans un intervalle donn

Dénombrement dans un intervalle donné

Table des valeurs normales centrées réduites

  • La taille d’un groupe d’enfants suit une distribution normale.

  • Indiquez la probabilité pour que :


Correction

Correction


D nombrement dans un intervalle donn1

Dénombrement dans un intervalle donné

Table des valeurs normales centrées réduites

  • La taille d’un groupe d’enfants suit une distribution normale.

  • Indiquez la probabilité pour que :


Correction1

Correction


Normalit d une distribution

Normalité d’une distribution


Normalit d une distribution1

Normalité d’une distribution

  • Il s’agit de comparer la distribution expérimentale à la loi normale.

  • Si la distribution expérimentale est normale, les tests statistiques dits paramétriques peuvent être appliqués …

    • sinon transformation des données (log, racine etc)

    • Sinon tests non paramétriques.


Normalit d une distribution2

Normalité d’une distribution

Cette distribution peut-elle être assimilée à celle de Gauss ?


Normalit d une distribution3

Normalité d’une distribution

  • Normalité d’une distribution

    • Détermination graphique

    • Détermination / indices

    • Test du ²


Normalit de la distribution

Normalité de la distribution

  • Détermination graphique

  • Test de la droite de Henry

  • Principe:

    • Vérifier que le graphique des fréquences cumulées est linéaire après changement d’échelle.

    • La transformation est appelée « Anamorphose »


D termination graphique anamorphose

Détermination graphique Anamorphose

Diagramme fréquences cumulées

Droite de Henry

Echelle d’anamorphose


Donnees centrees et normalite

Détermination graphique Anamorphose

Droite de Henry

Calcul de la pente

  • Si la distribution est normale à ±2 correspond 95.5% de la population.

  • Intervalle entre 2.28% et 95.5% correspond à 4.

  • Pente=(Q95-Q2.28)/ 4

  • PThéo=(95.5-2.28)%/4=0.23


Normalit d une distribution4

Normalité d’une distribution

  • Normalité d’une distribution

    • Détermination graphique

    • Détermination / indices

    • Test du ²


Normalit d une distribution indices

Normalité d’une distribution /Indices

  • Une distribution est normale si:

    • Les indices centraux sont confondus

      • Mode=Médiane=Moyenne

    • 68.25% de la population à ± 1 

    • 95.5% de la population à ± 2 

  • Si ces faits sont retrouvés à partir des données expérimentales alors, la distribution peut être considérée comme « Normale »


Normalit d une distribution5

Normalité d’une distribution

  • Normalité d’une distribution

    • Détermination graphique

    • Détermination / indices

    • Test du ²


Test du

Test du ²

  • Le test du ² permet de comparer 2 distributions.

  • Si il est appliqué à la comparaison de la distribution de la donnée expérimentale et d’une distribution normale (au sens Gaussien), il permet de vérifier très précisément la normalité de la distribution expérimentale.


Test du1

Test du ²

Principe

  • Comparer 2 fréquences

    • Expérimentale (rouge)

    • Normale (Bleu)

  • Quantifier la somme des différences/classes

  • Règle de décision / valeur théorique


Test du2

Test du ²

Quantifier la différence

  • Calculer l’écart centré réduit pour chaque centre de classe Xi

  • Trouver la probabilité associée dans la table de la Loi Normale Centrée Réduite


Test du3

Test du ²

Quantifier la différence

  • Calculer l’écart centré réduit pour chaque centre de classe Xi

  • Trouver la probabilité associée dans la table de la Loi Normale Centrée Réduite


Test du4

Test du ²

Quantifier la différence

  • Pour chaque classe,  une fth et une fobs(ni/N)

  • Calculer la différence de ces fréquences pour chaque classe


Test du5

Test du ²

Calcul de l’indice

Carré des différences

Rapportée à Fth

Somme

« Surface entre les 2 courbes »


Test du6

Test du ²

Règle de décision

  • Une table des valeurs de ²

  • La valeur est lue pour un Degrès De Liberté (ddl=N-1)

  • A un risque choisi (10%, 5%, 1%)


Test du7

Test du ²

Règle de décision

Si ²Calculé> ²Théorique au risque choisi les distributions diffèrent significativement.

Sinon elles sont statistiquement semblables.


Test du8

Test du ²

Exemple

Table du ²

  • Le ² calculé sur un échantillon de 19 sujets est de 32.5.

  • La distribution est-elle normale au risque 5% ?

  • La distribution est-elle normale au risque 1% ?


Test du9

Test du ²

Correction

Table du ²

  • Le ²théorique à P=0.05 pour un ddl=18 est de 28.87

  • 32.5 > 28.87 donc ²calculé >²théorique

  • Les distributions observée (expérimentale) et théorique (Loi Normale) sont semblables à P<0.05

  • La distribution est normale au risque P<5%


Test du10

Test du ²

Correction

Table du ²

  • Le ²théorique à P=0.01 pour un ddl=18 est de 34.80

  • 32.5 < 34.8 donc ²calculé <²théorique

  • Les distributions observée (expérimentale) et théorique (Loi Normale) sont différentes à P<0.01

  • La distribution n’est pas normale au risque P<1%

  • Risque inférieur entraîne une décision plus sévère


Comparaison d chantillons param triques

Comparaison d’échantillons paramétriques

UE 45.2CHIV

Pierre MORETTO,

Université Paul Sabatier, Toulouse III.


Donnees centrees et normalite

Comparaison d’échantillons

  • Règles de décisions et orientations

    • Les distributions des échantillons A et B sont-elles normales (Gaussiennes) ?

      • Si OUI, tests paramétriques

      • Si NON,

        • Transformation (racine, log ..) et retour à

        • Tests Non paramétriques (Ch V)


Donnees centrees et normalite

Comparaison d’échantillons paramétriques

  • Méthodologie générale: Distributions normales


Comparaison d chantillons param triques1

Comparaison d’échantillons paramétriques

Comparaison des variances des échantillons de distributions normales A (²A) et B (²B)


Comparaison des variances

Comparaison des variances

Echantillon A

Echantillon B


Comparaison des variances1

Comparaison des variances

  • Le test est appelé « Test F de Fisher-Snedecor »

  • Il est basé sur le rapport (F) des variances des échantillons A et B

  • Donc

    • si les variances sont semblables le rapport F est proche de 1

    • si les variances diffèrent le rapport F s’éloigne de 1

    • Dans les 2 cas … l’objectivité impose de savoir de combien et à quel risque ?


Histogramme

Histogramme


Le diagramme cumulatif

Le diagramme cumulatif


D termination graphiques

Détermination Graphiques

  • Ces graphiques permettent de déterminer

    • Des indices centraux

      • Mode et médiane

    • Des indices de dispersion

      • Quartiles

      • Intervalle interquartile


D termination du mode histogramme

Détermination du mode Histogramme

- Repérer le plus grand effectif

- Le mode est la performance (61.5 cm) la plus représentée (33%)

(cad pour laquelle la fréquence est la plus importante)


D termination de la m diane fr q cumul es

50%

Détermination de la médiane Fréq cumulées

- Repérer 50% sur l’effectif cumulé (ordonnées)

- Projeter sur l’axe des performances

- La médiane est la performance (57.5 cm) qui coupe l’effectif en deux parties égales (cad 50% font plus mais 50% font moins de 57.5 cm de détente verticale)


L intervalle et l h t rog n it

L’intervalle et l’hétérogénéité

Dans les 2 cas 50% de la population sont distribués sur IQ

IQ1

IQ2


Les indices de dispersion

Les indices de dispersion

  • L’écart-type :

    • À partir de l’ensemble des valeurs (N<30)

    • A partir de données regroupées (N>30)

A certaines conditions (de normalité), 68.5% de la population sont distribués sur une étendue de 1


Distribution et h t rog n it

Distribution et hétérogénéité

68.5% de la population distribués sur  1 l’écart-type autour de la moyenne

- 1 

 1 


  • Login