1 / 27

A nalyse en C omposantes P rincipales

Méthode statistique descriptive permettant de résumer le maximum de l’information contenue dans un tableau de données constitué de n individus et p variables quantitatives. ACP. A nalyse en C omposantes P rincipales. p variables métriques. valeur de la variable j

amaya-mejia
Download Presentation

A nalyse en C omposantes P rincipales

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Méthode statistique descriptive permettant de résumer le maximum de l’information contenue dans un tableau de données constitué de n individus et p variables quantitatives. ACP Analyse en Composantes Principales

  2. p variables métriques valeur de la variable j prise par l’individu i n individus ACP Tableau de données

  3. M1 C B A 0 4 8 12 16 20 M2 M2 20 20 B 16 16 A 12 12 8 8 4 4 C M1 M1 0 0 0 4 8 12 16 20 0 4 8 12 16 20 M3 ACP Illustration graphique de l’ACP

  4. Le centre de gravité du nuage est le point « moyen » Il faut faire en sorte que la perte d’inertie soit la plus faible possible La dispersion du nuage se mesure en additionnant les carrés des distances entre les points du nuage et le centre de gravité Dispersion = Information = Inertie La projection fait baisser la dispersion

  5. ACP Comment choisir le bon espace de projection ? Le bon « plan de coupe » ?

  6. 2 1 3 Trouver des espaces de dimensions « plus petites » afin d’y voir au mieux les individus ACP Le principe de l’A.C.P. Les individus (ou les variables ) sont décrits dans un espace à « p (ou n) dimensions » (nombre de variables (ou d’individus))

  7. Comment définir les nouveaux axes ? ACP Le principe de l’A.C.P. On substitue aux variables initiales des « indices synthétiques » qui sont des combinaisons linéaires de ces variables initiales. Le premier axe (ou première composante principale) sera tel que la variance des individus (sur cet axe) soit maximale. Ä cet axe explique donc une certaine proportion de la variance totale des individus.

  8. ACP Le principe de l’A.C.P. Comment définir les nouveaux axes ? Après la 1ère composante principale, on en recherche une 2ème qui doit avoir les propriétés suivantes : ? Avoir une corrélation nulle avec la première, ? Avoir, à son tour, la plus grande variance. Le processus se répète jusqu’à obtenir les p composantes (où p représente le nombre de variables initiales)

  9. Représenter les variables en fonction de leurs corrélations Représenter les individus en fonction de leurs « proximités » ACP L’A.C.P. permet de : Comment se structurent les variables : ü quelles sont celles qui sont associées ? ü quelles sont celles qui ne le sont pas ? ü quelles sont celles qui vont dans le même sens ? ü quelles sont celles qui s’opposent ? Comment se répartissent les individus : ü quels sont ceux qui se ressemblent ? ü quels sont ceux qui sont dissemblables ?

  10. Tableau de mesures ACP Le principe de l’A.C.P. Quels types de tableaux peut-on traiter avec l’A.C.P. ?

  11. Tableau de notes ACP Le principe de l’A.C.P. Quels types de tableaux peut-on traiter avec l’A.C.P. ?

  12. Tableau de rangs ACP Le principe de l’A.C.P. Quels types de tableaux peut-on traiter avec l’A.C.P. ?

  13. Mesures Rangs Notes ACP Le principe de l’A.C.P. Exemple de tableau « hybride » ou « mixte » Centrer-réduire Problème : ce sont les variables les plus dispersées qui engendrent les premières composantes.

  14. Variables Composantes ACP Le principe de l’A.C.P. Objectif : Transformer p variables quantitatives initiales inter-corrélées en p nouvelles variables (composantes principales) non corrélées

  15. ACP Le principe de l’A.C.P. Coefficients des combinaisons linéaires des p variables initiales Variances des individus sur les composantes principales correspondantes

  16. Matrice des corrélations (ou var/cov) 0 æ ö ç ÷ ç ÷ ç ÷ 0 Diagonalisation ç ÷ è ø Matrice « diagonale » des valeurs propres Matrice des vecteurs propres ACP Le principe de l’A.C.P. Méthode :

  17. /40 ACP Présentation de l’exemple

  18. ACP Présentation de l’exemple

  19. Exemple : A.C.P. sur données centrées-réduites Part de l’information ini- tiale restituée par l’axe i " variable Ø variance = 1 S variance = nombre de variables ACP Description des calculs et commentaires Interprétation des valeurs propres

  20. ACP Description des calculs et commentaires

  21. ACP Description des calculs et commentaires

  22. ACP Description des calculs et commentaires

  23. Ind8 - Ind6 - Ind9 + Ind3 + Ind5 - Ind10 - Ind1 + Ind7 + Ind4 - Ind2 - -3.00 -2.50 -2.00 -1.50 -1.00 -0.50 0.00 0.50 1.00 1.50 2.00 2.50 ACP Description des calculs et commentaires

  24. ACP Description des calculs et commentaires

  25. ACP Description des calculs et commentaires

  26. ACP Description des calculs et commentaires f1 et f2 paraissent proches alors que e1 et e2 ne le sont pas

More Related