1 / 82

Philippe Cibois Laboratoire Printemps – Université de Versailles-St-Quentin L’analyse factorielle Principes Dépouille

Philippe Cibois Laboratoire Printemps – Université de Versailles-St-Quentin L’analyse factorielle Principes Dépouillement d’enquêtes Corpus de textes Roscoff - 18 septembre 2009. Principe de l’analyse factorielle 1) La représentation géométrique d’un tableau

florence
Download Presentation

Philippe Cibois Laboratoire Printemps – Université de Versailles-St-Quentin L’analyse factorielle Principes Dépouille

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Philippe Cibois Laboratoire Printemps – Université de Versailles-St-Quentin L’analyse factorielle Principes Dépouillement d’enquêtes Corpus de textes Roscoff - 18 septembre 2009

  2. Principe de l’analyse factorielle 1) La représentation géométrique d’un tableau 2) Comment passer du tableau au graphique 3) Les calculs de l'analyse factorielle

  3. Le tableau des carrières PDG : Président directeur général DMK : Directeur du marketing DFI : Directeur financier DTU : Directeur technique ou d'usine CBU : Contrôleur budgétaire DRV : Directeur régional des ventes IPR : Ingénieur de production IBE : Ingénieur de bureau d'études CCO : Cadre comptable VEN : Acheteur/inspecteur de ventes Destination Orig. 2PDG 2DMK 2DFI 2DTU 2CBU 2DRV 2IPR 2IBE 2CCO 2VEN Total 1PDG 20 3 5 5 0 1 1 0 1 0 36 1DMK 22 33 0 0 0 9 1 0 1 8 74 1DFI 10 1 38 0 10 0 0 0 8 1 58 1DTU 18 0 1 34 1 0 14 9 2 0 79 1CBU 2 0 12 1 17 2 0 0 7 1 42 1DRV 7 13 1 2 0 21 0 0 0 11 55 1IPR 3 1 2 12 0 1 24 7 0 2 52 1IBE 1 0 0 11 1 1 9 18 1 0 42 1CCO 1 3 11 0 6 0 0 1 29 0 51 1VEN 1 9 0 0 1 14 0 1 0 27 53 Total 85 63 70 65 36 49 49 36 49 50 552 Effectifs observés Principe de l’analyse factorielle 1) La représentation géométrique d’un tableau 2) Comment passer du tableau au graphique 3) Les calculs de l'analyse factorielle [1] Exemple adapté de L’Expansion, juin 1978

  4. Destination Origine !PDG !DFI CBU CCO !DMK DRV VEN !DTU IPR IBE ! ----------------+----+------------+------------+------------+ Direction 1PDG ! 20 ! 5 1 ! 3 1 ! 5 1 ! ----------------+----+------------+------------+------------+ Finance 1DFI ! 10 ! 38 10 8 ! 1 1 ! ! 1CBU ! 2 ! 12 17 7 ! 2 1 ! 1 ! 1CCO ! 1 ! 11 6 29 ! 3 ! 1 ! ----------------+----+------------+------------+------------+ Commerce 1DMK ! 22 ! 1 ! 33 9 8 ! 1 ! 1DRV ! 7 ! 1 ! 13 21 11 ! 2 ! 1VEN ! 1 ! 1 ! 9 14 27 ! 1 ! ----------------+----+------------+------------+------------+ Production 1DTU ! 18 ! 1 1 2 ! ! 34 14 9 ! 1IPR ! 3 ! 2 ! 1 1 2 ! 12 24 7 ! 1IBE ! 1 ! 1 1 ! 1 ! 11 9 18 ! ----------------+----+------------+------------+------------+ Effectifs observés

  5. Destination Orig. ! 2PDG Le reste ! Total ---------+----------------+------ 1PDG ! 20 16 ! 36 Le reste ! 65 451 ! 516 ---------+----------------+------ Total ! 85 467 ! 552 Effectifs observés Destination Orig. ! 2PDG Le reste ! Total ---------+-------------------+------ 1PDG ! 55,6 44,4 ! 100 Le reste ! 12,6 87,4 ! 100 ---------+-------------------+------ Total ! 15,4 84,6 ! 100 Pourcentages en ligne

  6. Destination Origine ! DTU IPR IBE ! Le reste ! ----------------+-------------------+----------+ Production 1DTU ! 24,7 7,0 3,8 ! -35,5 ! 1IPR ! 5,9 19,4 3,6 ! -28,9 ! 1IBE ! 6,1 5,3 15,3 ! -26,6 ! ----------------+-------------------+----------! Le reste ! -36,6 -31,6 -22,7 ! 91,0 ! ----------------+----------+------------+------! Ecarts à l'indépendance

  7. Principe de l’analyse factorielle 1) La représentation géométrique d’un tableau 2) Comment passer du tableau au graphique 3) Les calculs de l'analyse factorielle Nouveaux bacheliers ! Univ CPGE Autr ! Total ------+----------------+----- L ! 14 2 4 ! 20 ES ! 16 1 3 ! 20 S ! 15 5 10 ! 30 Tech ! 5 2 23 ! 30 ------+----------------+----- Total ! 50 10 40 ! 100 Effectifs ramenés à 100 Nouveaux bacheliers ! Univ CPGE Autr ! Total ------+----------------+----- L ! 10 2 8 ! 20 ES ! 10 2 8 ! 20 S ! 15 3 12 ! 30 Tech ! 15 3 12 ! 30 ------+----------------+----- Total ! 50 10 40 ! 100 Effectifs théoriques corres- pondant à l'indépendance

  8. Nouveaux bacheliers ! Univ CPGE Autr ! ! Univ CPGE Autr ! Coeff. ------+----------------+ ------+----------------+----- L ! 4 0 -4 ! L ! 2 1 -3 ! 1 ES ! 6 -1 -5 ! ES ! 1 1 -3 ! 1 S ! 0 2 -2 ! S ! 2 1 -3 ! 1 Tech ! -10 -1 11 ! Tech ! -6 -3 9 ! -3 ------+----------------+ -----+----------------+---- Coeff.! 2 1 -3 ! Ecarts à l'indépendance Approximation

  9. Nouveaux bacheliers ! Univ CPGE Autr ! !Univ CPGE Autr !Coef! !Univ CPGE Autr ! Coef! ------+----------------+ +---------------+----+ +---------------+-----+ L ! 4 0 -4 ! ! 2 1 -3 ! 1 ! ! 2 -1 -1 ! 1 ES ! 6 -1 -5 ! ! 1 1 -3 ! 1 ! ! 4 -2 -2 ! 2 S ! 0 2 -2 ! ! 2 1 -3 ! 1 ! ! -2 1 1 ! -1 Tech ! -10 -1 11 ! ! -6 -3 9 ! -3 ! ! -4 2 2 ! -2 ------+----------------+ +---------------+----+ !---------------+----+ Coef! 2 1 -3 ! ! ! 2 -1 -1 ! Ecarts = approximation + Reste

  10. Représentation graphique de l'axe du tableau approximation

  11. Représentation graphique des écarts à l'indépendance

  12. projection orthogonale de ES sur Univ projection de Univ. sur la prolongation en sens opposé de Tech

  13. Principe de l’analyse factorielle 1) La représentation géométrique d’un tableau 2) Comment passer du tableau au graphique 3) Les calculs de l'analyse factorielle

  14. Dépouillement d’enquêtes 1) Un tableau réel décomposé : latin et politique 2) De deux questions à beaucoup de questions 3) Enquête latin 94

  15. Observé = Théorique + Ecarts

  16. Approx. Droite – Non réponse = 4,02 x -2,146 = -8,6

  17. Reste NiD NiG – Non réponse = Ecart-Approx= 10,2 – 9,9 = 0,3

  18. « Approximation » Gauche x latin = -3,367 x 2,769 = -9,3

  19. TRIDEUX Version 4.0 - Février 2006 Renseignements Ph.Cibois Laboratoire PRINTEMPS Université de Versailles - St-Quentin PhCibois@wanadoo.fr Calcul des facteurs Le nom du fichier des noms de modalites est TabLimoge.MOD Ce fichier d'impression a pour nom TabLimoge.AFC Le nombre total de lignes du tableau est de 3 Le nombre total de colonnes du tableau est de 4 Le nombre de lignes supplementaires est de 0 Le nombre de colonnes supplementaires est de 0 Le nombre de lignes actives est de 3 Le nombre de colonnes actives est de 4 AFC : Analyse des correspondances ********************************* Le phi-deux est de : 0.020452 Le nombre de facteurs a extraire est de 2 Facteur 1 Valeur propre = 0.018564 Pourcentage du total = 90.8 Facteur 2 Valeur propre = 0.001888 Pourcentage du total = 9.2

  20. Coordonnees factorielles (F= ) et contributions pour le facteur (CPF) Lignes du tableau *---*------*----*------*----* ACT. F=1 CPF F=2 CPF *---*------*----*------*----* GAUC 14 5 -46 528 Gauche NINI -158 444 36 227 NiGauche NiDroite DROI 224 552 48 245 Droite *---*------*----*------*----* * * *1000* *1000* *---*------*----*------*----* Modalites en colonne *---*------*----*------*----* ACT. F=1 CPF F=2 CPF *---*------*----*------*----* Lat 65 128 32 299 Latin L&G 107 78 -94 590 Latin Grec NiN -95 131 -26 97 NiLatin NiGrec NR -505 663 23 14 Non réponse *---*------*----*------*----* * * *1000* *1000* *---*------*----*------*----* Fin normale du programme

  21. Dépouillement d’enquêtes 1) Un tableau réel décomposé : latin et politique 2) De deux questions à beaucoup de questions 3) Enquête latin 94 ----Tableau de Burt------------------------------------ ORI1 ORI2 ORI3 ORI4 POL1 POL2 POL3 ORI1 590 268 185 137 Latin ORI2 133 69 35 29 Latin Grec ORI3 284 135 102 47 NiLatin NiGrec ORI4 51 22 27 2 Non répons POL1 268 69 135 22 494 Gauche POL2 185 35 102 27 349 NiGauche NiDroite POL3 137 29 47 2 215 Droite

  22. Facteur 1 Valeur propre = 0.322765 Pourcentage du total = 25.6 Facteur 2 Valeur propre = 0.272199 Pourcentage du total = 21.6 Coordonnees factorielles (F= ) et contributions pour le facteur (CPF) Modalites en colonne *---*------*----*------*----* ACT. F=1 CPF F=2 CPF *---*------*----*------*----* ORI1 273 64 382 150 Latin ORI2 447 39 -1129 294 Latin Grec ORI3 -397 66 -316 49 NiLatin NiGrec ORI4 -2107 331 280 7 Non réponse POL1 58 2 -555 264 Gauche POL2 -659 222 432 113 NiDroite NiGauche POL3 936 276 573 123 Droite *---*------*----*------*----* * * *1000* *1000* *---*------*----*------*----*

  23. Dépouillement d’enquêtes 1) Un tableau réel décomposé : latin et politique 2) De deux questions à beaucoup de questions 3) Enquête latin 94 Enquête latin 1994 • Panel 1989 de l’éducation nationale : latin 18% (cadres sup 50%, intermédiaires 30%, ouvriers 10%) • Stratégie éducative pour le choix d’un collège • Enquête latin 1994, 1000 parents de classe moyenne supérieure, enfant en CM1 ou CM2 • Projet latin (latin seul, grec seul, latin et grec, ni latin ni grec) • Motivations (gymnastique de l’esprit, étymologie, culture antique, être avec les meilleurs) • Passé latin, compétences et intérêts de l’enfant, sujets de société, situation sociale, niveau d’études, opinions politiques et religieuses

  24. Enquête Latin 1994

  25. TRIDEUX Version 5.0 - Septembre 2006 Renseignements Ph.Cibois Laboratoire PRINTEMPS Université de Versailles - St-Quentin PhCibois@wanadoo.fr Calcul des facteurs Le nombre total de lignes du tableau est de 156 Le nombre total de colonnes du tableau est de 156 Le nombre de lignes supplementaires est de 21 Le nombre de colonnes supplementaires est de 21 Le nombre de lignes actives est de 135 Le nombre de colonnes actives est de 135 AFC : Analyse des correspondances ********************************* Le phi-deux est de : 0.028641 Le nombre de facteurs a extraire est de 3 Facteur 1 Valeur propre = 0.005331 Pourcentage du total = 18.6 Facteur 2 Valeur propre = 0.002160 Pourcentage du total = 7.5 Facteur 3 Valeur propre = 0.001461 Pourcentage du total = 5.1 Règle empirique VP > 0,1 bonne liaison ; VP comprise entre 0,01 et 0,1 liaison standard ; VP < 0,01 faible liaison entre questions

  26. Facteur 1 Impression des colonnes actives du tableau J NOM Coor.fac. CPF Intitule long 2 Q6 2 -389 64 AideFr- 7 Q9 1 -377 64 latDépassé+ 50 Q302 -277 58 RegretLatNon 57 Q332 -283 54 Gym- 59 Q342 -519 37 Etym- 85 Q441 -260 34 Ph/fOui 43 Q272 -154 32 aFaitLatNon 83 Q431 -176 27 CircflxOui 61 Q352 -216 24 CultAntq- 73 Q382 -225 20 TragUtilNon 108 Q542 -219 19 VsAimLire- 81 Q421 -130 18 DoubleROui 14 Q152 -141 16 PasBonEleve 10 Q102 -113 14 avMeilleu- 120 Q572 -122 14 IntHistNon ------------------------------------ 12 Q112 174 14 EcolePriv 56 Q331 74 14 Gym+ 32 Q221 114 14 CatéOui 55 Q323 161 17 Cj3ans+L 42 Q271 113 23 aFaitLatOui 46 Q283 175 29 3ans+Lat 47 Q291 176 42 ApprecLatOui

  27. SUP. F=1 CPF F=2 CPF F=3 CPF *---*------*----*------*----*------*----* SEX1 -10 0 -1 0 -18 2 Garçon SEX2 6 0 0 0 20 2 Fille ORI1 98 17 5 0 14 1 LatinSeul ORI2 -37 0 -68 1 72 2 GrecSeul ORI3 160 8 -40 1 38 2 LatinGrec ORI4 -257 55 14 0 -43 6 NiLatNiGrec REL1 159 11 161 28 -41 3 Pratiquant REL2 36 1 71 11 -12 0 NonPrat REL3 -48 2 -73 11 9 0 TradNiNi REL4 -99 6 -102 17 21 1 SansRelig REL5 80 0 11 0 41 0 Protestant REL6 -9 0 -14 0 10 0 Juif POL1 -30 1 -97 34 19 2 Gauche POL2 -34 1 53 7 4 0 Centre POL3 111 8 132 28 -42 4 Droite AGE1 -62 2 -25 1 -25 1 -35ans AGE2 15 0 -8 0 4 0 35-45ans AGE3 1 0 77 6 30 1 45ans+ DIP1 -126 8 86 9 20 1 faibleDipl DIP2 -19 0 25 2 -11 1 NivBac DIP3 53 4 -49 9 5 0 DiplNivSup

  28. Profil de la modalité POL3 Droite Nom PEM Obs. Test Intitulé Q6 1 52 201 *** AideFr+ Q341 48 210 * Etym+ Q482 45 159 *** NationDéfendr Q591 38 171 *** MblFamillOui Q181 38 168 *** GdEcolOui Q331 37 186 *** Gym+ Q9 2 36 195 ** latDépassé- Q221 36 124 *** CatéOui Q611 36 173 *** PropriétOui Q351 36 192 *** CultAntq+ Q492 35 152 *** VoileContre Q661 34 162 *** BaissMoral+ Q422 29 162 *** DoubleRNon Q8 1 28 158 *** BonRNécess+ Q112 28 66 *** EcolePriv REL1 27 61 *** Pratiquant Q261 26 124 *** MêmeEducOui Q361 23 122 *** CultRelig+ Q7 1 22 183 * LgViv+ut+ Q151 21 173 ** BonEleve Q523 21 97 *** NivScolAct- REL5 20 9 ** Protestant Q581 20 110 *** Généal+

  29. Croisement de la question Q6 aide français avec la question POL politique Le Khi-deux du tableau est de 11.8 Degré liberté = 2 Prob.= 0.003 *** +------------+------------+------------+------------+------------+ |N= %Ligne|Gauche |NiGaucheNiDr|Droite | Total | |Khi2 %Attrac| |oite | | en ligne | +------------+------------+------------+------------+------------+ |AideFr+ | 418 45.8| 294 32.2| 201 22.0| 913 100| | | 0.2 -10.7| 0.2 -7.4| 1.3 52.5* 1.6 86.3| +------------+------------+------------+------------+------------+ |AideFr- | 76 52.4| 55 37.9| 14 9.7| 145 100| | | 1.0 10.7| 1.1 7.4| 8.1 -52.5* 10.2 13.7| +------------+------------+------------+------------+------------+ | Total | 494 46.7| 349 33.0| 215 20.3| 1058 100| | en colonne | 1.2 | 1.2 | 9.4 | 11.8 100| +------------+------------+------------+------------+------------+ Observé : 201 Théorique : 913 x 215 / 1058 = 185,5 Ecart à l’indépendance = 201 – 185,5 = 15,5 Maximum : 215 Ecart dans le cas du max : 215 – 185,5 = 29,5 Rapport écart obs/ écart max = 15,5/29,5 = 0,525 PEM Pourcentage de l’écart maximum = 52,5%

  30. Profil de la modalité DIP3 DiplNivSup Nom PEM Obs. Test Intitulé 55A1 40 66 *** musBaroqOui Q541 38 466 *** VsAimLire+ Q283 37 214 *** 3ans+Lat Q323 27 136 *** Cj3ans+L 55C2 26 476 ** musContempNon ORI3 26 61 *** LatinGrec Q511 22 83 *** TravMèrTpPlei Q291 21 270 *** ApprecLatOui Q442 20 441 *** Ph/fNon Q151 20 405 *** BonEleve Q311 19 247 *** CjaFaitLOui Q271 19 328 *** aFaitLatOui Q201 17 266 *** MusiqueOui Q331 17 415 *** Gym+ Q451 16 367 *** Messe-L+ Q7 2 16 114 *** LgViv+ut- Q231 16 385 *** AimeLireOui Q101 16 352 *** avMeilleu+ Q161 15 59 * AvancPrimaire Q252 14 234 *** JxVidéo- AGE2 14 364 *** 35-45ans Q401 13 266 *** GdPeintresOui Q611 13 371 *** PropriétOui 56A3 13 76 * Orsay Q651 13 69 * fLienSang

  31. Compléments 1) Une expérience : l’enquête « ouvrier français en 1970 » 2) Type-idéal : « favorables au latin »

  32. Ref : Gérard Adam, Frédéric Bon, Jean Capdevielle, René Moureau, L’ouvrier français en 1970, FNSP, 1970

  33. PEM=59%

  34. PEM=25%

  35. Pôle CGT-PC : appartient à la CGT (n=224), vote CGT (n=356), se sent proche du Parti Communiste (n=213), a voté J.Duclos (n=234), candidat du PCF au premier tour des élections présidentielles de 1969, contributions supérieures à 150 pour mille alors que la moyenne (1000 divisé par 32 modalités) est de 31 pour mille.

  36. Pôle CGT-PC : appartient à la CGT (n=224), vote CGT (n=356), se sent proche du Parti Communiste (n=213), a voté J.Duclos (n=234), candidat du PCF au premier tour des élections présidentielles de 1969, contributions supérieures à 150 pour mille alors que la moyenne (1000 divisé par 32 modalités) est de 31 pour mille. Question GCo Position 6 Code-max. 4 Tot. 0 1 2 3 4 1116 629 189 137 80 81 100 56.4 16.9 12.3 7.2 7.3 Effectif cumulé 3-4=161, 2-4=298 Ref : Gérard Adam, Frédéric Bon, Jean Capdevielle, René Moureau, L’ouvrier français en 1970, FNSP, 1970 Philippe Cibois, L’analyse des données en sociologie, PUF, 1984 Bernard Lahire, La culture des individus, La découverte, 2004

More Related