380 likes | 553 Views
L’AFC, mais qu’est-ce?. Quelques rappels. Présentation générale . méthodes dites multidimensionnelles représentations géométriques Trois méthodes classiques ACP: Analyse en composantes principales. Individus et variables numériques ACM: Analyse des correspondances multiples
E N D
L’AFC, mais qu’est-ce? Quelques rappels
Présentation générale • méthodes dites multidimensionnelles • représentations géométriques • Trois méthodes classiques • ACP: Analyse en composantes principales. • Individus et variables numériques • ACM: Analyse des correspondances multiples • Individus et codages de valeurs qualitatives. • AFC: Analyse factorielle des correspondances. • tableaux de fréquence • Un exemple:
Exemple • Taille
Exemple • Taille
Exemple • Age (4 classes) • Activité (8 classes)
Exemple • Age • Activité
Exemple • Age • Activité
Exemple • Age • Activité
Exemple • Age • Activité
Exemple • Taille • Poids • Age
Exemple • Taille • Poids • Age
Exemple • Taille • Poids • Age • Taux cholestérol • Consommation d’alcool • CSP • Sexe • ???
Exemple • ??? • Espace multi-dimensionnel • Multi-paramétrique • Comment qualifier, quantifier, et surtout visualiser ces phénomènes ? • Comment différencier les interactions essentielles des rencontres fortuites ?
Exemple • projections de ces hyper-nuages sur des plans. • Ombres portées • Déformer le moins possible • = Conserver l’inertie • Choisir le bon angle • = Axes factoriels
Exemple • Baguette • Allongement • Aplatissement • 75% de la variance • 1 plan = 2 axes
Précisions • Variance, dispersion, inertie ??? • Individus et modalités superposés • Une représentation est une description, pas une preuve !!!
Méthode… et hop! • Avec deux variables
Méthode… et hop! • Avec 2 variables • CSP • Lieux de vacances
Moins vite • Couleur des yeux • Couleur des cheveux
Encore plus fort • Effectifs théoriques en cas d’indépendance, établis à partir destotaux en ligne et en colonne
Toujours mieux • Ecarts à l’indépendance: différence entre l’effectif constaté et l’effectif théorique.
Attractions… • Les écarts positifs « significatifs » :
Répulsions… • Les écarts négatifs « significatifs » :
Est-ce bien clair ? • Châtains – noisette • Blonds – bleus • Verts – roux • Mais … • Axe 1: des cheveux blonds aux cheveux roux ou des yeux bleus aux yeux verts? • Axe 2: du blanc au châtain, ou des yeux marrons aux yeux noisette?
Un peu d’aide… les contributions absolues • La contribution absolue résume le poids d’une modalité par rapport à l’ensemble des modalités décrites par un facteur. • On les lit en colonne et par facteur. Total = 100 • Elle permet de repérer les modalités qui ont le plus créé le facteur. • F1: Y verts, C roux, C noirs • F2: Y noisette, Y marrons, C blancs, C châtain & sombre
Un peu plus d’aide: les contributions relatives. • La contribution relative décrit le poids d’une modalité relativement à l’ensemble des facteurs. • Elle se lit horizontalement, par modalité. • Elle permet de voir sur quel facteur une modalité est le mieux représentée. • Les blonds aux yeux bleus ?
Contributions: les blonds aux yeux bleus… • Sur le facteur 3, ils ont les plus fortes contributions absolues! • Ils ont donc permis la formation de ce facteur. • Ils sont néanmoins mieux représentés sur le facteur 1 !
Lecture du graphe • Facteur 1: • Femmes aux yeux noisettes, aux cheveux châtains ou sombres, • Hommes aux yeux marrons, chauves ou cheveux blancs. • Facteur 2: • Les irlandais vs les scandinaves.
Représentation graphique des contributions absolues • Les rectangles se lisent dans la dimension du facteur. • Contributions horizontales, seulement facteur 1 • Contributions verticales, facteur 2 • Carré (blanc), un peu des deux, mais pas beaucoup. • Et les yeux verts? • Et les chauves?
Interpréter : prudence • difficile à interpréter quand le nombre de questions et de modalités est très élevé • tendance à mettre en valeur les écarts sur les modalités aux effectifs faibles. • L’interprétation d’un mapping (représentation graphique des modalités sur 2 axes) est assez délicate. • Le fait que deux modalités soient proches ne signifie pas nécessairement qu’elles sont en attraction. Il est rare en effet que tous les liens entre modalités puissent être représentés en deux dimensions.
Interpréter : prudence • l’analyse factorielle peut se réduire à une technique permettant de représenter de manière suggestive le maximum d’informations sur les attractions entre modalités • Elle devient une technique exploratoire qui permet un premier débroussaillage des données et qui peut suggérer des pistes fructueuses. • Il faut toujours revenir aux tris croisés ou aux profils de modalités pour vérifier les suggestions de l’approche graphique. • Le fait que l’AFC révèle peu d’attractions entre variables peut être un résultat intéressant en tant que tel.
Décrire / prédire • Echantillon Probabilités • 1 réponse = 1 estimateur • (valeur d’une moyenne, d’une variance, d’une proportion, d’un pourcentage) • + un intervalle de confiance • + une probabilité
Décrire / prédire • Description: « la moyenne est m. » • Prédiction: « j’ai une probabilité p de ne pas me tromper en affirmant que la moyenne est comprise entre (m-i) et (m+i). »
Décrire / prédire • Hypothèses sur les distributions des paramètres de la population totale, des paramètres des échantillons… • Ambiguïtés des théories en probabilité. • Les probabilités, ce n’est pas intuitif. • Benzecri: prouver l’existence de Dieu.