liaison entre variables qualitatives
Download
Skip this Video
Download Presentation
Liaison entre variables qualitatives

Loading in 2 Seconds...

play fullscreen
1 / 40

Liaison entre variables qualitatives - PowerPoint PPT Presentation


  • 232 Views
  • Uploaded on

Liaison entre variables qualitatives. Introduction. Rappel Variables qualitatives Exemple sexe (homme, femme) secteur d’études (lettres, sciences) Etudier la relation entre les deux Se base sur les effectifs. Données brutes. variables. individus. Effectifs observés. Tri croisé

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Liaison entre variables qualitatives' - sevilen


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
introduction
Introduction

Rappel

Variables qualitatives

Exemple

sexe (homme, femme)

secteur d’études (lettres, sciences)

Etudier la relation entre les deux

Se base sur les effectifs

donn es brutes
Données brutes

variables

individus

effectifs observ s
Effectifs observés
  • Tri croisé
    • on répartit les effectifs en fonction des combinaisons de modalités

modalités

variable 2

modalités

variable 1

Source : Université de Provence, 2002-2003

tri crois
Tri croisé
  • Fréquences marginales
    • totaux des lignes et des colonnes (marges)
effectifs attendus
Effectifs attendus
  • Dans le cas de l\'hypothèse nulle, c\'est-à-dire si les proportions étaient les
  • mêmes pour chaque groupe.
comparaison
Comparaison

Attendus

Observés

ecarts
Ecarts

Attendus

Observés

ecarts carr s relatifs
Ecarts carrés relatifs

b

Attendus

Ecarts

carrés

a

a/b

slide14
2
  • Chi-deux

Somme

2 =

2157,4

formule
Formule
  • Distribution du chi2 avec un degré de liberté ddl = (R - 1)(C - 1)
  • R nombre de lignes
  • C nombre de colonne
slide17
La surface sous la courbe donne la probabilité de rejet de l\'hypothèse nulle à tort. Elle correspond à la probabilité d\'obtenir une valeur de χ2 au moins aussi grande que la probabilité critique par le seul fait du hasard.

χ2 de 10.10

test d hypoth se
Test d’hypothèse
  • Statistique inférentielle
  • Le 2permet de tester l’hypothèse d’indépendance des variables :
    • les données observées résultent simplement de fluctuations dues au hasard
  • On peut mesurer la probabilité p de se tromper en rejetant l’indépendance
tableur
Tableur

Pratiquement aucune chance de se tromper en rejetant l’indépendance : il y a bien un effet significatif

tableur20
Tableur

30% de chances de se tromper en rejetant l’indépendance : pas d’effet significatif

seuils de rejet
Seuils de rejet
  • Seuils de rejet
    • p < 0,05 en sciences humaines
    • p < 0,01 si l’on veut être très strict
attention
Attention
  • Ne jamais employer le test de chi-deux si certains des effectifs attendus sont  5.
probl me
Problème
  • 2 dépend de l’effectif
    • difficile d’apprécier la valeur du 2 dans l’absolu
    • on peut normaliser le coefficient pour le rendre indépendant de la taille
coefficient
Coefficient 
  • Phi
    • varie entre 0 et +1
    • analogue au coefficient de corrélation des variables quantitatives

2 =

 =

2157,4

0,30

application linguistique
Application linguistique
  • Force d’association entre mots
  • Deux mots sont associés s’ils apparaissent souvent ensemble dans des pages Web
  • Ex. :
    • Chirac + Jospin
    • Chirac + Corona
    • etc.
exemple
Exemple
  • Google (réglé sur tout le Web)
  • On va chercher
    • A = Nombre d’occurrences Chirac
    • B = Nombre d’occurrences Jospin
    • C = nombre de cooccurrences Chirac Jospin
    • N = Nombre total de pages
slide27

A

B

C

N

formule directe
Formule directe
  • Une formule un peu compliquée, mais qui évite les calculs intermédiaires :
classement
Classement
  • Par  décroissant :
graphe de relation
Graphe de relation

Pour définir ce graphe il faut passer par le tableau de bord/vues/Nouvelles vues

arbre de d composition
Arbre de décomposition

Pour définir cet arbre il faut passer par le tableau de bord/vues/Nouvelles vues/

corr lation
Corrélation

Traitements et analyses/Analyser/Corrélations

analyse factoriel multiple
Analyse factoriel multiple
  • Une extension de l’analyse factoriel simple à plusieurs variables qualitatives (fermées unique ou multiple)
tableau de burt
Tableau de Burt

Les éléments matriciels diagonaux du tableau de Burt correspondent à des

tris à plats sur chaque variable

Dans Sphinx:Traitement et analyse/Approfondir

slide40

Projection sur les plans factoriels

Remarques: Les deux premiers axes fournissent le premier plan factoriel où

un maximum d\'information sont représentées graphique: déterminer à partir

des valeurs propres

ad