mod les statistiques en sciences humaines et sociales n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Modèles statistiques en sciences humaines et sociales PowerPoint Presentation
Download Presentation
Modèles statistiques en sciences humaines et sociales

Loading in 2 Seconds...

play fullscreen
1 / 95

Modèles statistiques en sciences humaines et sociales - PowerPoint PPT Presentation


  • 79 Views
  • Uploaded on

Modèles statistiques en sciences humaines et sociales. 1-Introduction sur les modèles statistiques. 2-Régressions linéaires simples ou bi variés. 3-Régressions linéaires multiples. 4 -Régressions non linéaires. Plan de l’exposé. 1-INTRODUCTION.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Modèles statistiques en sciences humaines et sociales' - jed


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
plan de l expos

1-Introduction sur les modèles statistiques.

2-Régressions linéaires simples ou bi variés.

3-Régressions linéaires multiples.

4-Régressions non linéaires.

Plan de l’exposé
les grands domaines des statistiques

Statistique descriptive: Tableaux, graphiques, indicateurs mathématiques,… (AMETICE-TCPRUE11)

  • Statistique confirmatoire: évalue la probabilité pour qu’un résultat empirique obtenu soit du au hasard (Student, Khi2, tests de corrélation, ANOVA,…) (AMETICE-TCPRUE21)
  • Statistique exploratoire: Analyse Composante Principales, Analyse Factorielle des Correspondances,…
  • Modélisation Statistique: objet de la présentation…
Les grands domaines des statistiques
c est quoi un mod le statistique

On étudie un phénomène dont on suppose qu’il dépend de n variables.

  • On cherche à exprimer une variable Y (variable expliquée) en fonction des n-1 autres variables Xi (variables explicatives).
  • On part des données empiriques prélevées surun échantillon pour établir cette relation.
  • On établit les lois qui permettent d’étendre le résultat à toute la population.
C’est quoi un modèle Statistique?
remarque variables fortes variables faibles

Quand on veut « modéliser » un phénomène en SHS il faut commencer par « retenir » les variables qui agissent sur le phénomène.

  • On dira qu’il y a des variables « fortes » qui doivent obligatoirement être prises en compte dans le modèle et des variables « faibles » souvent non identifiées qui agiront à travers le terme aléatoire.
REMARQUE: Variables « fortes » variables « faibles »
le nuage de points empirique 2d

Par exemple une expérimentation conduit à des prélèvements 2D (xi, yi) auprès de n individus.

  • A chaque individu est associé en point (xi, yi) dans le plan. On obtient un nuage de points.
  • Si ce nuage s’organise autour d’une courbe…
Le nuage de points empirique 2D
nuage de point courbe de r gression

… vouloir modéliser le phénomène consiste d’abord à déterminer l’équation de la courbe qui représente « au mieux » le nuage de points empiriques.

  • Cette courbe est une « courbe  moyenne » qui reflète en moyenne le lien entre les deux variables pour les points de l’échantillon.
  • Il arrive que le nuage de point soit très dispersé. Dans ce cas il n’y a pas de courbe moyenne représentative et donc pas de lien entre les variables étudiées.
Nuage de point-Courbe de régression
plan de l expos1

1-Introduction sur les modèles statistiques.

2-Régressions linéaires simples ou bi variés.

3-Régressions linéaires multiples.

4-Régressions non linéaires.

Plan de l’exposé
plan de la partie 2

2- REGRESSION LINEAIRE SIMPLE:

2-1 Problème posé dans un échantillon:

2-1-1 Estimation des paramètres de la droite de régression.

2-1-2 Qualité de la représentation.

2-2 Inférence de la régression d’échantillon sur l’ensemble de la population.

Plan de la partie 2.
exemple fil rouge

On cherche la relation qui existe, dans une région donnée, entre le prix des terrains (PRIX=Y) et la superficie des terrains (SUPERF=X)

Exemple: fil rouge…
plan de la partie 21

2- REGRESSION LINEAIRE SIMPLE:

2-1 Problème posé dans un échantillon:

2-1-1 Estimation des paramètres de la droite de régression.

2-1-2 Qualité de la représentation.

2-2 Inférence de la régression d’échantillon sur l’ensemble de la population.

Plan de la partie 2.
qualit de la repr sentation

Quel que soit le nuage de point les MCO donnent toujours une solution.

- Il faut un ou des indicateurs de qualité de la représentation…

Qualité de la représentation
qualit de la repr sentation1

Pour s’assurer de la qualité de la représentation il faut répondre à deux questions:

  • Le lien entre les variables est il « avéré »? En d’autres termes: la relation existe-t-elle vraiment?
  • Quel est le pourcentage d’explication de l’action de la variable explicative sur l’évolution de la variable expliquée?
Qualité de la représentation
le lien entre les variable est il av r

Remarque préalable: Une droite horizontale exprime l’absence totale de lien entre les deux variables prises en compte.

Y

Y=0X+b

X

Quelque soit X, Y ne change pas

Le lien entre les variable est il avéré.
exemple fil rouge2

La superficie explique 73,53% de la variance du prix des terrains dans la région étudiée…Plus du quart du prix s’explique autrement. (Calcul EXCEL)

Exemple: Fil rouge
que faut il maitriser pour en arriver la

Représentation plane d’un nuage de points et équation d’une droite dans un plan.

  • Notion de moyenne, variance, covariance et corrélation pour les données expérimentales prélevées sur un échantillon.
  • Utilisation d’EXCEL…
  • C’est le contenu de l’UE11 du M1 recherche
Que faut il maitriser pour en arriver la?
plan de la partie 22

2- REGRESSION LINEAIRE SIMPLE:

2-1 Problème posé dans un échantillon aléatoire.

2-2 Inférence de la régression d’échantillon sur l’ensemble de la population.

2-1 Position du problème- échantillonnage aléatoire.

2-2 Estimation des paramètres de régression pour la population.

2-3 Intervalle de confiance.

Plan de la partie 2.
position du probl me 1

Nous avons travaillé sur un échantillon pris au hasard.

  • Si l’on avait choisit un autre échantillon les paramètres obtenus (a, b, SCR) auraient été différents.
  • On doit admettre que le «l’échantillonnage» a influencé le résultat.
  • On doit introduire la notion de « statistique d’échantillonnage » due au hasard de l’échantillonnage.
Position du problème (1)
plan de la partie 23

2- REGRESSION LINEAIRE SIMPLE:

2-1 Problème posé dans un échantillon aléatoire

2-2 Inférence de la régression d’échantillon sur l’ensemble de la population.

2-1 Position du problème- échantillonnage aléatoire.

2-2 Estimation des paramètres de régression pour la population.

2-3 Intervalle de confiance.

Plan de la partie 2.
slide42

ON A a, b ,SCR dans l’échantillon…on met quoi si l’on veut étendre à toute la population….

  • Quel est le prix à payer
estimation sans biais biais e

Valeurs de Y pour un x donné pour des échantillons différents

  • Si l’estimation est sans biais la valeur tourne autour de la valeur cible
  • Si l’estimation est biaisée la valeur tourne autour d’une autre valeur

x

x

x

x

x

x

x

x

x

x

x

x

x

Estimation sans biais…biaisée
slide47

Conséquences des hypothèses H1, H2, H3

H1: Les distributions sont centrées

H2: Les distribution ont même variance

H3: Les distributions sont indépendantes

plan de la partie 24

2- REGRESSION LINEAIRE SIMPLE:

2-1 Problème posé dans un échantillon aléatoire

2-2 Inférence de la régression d’échantillon sur l’ensemble de la population.

2-1 Position du problème- échantillonnage aléatoire.

2-2 Estimation des paramètres de régression pour la population.

2-3 Intervalle de confiance.

Plan de la partie 2.
plan de l expos2

1-Introduction sur les modèles statistiques.

2-Régressions linéaires simples ou bi variés.

3-Régressions linéaires multiples.

4-Régressions non linéaires.

Plan de l’exposé
plan de la partie 3

3-Régressions linéaires multiples:

3-1 Régression linéaire 3-D

3-2 régression Linéaire Multi-D

3-3 Une ou plusieurs variables explicatives sont qualitatives

Plan de la partie 3
position du probl me1

Dans cette partie nous nous limitons à une présentation générale du cas 3-D. Suffisante toutefois pour apprécier les différences de fond avec le cas 2-D.

  • Pour le reste les grandes lignes restent les mêmes que dans le cas 2-D avec toutefois des difficultés supplémentaires dues à une plus grande complexité du formalisme calculatoire.
  • On cherche une relation du type: z= a x + b y +c

z (variable expliquée), x et y (variables explicatives)

Position du problème
plan de la partie 31

3-Régressions linéaires multiples:

3-1 Régression linéaire 3-D

3-2 régression Linéaire Multi-D

3-3 Une ou plusieurs variables explicatives sont qualitatives

Plan de la partie 3
slide75

La qualité de la représentation s’apprécie de la même façon avec le coefficient de détermination ou avec sa version corrigée.

  • L’inférence s’effectue de la même façon…
  • Mais la complexité et la lourdeur des calculs impose l’utilisation de logiciels spécialisés…pas toujours évidents à manipuler car les démos son peu claires….
plan de la partie 32

3-Régressions linéaires multiples:

3-1 Régression linéaire 3-D

3-2 régression Linéaire Multi-D

3-3 Une ou plusieurs variables explicatives sont qualitatives

3-3-1 Cas de variables dichotomiques

3-3-2 Cas de variables Polytomiques

Plan de la partie 3
plan de la partie 33

3-Régressions linéaires multiples:

3-1 Régression linéaire 3-D

3-2 régression Linéaire Multi-D

3-3 Une ou plusieurs variables explicatives sont qualitatives

3-3-1 Cas de variables dichotomiques

3-3-2 Cas de variables Poly-tomiques

Plan de la partie 3
v ariables polytomiques

Dans le cadre de la même étude sur le jugement (J) porté par les enseignants sur les élèves les premières variables prises en compte étaient: le score (S), le retard scolaire (R).

  • On prend à présent en compte l’origine sociale au travers de la CSP du père qui comprend 6 modalités.
  • ARTI, INTER, EMPL, OUVR, AUTR, CADRE/PROF LIB
Variables polytomiques
variables polytomiques

On doit procéder de la sorte car sinon les 6 variables muettes sont dépendantes linéairement et cela n’est pas toléré par le modèle.

  • La 6ième modalité intervient indirectement par le fait que les réponses aux 5 premières variables muettes dépendentdes réponses à la sixième modalité: « imaginer le cas limite où tous les pères sont cadre ou profession libérale »
Variables polytomiques
plan de l expos3

1-Introduction sur les modèles statistiques.

2-Régressions linéaires simples ou bi variés.

3-Régressions linéaires multiples.

4-Régressions non linéaires.

Plan de l’exposé
plan de la partie 4

4-Régressions non linéaires.

4-1 Par changement de variable

4-2 Moindres carrés pour dépendance polynomiale

4-3 Traitement par morceaux linéaires.

4-3 Notion d’interaction-Variable modératrices

Plan de la partie 4
plan de la partie 41

4-Régressions non linéaires.

4-1 Par changement de variable

4-2 Moindres carrés pour dépendance polynomiale

4-3 Traitement par morceaux linéaires.

4-4 Notion d’interaction-Variable modératrices

Plan de la partie 4
plan de la partie 42

4-Régressions non linéaires.

4-1 Par changement de variable

4-2 Moindres carrés pour dépendance polynomiale

4-3 Traitement par morceaux linéaires.

4-4 Notion d’interaction-Variable modératrices

Plan de la partie 4
interaction variables mod ratrices

Il y a « interaction » quand l’effet d’une variable sur une autre est sous l’influence d’une 3ième variable.

X1

X2

Y

Interaction /Variables modératrices