Slide1 l.jpg
This presentation is the property of its rightful owner.
Sponsored Links
1 / 71

Introduction PowerPoint PPT Presentation


  • 78 Views
  • Uploaded on
  • Presentation posted in: General

Introduction. Les concepts de base. Thèmes. La statistique - pourquoi? Les statistiques descriptives Analyse des fréquences Les distributions Les mesures de tendance centrale Quelle mesure faut-il prendre ? Les mesures de la dispersion La relation entre deux variables

Download Presentation

Introduction

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Introduction l.jpg

Introduction

Les concepts de base


Th mes l.jpg

Thèmes

  • La statistique - pourquoi?

  • Les statistiques descriptives

    • Analyse des fréquences

      • Les distributions

    • Les mesures de tendance centrale

      • Quelle mesure faut-il prendre ?

    • Les mesures de la dispersion

    • La relation entre deux variables

  • La statistique inférentielle


La statistique sert l.jpg

La statistique sert à ...

  • La description des données

  • Inférence: étude des caractéristiques d’une population à partir d’un sous-ensemble (échantillon) tiré de cette population

    • Estimation des paramètres

    • Vérification des hypothèses


Pr sentation de toutes les donn es l.jpg

Présentation de toutes les données


La statistique descriptive l.jpg

La statistique descriptive

Les étapes

  • Poser une question

  • Élaborer une étude (choix de l’échantillon, choix des mesures)

  • Récolter les données

  • Décrire les données

  • Interpréter les données

Hypothèse

Données

Conclusion


Un exemple l.jpg

Un exemple

Question: Développement de la population Méthode: Recensions de la population au Canada


Trac en arborescence l.jpg

Tracé en arborescence


Type de variables l.jpg

Type de variables

  • Variable: Une variable est une caractéristique qui peut supposer plus d'un ensemble de valeurs auquel il est possible d'attribuer une mesure numérique

  • Les variables nominales servent uniquement à catégoriser, aucun ordre et aucune métrique ne correspond à la classification (ex: couleur des yeux)

  • Les variables ordinales fournissent un ordre. Pourtant les intervalles entre les catégories correspondant aux chiffres peuvent être variables (ex: mise en rang des préférences)

  • Les variables par intervalles sont métriques. Des intervalles égaux et mesurables existent entre chacune des catégories, pourtant le point zéro est arbitraire (ex: échelles de température Fahrenheit et Celsius)

  • Les variables de rapport sont des variables par intervalle avec un zéro absolu (ex: les fréquences absolues, l’échelle de température Kelvin)


Analyse des fr quences l.jpg

Analyse des fréquences


Slide17 l.jpg

Taille des personnes


Forme de la distribution l.jpg

Forme de la distribution

Distribution bimodale

Distribution symétrique

moyenne = médiane = mode

Biais positif:

moyenne > médiane > mode

Biais négatif: mode > médiane > moyenne


Spss frequencies l.jpg

SPSS - Frequencies


Mesures de la tendance centrale l.jpg

Mesures de la tendance centrale

Mode : Valeur ou catégorie d’une variable ayant la plus forte fréquence

Médiane : Valeur qui divise le nombre des observations d’une distribution en deux parts égales

Moyenne arithmétique : Somme pondérée des valeurs d’une variable


Exemple l.jpg

Exemple

  • Données: nombre de partenaires sexuelles


Calcul du mode l.jpg

Calcul du mode

La valeur la plus fréquente


Calcul de la m diane l.jpg

Calcul de la médiane

  • Trier les observations selon leur ordre de magnitude

  • Identifiez le chiffre au milieu

    Ex. : Quelle est la médiane de la série suivante ?:

    11, 11, 13, 15, 17, 17, 17, 19, 19, 19, 19

    et de celle-ci ?:

    1,5,6,9,11,12


Calcul de moyenne l.jpg

Calcul de moyenne

µ = Sx/n

Ex. : la moyenne de 1,2,3,6,6,7,9 est:

La somme Sx est (1+2+3+…+9) = 34

Il y a n = 7 observations

µ = 34 / 7 = 4.9


Autre types de moyennes l.jpg

Autre types de moyennes

Trimean:

La somme du 25e quartile (Q1) plus deux fois le 50e quartile (Q2) plus le 75e quartile (Q3) divisé par 4.

Donc: (Q1 + (2*Q2) + Q3)/4

Moyenne tronquée (trimmed mean):

Avant de calculer la moyenne 5% des valeurs extrêmes sont enlevées (Ex: Notes de patinage artistique)


Exemple28 l.jpg

Exemple


Spss explore l.jpg

SPSS - Explore


Quelle mesure faut il prendre l.jpg

Quelle mesure faut-il prendre ?

  • Échelle de mesure

  • Distribution des données


Distribution l.jpg

Distribution

  • Un chercheur pose la question à savoir combien de livres de statistique et de méthodologie possèdent les étudiants.

  • Dans un groupe cours les 5 étudiants ont tous un livre de stats de leurs cours du CEGEP, du Bac et du Doctorat ainsi que deux livres de métho.


Slide34 l.jpg

  • Dans un autre cours, plusieurs étudiants ont vendu certains livres alors que d’autres étudiants ont acheté des livres plus spécialisés.


Slide35 l.jpg

  • Finalement, dans un autre groupe cours, il y a une personne qui possède maintenant 12 livres.


Mesures de la dispersion l.jpg

Mesures de la dispersion

Pourquoi?

  • Les mesures de tendance centrale décrivent les observations "en général" ou "en moyenne".

  • Les mesures de la dispersion nous informent jusqu'à quel point ces observations sont proche ou loin de leur "moyenne".


L tendue l.jpg

L’étendue

  • La différence entre la valeur la plus grande et la valeur la plus petite.

  • Cette mesure est très sensible aux valeurs extrêmes.

    Ex: 3 5 7 8 9 10 12 13

    l’étendu: 13-3 = 10

Femmes: 100Hommes: 253


Intervalle semi interquartile l.jpg

Intervalle semi-interquartile

  • La moitié de la différence entre le 75e quartile (Q3) et le 25e quartile (Q1).

  • Donc: (Q3-Q1)/2.

  • Cette mesure est très peu sensible au valeurs extrêmes.

Femmes: 2Hommes: 9


Cart type l.jpg

Écart-type

Sommes des carrés (SC) =

Variance (s2) = SS/N-1

Femmes: 39.08Hommes: 552.63

Écart-type (s) =

Femmes: 6.25Hommes: 23.51


Erreur type l.jpg

Erreur-type


La relation entre deux variables l.jpg

La relation entre deux variables


La covariance l.jpg

La covariance

La moyenne du produit des déviations des valeurs des variables par rapport à leur moyenne.

  • Cette mesure varie selon l'échelle de mesure. Ex: On obtient une valeur différente pour la taille quand on la mesure soit en pouce soit en centimètre.


La corr lation la covariance divis e par le produit des cart types des variables l.jpg

La corrélation: La covariance divisée par le produit des écart types des variables

  • Le coefficient de corrélation varie entre -1 et 1.

  • Le signe correspond à la direction de la corrélation. Quand les deux valeurs augmentent ou diminuent ensemble il s'agit d'une corrélation positive.

  • Quand une valeur augmente alors que l'autre diminue il s'agit d'une corrélation négative

  • La taille absolue correspond au degré du lien entre les deux variables


Corr lation l.jpg

Corrélation


Exemple46 l.jpg

Exemple

  • Sir Francis Galton se posa la question à savoir s’il y a un lien entre la taille des parents et la taille de leurs enfants. Il a donc mesuré la taille de 952 parents et de leurs enfants.

Sir Francis Galton

1822-1911


R gression vers la moyenne l.jpg

Régression vers la moyenne


Spss corr lations l.jpg

SPSS - Corrélations


Fen tre des variables l.jpg

Fenêtre des variables


Output l.jpg

Output


Scatterplot l.jpg

Scatterplot


Scatterplot53 l.jpg

Scatterplot


Le th or me des limites centrales l.jpg

La statistique inférentielle

LE THÉORÈME DES LIMITES CENTRALES


Slide55 l.jpg

Un dé


Deux d s l.jpg

Deux dés


Trois d s l.jpg

Trois dés


Quatre d s l.jpg

Quatre dés


Le th or me des limites centrales59 l.jpg

Le théorème des limites centrales

Pour une variable x avec une distribution de moyenne µ et d’un écart-type , la distribution d’échantillonnage de la moyenne x , basé sur un échantillon aléatoire de la taille n, a:

  • une forme qui approche la courbe normale pour les tailles d’échantillons larges

  • une moyenne égale à µ et

  • un écart-type égal à:


Les tests d hypoth ses l.jpg

Les tests d’hypothèses

Comparaison entre deux moyennes

Estimation des paramètres


Stendhal 1839 la chartreuse de parme l.jpg

Stendhal (1839) La chartreuse de Parme

J'avouerai que j'ai eu la hardiesse de laisser au personnages les aspérités de leurs caractères; mais, en revanche, je le déclare hautement, je déverse le blâme le plus moral sur beaucoup de leurs actions. A quoi bon leur donner la haute moralité et les grâces des caractères français, lesquels aiment l'argent par-dessus tout et ne font guère de péchés par haine ou par amour? Les Italiens de cette nouvelle sont à peu près le contraire.


Tude de stieglitz et al l.jpg

Étude de Stieglitz et al.


Intervalle de confiance l.jpg

Intervalle de confiance

  • La moyenne m est un estimé de µ

  • L’erreur-type (se) est un estimé de s

  • Dans une distribution normale 68% des valeur se retrouvent dans la région d’un E.T. autour de la moyenne, 95% se retrouvent dans la région de deux E.T. autours de la moyenne


Intervalles de confiance l.jpg

10

14

16

20

Intervalles de confiance


Intervalle de confiance de la diff rence l.jpg

Intervalle de confiance de la différence

m = 19.8-13.4 = 6.4


Statistique inf rentielle l.jpg

Statistique inférentielle

Tests d’hypothèses


Logique du test t l.jpg

Logique du Test - T

  • Si les deux échantillons proviennent d’une même population les moyennes devraient être à peu près identiques

  • Nous comparons la différence entre les deux moyennes avec un estimé de la dispersion des moyennes dans la population (erreur-type).

  • Quand la différence est plus grande que notre estimé de la dispersion laisse croire, les deux moyennes sont soit:

    • Atypiques pour une seule population

    • Typiques pour leur population et proviennent de populations différentes


Courbe t avec s 06 l.jpg

Courbe t avec s = .06

Carl Friedrich Gauss

Avril, 30 1777 (Braunschweig, Allemagne) - Février, 23 1855 (Göttingen, Allemagne)


Spss t test w s gosset 1905 l.jpg

SPSS - T-testW.S. Gosset (1905)


  • Login