1 / 21

INF L14 Initiation aux statistiques

INF L14 Initiation aux statistiques. 2 – Concepts généraux. Plan. Qu’est-ce que la statistique ? Quelques éléments de terminologie. Première partie Qu’est-ce que la statistique ?. Statistique. Latin status = « état » Définition

evan
Download Presentation

INF L14 Initiation aux statistiques

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. INF L14Initiation aux statistiques 2 – Concepts généraux

  2. Plan • Qu’est-ce que la statistique ? • Quelques éléments de terminologie

  3. Première partieQu’est-ce que la statistique ?

  4. Statistique • Latin status = « état » • Définition • Une étude statistique consiste à observer et à étudier une particularité commune chez un groupe de personnes ou de choses. • Exemples • Les notes d’un groupe d’élèves • Le taux de mortalité par cancer des fumeurs • La fréquence des mots d’un texte • etc.

  5. Deux domaines • Statistique descriptive • exploration des données • mesures et indices • représentations graphiques • Statistique inférentielle • tester des hypothèses • faire des prédictions à partir d’échantillons Dans ce cours : statistique descriptive Inférence. Opération par laquelle on passe d'une vérité à une autre vérité, jugée telle en fonction de son lien avec la première. (Petit Larousse)

  6. Lorsque je calcule la moyenne d’une classe je trace la courbe d’évolution du chômage en 2004 je fais de la statistique descriptive Lorsque je me demande si l’effet d’un médicament est réel ou s’il est imputable au hasard j’essaie de prédire des intentions de vote à partir d’un échantillon de 1000 personnes je fais de la statistique inférentielle Exemples (1)

  7. Statistique descriptive La longueur des phrases dans le Petit Prince est de 9,8 mots. Statistique inférentielle La longueur des phrases dans le Petit Prince est significativement plus courte que dans le journal Le Monde (25 mots) On exclut l’effet du hasard Exemples (2)

  8. Exemples (3) • Statistique descriptive • Jésus est le mot (plein) le plus fréquent dans chacun des 4 évangiles

  9. Question... • Statistique descriptive : • Le mot Jésus est-il plus fréquent dans certains évangiles que dans d’autres ? Attention, avant de conclure! les textes n’ont pas la même longueur...

  10. + Jean Marc Luc Matthieu - Réponse... • Oui • les fréquences diffèrent significativement Cohérent avec les données historiques C’est-à-dire différences pas imputables au hasard

  11. + Jean Marc Luc Matthieu - Réponse... • Oui • les fréquences diffèrent significativement Cohérent avec les données historiques C’est-à-dire différences pas imputables au hasard

  12. Deuxième partieQuelques éléments de terminologie

  13. Terminologie • Rappel : • Une étude statistique consiste à observer et à étudier une particularité commune chez un groupe de personnes ou de choses. population individus variable (ou attribut, caractère)

  14. Population • Définition • On appelle population l’ensemble de tous les objets que l’on étudie. • Exemples • Des personnes : • Un groupe d’élèves, un groupe de malade, la population française • Mais aussi : • Les mots d’un texte, un ensemble de documents, etc.

  15. Individus • Définition : • Les individus sont les éléments de la population étudiée. • Exemples : • chacune des personnes interrogées pour une enquête • chaque jour de l'année pour lequel on dispose de données météorologiques • chaque mot d’un texte • chaque texte d’un corpus • etc.

  16. Variables • Définition • Une variable est une propriété commune aux individus de la population que l'on souhaite étudier. • On dit aussi • Attribut, caractère • Exemples • La taille de personnes, la couleur de leurs yeux, leur sexe • Le nombre de lettres des mots, la durée des pauses dans un discours, le genre d'un texte (roman, poésie, etc.)

  17. Types de variables • Les variables étudiées peuvent être : • Qualitatives • sexe, profession • genre des textes (roman, poésie, etc. ), catégories grammaticales des mots (nom, verbe, etc.) • Quantitatives • taille, poids, âge, taux de cholestérol • longueur, catégorie grammaticale des mots • durée des pauses dans un discours

  18. Modalités • Définition • Les modalités d'une variable qualitative sont les différentes valeurs que celle-ci peut prendrei. • Exemple • variable situation familiale : célibataire, marié, veuf, divorcé. • variable sexe : homme, femme. • variable prénom : Alice, Bernard, Charles, ... (modalités très nombreuses!)

  19. Variables quantitatives • Les variables quantitatives sont de deux types : • Discrètes = valeurs dénombrables (ex.: nombres entiers) • Exemples • nombre d'enfants par famille, nombre de pièces d'un appartement • nombre de mots d’un texte, nombre de lettres d’un mot • Continues = infinité de valeurs, aussi proches qu’on veut (ex.: nombres réels) • Exemples • taille, poids, des personnes • durée des pauses d’un discours, fréquence fondamentale de la voix

  20. Mesure ou dénombrement ? • On dénombre les individus dans telle ou telle modalité d’une variable qualitative • 65 personnes aux yeux bleus • 44 personnes aux yeux marron • etc. • On mesure les variables quantitatives : • taille de l’individu X = 1,75 m

  21. Statistique descriptive Statistique inférentielle Population Individu Variable Variable qualitative Variable quantitative Modalité Termes à retenir

More Related