initiation l utilisation du logiciel statistica l.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Initiation à l’utilisation du logiciel STATISTICA PowerPoint Presentation
Download Presentation
Initiation à l’utilisation du logiciel STATISTICA

Loading in 2 Seconds...

play fullscreen
1 / 53

Initiation à l’utilisation du logiciel STATISTICA - PowerPoint PPT Presentation


  • 431 Views
  • Uploaded on

Initiation à l’utilisation du logiciel STATISTICA. Joseph LARMARANGE http://joseph.larmarange.net Intervention du 9 janvier 2004 2 ème année en Ressources Humaines GEA (Gestion des Entreprises et des Administrations) IUT d’Orléans. Plan. Saisie des données Statistiques descriptives

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Initiation à l’utilisation du logiciel STATISTICA' - tassos


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
initiation l utilisation du logiciel statistica

Initiation à l’utilisation du logiciel STATISTICA

Joseph LARMARANGE

http://joseph.larmarange.net

Intervention du 9 janvier 20042ème année en Ressources HumainesGEA (Gestion des Entreprises et des Administrations)IUT d’Orléans

slide2
Plan
  • Saisie des données
  • Statistiques descriptives
  • Corrélation linéaire
  • Test du Khi 2

Joseph LARMARANGE

principes d un fichier statistica
Principes d’un fichier STATISTICA
  • Les données sont saisies sous la forme d’un tableau.
  • En colonnes, des variables (soit le nombre d’information que nous avons pour chaque individu).
  • En lignes, des individus (cela peut-être des personnes physiques, des ménages, des institutions, etc.).

Joseph LARMARANGE

exemple de donn es saisir
Exemple de données à saisir
  • Il s’agit du montant des ventes d’une équipe de 15 vendeurs.Pour chacun d’eux, on dispose du sexe, de l’âge et du chiffre d’affaire réalisé.

Joseph LARMARANGE

cr ation d un nouveau fichier fichier nouveau
Indiquer le nombre de variables (3)

Et le nombre d’observations (ici 15)

Création d’un nouveau fichier (Fichier > Nouveau)
  • Cliquez sur OK.

Joseph LARMARANGE

cr ation d un nouveau fichier
Création d’un nouveau fichier
  • Apparition du fichier de données.
  • On va maintenant spécifier le nom des variables

Joseph LARMARANGE

nommer les variables
Nommer les variables
  • On donnera un nom court mais explicite. Mieux vaut éviter les caractères particuliers.
  • Il est aussi possible de faire une description détaillée des variables.

Joseph LARMARANGE

nommer les variables8
Nommer les variables
  • On donnera un nom court mais explicite. Mieux vaut éviter les caractères particuliers.
  • Il est aussi possible de faire une description détaillée des variables.

Joseph LARMARANGE

les variables qualitatives
Les variables qualitatives
  • On privilégiera de saisir un code chiffre plutôt qu’un texte pour éviter les erreurs de saisie.
  • Cependant, il est toujours possible de donner une étiquette (valeurs-texte) aux différentes modalités.

ATTENTION :

Avant de cliquer, sur

Valeurs-Texte, il faut d ’abord sélectionner la variable concernée.

Joseph LARMARANGE

modifier les valeurs texte
Modifier les Valeurs-Texte
  • Donner un texte court pour la Valeur-Texte.
  • Préciser la correspondance numérique.
  • Une étiquette pour préciser la modalité est disponible.
  • << & >> servent à passer d ’une variable à l’autre.

Le nom de la variable concernée apparaît en haut à droite

Joseph LARMARANGE

saisie des donn es
Saisie des données

Exemple 1 :

Joseph LARMARANGE

saisie des donn es12
Saisie des données

On peut choisir d’afficher les Valeurs-Texte ou leur équivalent numérique en allant dans le menu

Affichage >

Afficher les Valeurs-Texte

ou en cliquant sur le bouton

Joseph LARMARANGE

statistiques descriptives
Statistiques descriptives
  • Aller dans le module Statistiques Élémentaires disponible dans le menu Statistiques.

Joseph LARMARANGE

statistiques descriptives14
Statistiques descriptives
  • Choisir les statistiques descriptives.

Joseph LARMARANGE

choisir les variables
Choisir les variables
  • Un clic sur le bouton Variables.

Joseph LARMARANGE

choisir les variables16
Choisir les variables
  • Sélectionner les variables retenues pour l’analyse
  • Pour une liste continue de variables, utilisez la touche SHIFT(ou ) et pour une liste discontinue la touche CTRL

Joseph LARMARANGE

statistiques descriptives17
Statistiques descriptives
  • Cliquer sur le bouton Synthèse

Joseph LARMARANGE

r sultats
Résultats

Joseph LARMARANGE

pour poursuivre l analyse
Pour poursuivre l’analyse
  • Cliquer sur ce bouton

Joseph LARMARANGE

onglet avanc
Onglet Avancé
  • Cet onglet donne accès à un nombre plus important de statistiques

Joseph LARMARANGE

corr lation
Corrélation

Exemple 2 :

Joseph LARMARANGE

saisie des donn es23
Saisie des données

Joseph LARMARANGE

corr lation24
Corrélation
  • Choisir les matrices de corrélation dans les Statistiques élémentaires.

Joseph LARMARANGE

d finir les variables de l analyse
Définir les variables de l’analyse
  • Un clic sur le bouton 2 listes.

Joseph LARMARANGE

lancer l analyse
Lancer l’analyse
  • Sous l’onglet Options, choisir Tableau détaillé.
  • Cliquer sur Synthèse.

Joseph LARMARANGE

r sultats d taill s
Résultats détaillés
  • r(X,Y) est le coefficient de corrélation.
  • Les résultats sont en rouge si les résultats sont significatifs avec un risque d’erreur de 5% (p<0.05, le seuil est paramétrable sous l’onglet options). La valeur de p est fournie. t correspond à la statistique du test utilisé.

Joseph LARMARANGE

r sultats d taill s29
Résultats détaillés
  • N rappelle le nombre d’observations considérées.
  • La moyenne et l’écart-type de chacune des deux variables sont donnés à titre indicatif.

Joseph LARMARANGE

r sultats d taill s30
Résultats détaillés
  • Rappelons que le principe est de trouver une droite qui représente le mieux les deux variables. On cherche donc à modéliser le rapport entre X et Y de la forme Y = a X + b.
  • Mais il est aussi possible de modéliser sous la forme X = c Y + d.

Joseph LARMARANGE

r sultats d taill s31
Résultats détaillés

b a d c

  • Statistica donne ces 4 coefficients : Y = a X + B X = c Y + d
  • Ainsi ici, Y = 0,18 X + 1,39 et X = 4,87 Y - 4,34

Joseph LARMARANGE

afficher la droite de r gression
Afficher la droite de régression
  • Un clic sur Nuages de points en 2D.

Joseph LARMARANGE

afficher la droite de r gression33
Afficher la droite de régression
  • Statistica trace la droite de régression ainsi que les valeurs observées représentées par un petit cercle.

Joseph LARMARANGE

autre exemple
Autre exemple :

Exemple 3 :

Un psychologue de l’armée américaine a remarqué que les soldats qui fumaient le plus avaient tendance à contracter plus de rhumes que les fumeurs légers. Par ailleurs il pense que les fumeurs sont des personnalités plus stressées que les non-fumeurs et que ce facteur ‘stress’ pourrait être responsable de leur santé fragile.

Variables relevées :

CIGA : nombre de cigarettes fumées par semaine

RHUM : nombre de rhumes contractés dans l’année écoulée

STRE : mesure du stress sur une échelle de 1 (faible) à 5 (élevé)

Joseph LARMARANGE

autre exemple35
Autre exemple :

Exemple 3 :

Joseph LARMARANGE

r sultats36
Résultats
  • Nous avons affiché la matrice de corrélation simple.
  • Il apparaît à p=5% qu’il y a une corrélation significative entre le nombre de cigarettes et le nombre de rhumes.
  • Par contre, le stress n’enregistre aucune corrélation significative avec les deux autres variables.

Joseph LARMARANGE

test du khi 2
Test du Khi 2

Exemple 4 :

Lors d'une étude sur la connaissance du sida chez les femmes guinéennes âgées de 15-49 ans, on a construit un indicateur de connaissance du sida répartie en quatre groupes : faible, moyenne, bonne et très bonne. Les données sont issues de l'Enquête de Démographie et de Santé 1999. On a comparé cet indicateur avec le niveau d'instruction des femmes. Les effectifs sont les suivants (elles portent sur 6.561 femmes) :

Joseph LARMARANGE

saisie des donn es38
Saisie des données
  • Nous avons 6.561 individus et 2 variables. Nous devrions donc remplir un tableau comportant 6.561 lignes et 2 colonnes.
  • Cependant, il apparaît que certains individus sont identiques (c’est-à-dire présentant exactement les mêmes valeurs pour chaque variables).Ainsi, nous avons 888 femmes qui ont toute une faible connaissance du sida et aucun niveau d’instruction.
  • Nous constatons qu’il y a en tout 16 « profils d’individu » différents.
  • Au lieu de rentrer les caractéristiques des 6.561 femmes, nous allons saisir les caractéristiques des 16 profils type et indiquer dans une troisième variable (le poids) le nombre de femmes que ce profil représente.
  • C’est le principe de la pondération.

Joseph LARMARANGE

saisie des donn es39
Saisie des données
  • Nous allons donc créer un fichier comportant 16 observations et 3 variables.
  • Pour la connaissance du sida, nous coderons 1 une faible connaissance, 2 une moyenne, 3 une bonne et 4 une très bonne.
  • Pour le niveau d’instruction, 0 pour aucun, 1 pour primaire, 2 pour secondaire et 3 pour supérieur.

Joseph LARMARANGE

saisie des donn es40
Saisie des données
  • Voici le fichier de données que nous obtenons.

Joseph LARMARANGE

test du khi 241
Test du Khi 2
  • Choisir les tableaux et tris croisés dans les Statistiques élémentaires.

Joseph LARMARANGE

saisir les variables
Saisir les variables
  • Un clic sur Spécifier les tables.

Joseph LARMARANGE

saisir les variables43
Saisir les variables
  • Sélectionner les variables de l’analyse

Joseph LARMARANGE

pr ciser la pond ration
Préciser la pondération
  • Cliquer sur ce bouton

Ce bouton est accessible dans toutes les fenêtres de Statistica, la pondération pouvant être utilisée pour n’importe quel calcul.

Joseph LARMARANGE

pr ciser la pond ration45
Préciser la pondération
  • Sélectionner la variable de pondération
  • Activer la pondération

Un double clic dans le champ d’édition du nom de la variable ouvre une liste de l ’ensemble des variables du fichier.

Joseph LARMARANGE

lancer l analyse46
Lancer l’analyse
  • Cliquez deux fois sur OK.
  • Aller sous l’onglet Options.
  • Sélectionner Chi² & Pearson et Effectifs théoriques

Joseph LARMARANGE

premier tableau de r sultats
Premier tableau de résultats
  • Il s’agit du tableau croisé des effectifs.

Pour naviguer d’un tableau à l’autre

Joseph LARMARANGE

second tableau de r sultats
Second tableau de résultats
  • Affichage des effectifs théoriquesRappel : il s’agit des effectifs que l’on aurait si les deux variables étaient parfaitement indépendantes.
  • Ici p est inférieur à 0,05. On en déduit qu’avec une erreur de première espèce de 5% que les deux variables ne sont pas indépendantes.NB : petit hic, normalement on ne doit pas avoir d’effectifs inférieurs à 5 (ou à 10 pour plus de précision). Il serait donc préférable de regrouper auparavant certaines catégories.

Joseph LARMARANGE

autre exemple49
Autre exemple :

Exemple 5 :

Dans une enquête sur le réseau Internet auprès de 1006 personnes, une des questions posées était la suivante:

" Personnellement quelle est votre attitude à l'égard de cette nouvelle application de la micro-informatique ? Vous êtes...

Passionné,

Intéressé,

Indifférent,

Dépassé,

Agacé,

ou ne se prononce pas (NSP).

Les personnes interrogées ont été regroupées en 5 catégories d'âge :

18-24 ans, 25-34 ans, 34-49 ans, 50-64 ans, plus de 65 ans.

Joseph LARMARANGE

autre exemple50
Autre exemple :

Exemple 5 :

Voici les données observées.

Étant donné le très faible nombre de NSP, nous n’en tiendrons pas compte.

L’analyse portera donc sur 992 individus.

Joseph LARMARANGE

fichier de donn es
Fichier de données
  • Tableau à 3 colonnes et 25 lignes(puisqu’on ne tient pas compte des NSP)

Joseph LARMARANGE

r sultats52
Résultats
  • p < 0,05  L’attitude à l’égard de Internet diffère avec l ’âge.

Joseph LARMARANGE

liens
Liens
  • Ce diaporama est disponible, ainsi que les fichiers des exemples, à l’adressehttp://joseph.larmarange.free.fr
  • Les statistiques élémentaires sont disponibles gratuitement dans la version de démonstration de statistica disponible sur internet :http://www.statsoft.com/french/welcome.html

Joseph LARMARANGE