misure di posizione n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Misure di posizione PowerPoint Presentation
Download Presentation
Misure di posizione

Loading in 2 Seconds...

play fullscreen
1 / 23

Misure di posizione - PowerPoint PPT Presentation


  • 147 Views
  • Uploaded on

Elaborazione Statistica dei Dati Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio. Misure di posizione. Giovanni Filatrella ( filatrella@unisannio.it ). Sintesi dei dati. Un istogramma o una tabella di dati contengono molte informazioni.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Misure di posizione' - keelty


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
misure di posizione

Elaborazione Statistica dei Dati SperimentaliFacoltà di Scienze MM FF e NN, Università Sannio

Misure di posizione

Giovanni Filatrella (filatrella@unisannio.it)

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

sintesi dei dati
Sintesi dei dati

Un istogramma o una tabella di dati contengono molte informazioni

E’ utile talvolta riassumere i dati con degli indicatori (indici)

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

indici o misure di posizione
“Indici” o “misure” di posizione

Frequenza rel.

D: Esiste un singolo valore

che possa dare qualche

indicazione su come si

distribuisce la variabile

casuale?

0.4

0.3

0.2

0.1

1.0 1.2 1.4 1.6 1.8 2.0

tasso di

fertilità

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

a cosa serve questo valore
A cosa serve questo valore?
  • Per riassumere i dati occorre avere in mente una domanda
  • A seconda del tipo di analisi che si vuole fare il tipo di “riassunto” dei dati è diverso.

NON vi è una risposta in assoluto “corretta”

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

esempi
Esempi

Il tipo di analisi più comune è la media aritmetica:

Proprietà di cui gode:conserva le trasformazioni di scala operate sui dati:

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

alternative
Alternative:

Mediana: La mediana divide la distribuzione in due parti uguali. E’ definita come quel valore (centrale) che, una volta ordinati i dati del campione, lascia alla sua sinistra e alla sua destra la metà del campione, cioè divide a metà la distribuzione dei dati.

Per esempio:

2, 5, 6, 8, 13, 15, 19, 22, 38     hanno mediana 13 (il 5° di 9 valori)

3, 4, 8, 9, 13, 16, 17, 20, 21, 22   hanno mediana 14,5 (la media fra il 5° e il 6° di 10 valori)

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

formalmente
Formalmente:

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

procedura
Procedura:

6, 6.7, 3.8, 7, 5.8

I valori ordinati sono:

3.8, 5.8, 6, 6.7, 7

mediana

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

esempio 2
Esempio (2)

6, 6.7, 3.8, 7, 5.8, 9.975

I valori ordinati sono:

3.8, 5.8, 6, 6.7, 7, 9.975

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

cosa fare se i dati sono gi raggruppati in classi
Cosa fare se i dati sono già raggruppati in classi:

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

esempio
Esempio

La classe che contiene la mediana è la numero 3, (58 ┤ 70),

Quindi la mediana è:

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

importante
Importante
  • La mediana non gode delle proprietà matematiche della media!

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

iii esempio di indice di posizione la moda
III esempio di indice di posizione: la MODA

Si definisce Moda il valore della variabile casuale della classe che si presenta con maggiore

frequenza

(rispetto alle

classi

adiacenti se esiste un

ordinamento,

variabili discrete o

continue):

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

la moda di una distribuzione di dati potrebbe non corrispondere ad un solo valore
La moda di una distribuzione di dati potrebbe non corrispondere ad un solo valore:

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

moda dai dati grezzi
Moda dai dati grezzi

Per i dati sperimentali non si può calcolare un indice a prescindere dalla scelta di “individui” e “variabile casuale”:

Tasso di fecondità totale per 1.000 donne in età 15-49 per regione di residenza - Anni 1982-1997

Table 10.1 continue - Total fertility rate per 1.000 women aged 15-49 by region of residence - Years 1982-1997

REGIONI E RIPARTIZIONI 1990 1991 1992 1993 1994 1995 1996 1997 (a)

Piemonte 1101 1124 1080 1046 1026 1028 1047 1088

Valle d'Aosta 1.183 1.160 1.116 1.013 1.082 1.102 1.196 1.314

Lombardia 1.147 1.124 1.125 1.100 1.068 1.074 1.099 1.141

Trentino-Alto Adige 1.402 1.410 1.420 1.345 1.339 1.335 1.385 1.436

Veneto .159 1.115 1.138 1.092 1.064 1.073 1.101 1.150

Friuli-Venezia Giulia 1.029 1.024 1.043 950 942 941 975 1.02

Liguria 1.011 1.007 1.027 960 928 915 938 969

Emilia-Romagna 1.013 1.007 993 968 956 967 1.006 1.035

Toscana 1.082 1.052 1.048 1.019 982 979 995 1.03

Umbria 1.176 1.162 1.176 1.108 1.074 1.061 1.068 1.097

Marche 1.230 1.207 1.187 1.131 1.087 1.107 1.085 1.116

Lazio 1.280 1.233 1.259 1.208 1.168 1.109 1.121 1.167

Abruzzo 1.394 1.353 1.349 1.296 1.245 1.175 1.191 1.185

Molise 1.425 1.406 1.421 1.326 1.280 1.209 1.166 1.211

Campania 1.809 1.810 1.794 1.663 1.601 1.499 1.570 1.573

Puglia 1.654 1.601 1.584 1.486 1.437 1.369 1.367 1.386

Basilicata 1.660 1.557 1.570 1.435 1.363 1.327 1.269 1.284

Calabria 1.744 1.668 1.653 1.564 1.432 1.396 1.351 1.329

Sicilia 1.853 1.775 1.792 1.670 1.548 1.455 1.468 1.487

Sardegna 1.370 1.291 1.223 1.164 1.089 1.055 1.030 1.108

Nord 1.117 1.104 1.101 1.064 1.040 1.043 1.075 1.115

Centro 1.206 1.169 1.179 1.134 1.094 1.068 1.076 1.116

Sud 1.712 1.664 1.654 1.547 1.466 1.391 1.403 1.419

ITALIA 1.358 1.328 1.326 1.262 1.215 1.187 1.205 1.217

  (a) Dati provvisori.

(a) Provisional data.

Fonte: ISTAT - Servizio "Popolazione e cultura".

Source: ISTAT - Unit "Popolazione e cultura".

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

d a quali dati si possono applicare i vari indici
D: A quali dati si possono applicare i vari indici?
  • Media: solo alle variabili casuali intere o reali
  • Mediana: solo alle variabili casuali intere o reali
  • Moda: a qualsiasi distribuzione di dati (anche a quelli nominali)

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

esempi di applicazione delle misure di posizione
Esempi di applicazione delle misure di posizione

I guasti in un sistema produttivo risultano causati da:

  • Errore umano 12
  • Problemi dell’impianto 22
  • Malfunzionamenti software 7
  • Difetti dei materiali 5
  • Cause sconosciute 6

D.: Cosa scegliereste e perché?

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

ii esempio di applicazione delle misure di posizione
II esempio di applicazione delle misure di posizione

I guasti in un sistema produttivo hanno provocato delle interruzioni di:

  • 0-1h 26
  • 1-3h 10
  • 3h-1d 2
  • 1-7d 1

D.: Cosa scegliereste e perché? e come procedereste con i calcoli?

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

iii esempio di applicazione delle misure di posizione
III esempio di applicazione delle misure di posizione

I tempi di attesa di un prodotto da parte dei clienti risultano essere stati:

  • 0-2d 2
  • 2-4d 11
  • 4-6d 5
  • 28d 1

D.: Cosa scegliereste e perché? e come procedereste con i calcoli?

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

attenzione
Attenzione:

Sono riportate spesso delle relazioni empiriche fra moda, mediana e media. Non prendetele troppo sul serio!

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

altra caratterizzazione delle distribuzioni i percentili
Altra caratterizzazione delle distribuzioni: i percentili

Percentile: il p-mo percentile è il minimo dato di una lista tale che almeno p% dei valori della lista siano minori o uguali ad esso.

Pertanto per ottenere i percentili da un insieme di dati è necessario ordinarli in una lista.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

nomenclatura
Nomenclatura:
  • 25mo percentile  I Quartile, o Lower Quartile
  • 50mo percentile  Mediana
  • 75mo percentile  III Quartile, o Upper Quartile

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

esercizio
Esercizio:

Determinare:

  • Media aritmetica
  • Mediana
  • Moda
  • 10°, 50°, 90° percentile
  • 1°, 2°, 3° Quartile

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali