Lezione 6 Inferenza statistica

Lezione 6Inferenzastatistica

parte 1Stime per punti e per intervalli della media

la media campionariacome strumento di inferenza • Si definiscono “stimatori” quelle statistiche che vengono usate per stimare un parametro o una sua funzione. • I valori ottenuti mediante gli stimatori si dicono “stime” del parametro. • La media campionaria può essere usata come stimatore della media m dell’intera popolazione essendo uno stimatore corretto e consistente.

media campionaria e stima puntuale di m • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la media campionaria per stimare il valore del parametro m relativo all’intera popolazione. • il valore ottenuto viene indicato come “stima puntuale di m ”

Strumenti di misura e strumenti di inferenza

incertezza dello stimatore campionario • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la media campionaria per stimare il valore del parametro m relativo all’intera popolazione. • come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che deve essere quantificata.

incertezza dello strumento di misura Fascia di valore (a meno di 60 ppm)

incertezza dello strumento di misura

incertezza dello stimatore campionario • Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, il valore della media m della variabile X per la intera popolazione sia compreso nell’intervallo

Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, l’intervallo casuale contenga il valore della media m della variabile X per la intera popolazione? incertezza dello stimatore campionario

incertezza dello stimatore campionario • Con quale “confidenza”, dopo aver estratto a caso un campione di n elementi dalla popolazione e calcolato il valore della corrispondente media campionaria, si può affermare che il valore della media m della variabile X per la intera popolazione è compreso nell’intervallo

incertezza dello stimatore campionario • La “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare: “ Intervallo di confidenza ”

incertezza dello stimatore campionario • La determinazione dell’incertezza degli stimatori campionari si conduce tramite lo studio della distribuzione di probabilità della variabile casuale costituita dallo stimatore.

Distribuzione della media campionaria

estraendo da una popolazione per cui è definita la variabile casuale Xavente densità f (x) qualsiasi, media m e varianza s2, un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }, se n è sufficientemente grande la media campionariafornisce una variabile casuale distribuita in modo normale, con media m e varianza s2 / n distribuzione della media campionaria

distribuzione della media campionaria • Avendo una popolazione per cui è definita la variabile casuale X con densità f (x) qualsiasi, media m e varianza s2 ed estraendo da essa un campione di n elementi a cui corrisponde l’insieme di vc. { X1, X2, …, Xn }, qual è la probabilità che la media campionariadifferisca da m per una quantità minore di ?

distribuzione della media campionaria • La risposta al quesito si ottiene individuando la probabilità dell’evento: • Tale probabilità è rappresentata dall’area della regione evidenziata in verde nel grafico sopra riportato.

il valore ricercato si ottiene da:in cui: distribuzione della media campionaria

distribuzione della media campionaria • sviluppando i calcoli si ottiene:con:

distribuzione della media campionaria • esplicitando l’espressione dell’evento si ottiene: • è quindi possibile fare la seguente affermazione:

estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon densità f (x) qualsiasi, media m e varianza s2, c’è una probabilità pari a0,68 che la media campionaria appartenga all’intervallo distribuzione della media campionaria

distribuzione della media campionaria • Ricordiamo che: la “probabilità” dell’evento:è uguale alla “confidenza” con cui posso affermare:

distribuzione della media campionaria che può essere tradotta nelle seguenti affermazioni: • estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che un intervallo di ampiezzacentrato sul valore della variabile casuale “media campionaria” contenga il valore della media m della popolazione.

intervallo di confidenza per la media • estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che l’intervallo casualecontenga il valore della media m . • questo intervallo viene chiamato:intervallo di confidenza allo 0,68 per la media

intervallo di confidenza allo ( 1 – a) per la media in generale, se sono i quantili a/2 e 1 – a/2 per la media campionaria

intervallo di confidenza allo ( 1 – a) per la media con una confidenza pari a 1 – apossiamo affermare che

Proprietà della media campionaria teorema 4.4: • dato un campione di n elementi prelevato senza ripetizione da una popolazione composta da N elementi per cui è deifinita la variabile casuale X, posto : • si ha:

Distribuzione della media campionaria se n≈N se il numero n degli elementi del campione non è molto minore della numerosità N (finita) della popolazione.

Attenzione alla numerosità del campione!!!

Dalla lezione 4:Distribuzione della media campionaria

Dalla lezione 4:Distribuzione della media campionaria teorema 4.3: • Sia data una popolazione su cui è definita una variabile causale X condensità f (x) ed avente media m e varianza s 2finite. • Detta: la media campionaria di un campione casuale di dimensione n estratto da essa, • allora, al tendere di n ad infinito, la media campionaria - segue una distribuzione normale - conmediam e varianzas 2 / n - qualunque sia la distribuzione della popolazione

Dalla lezione 4:Distribuzione della media campionaria • La possibilità di costruire un campione di dimensione n che tende all’infinito è ovviamente solo teorica, ma l’enunciato del teorema deve essere inteso nel senso che: • quanto più il campione è numeroso, • tanto meglio la distribuzione della media campionaria approssima una distribuzione normale con media m e con varianza s 2 / n • in pratica si può ritenere che un valore di n non inferiore a 30 sia già sufficiente per approssimare la distribuzione della media campionaria con quella normale con media m e con varianza s 2 / n.

la caratteristica comune di una popolazionee il suo modello probabilistico: la distribuzione “normale”

la caratteristica comune di una popolazionee il suo modello probabilistico: la distribuzione “normale” • Il modello basato sulla distribuzione “normale” può essere usato per descrivere l’andamento della caratteristica comune di una popolazione quando i valori assunti da tale caratteristica sono determinati dalla azione di molteplici cause che agiscono indipendentemente le une dalle altre

Distribuzione della media campionaria • Sia data una popolazione su cui è definita una variabile causale X con distribuzione normale, media m e varianza s 2finite. • Detta: la media campionaria di un campione casuale di dimensione n estratto da essa, • allora, per qualsiasi n, la media campionaria - segue una distribuzione normale - conmediam e varianzas 2 / n

dalla media campionariaallamedia campionaria standardizzata

intervallo di confidenza per la media • Ricordiamo che: la “probabilità” dell’evento:è uguale alla “confidenza” con cui posso affermare:

Dalla media campionaria alla media campionaria standardizzata nota: • La determinazione del valore della probabilità di un evento analogo a quelli studiati richiede il calcolo di un integrale definito in cui figurano, oltre agli estremi di integrazione, tre parametri variabili in funzione della popolazione e del campione che ne viene estratto: i valori della mediam e della varianzas2della popolazione e la numerositàn del campione estratto. • Ciò rende di fatto impossibile fornire in forma tabulare i valori di probabilità degli eventi. • Per questi motivi si introduce la versione standardizzata della media campionaria.

è quindi facile costruire una variabile casualecon distribuzionenormale standard, cioè con media nulla e varianza unitaria. Dalla media campionaria alla media campionaria standardizzata • Considerazioni già fatte ci permettono di affermare che la media campionaria, sotto determinate ipotesi, segue una distribuzione normale con media m e varianza s2 / n

La probabilità che il valore della variabile Z sia compreso fra gli estremi a e b: si può facilmente ricavare dalle tabelle che ogni libro di probabilità e statistica riporta. Dalla media campionaria alla media campionaria standardizzata

Intervallo di confidenza a (1 – a ) : media campionaria standardizzata • se indichiamo con z1-a/2 il quantile 1 - a/2 della variabile Z : pertanto :

Intervallo di confidenza a (1 – a ) : media campionaria standardizzata • Per la simmetria della distribuzione della variabile Z : da cui :

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata • se esplicitiamo la variabile Z:

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata • da cui:

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata • Esaminiamo l’evento di cui abbiamo determinato la probabilità:

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata • da cui, con passaggi algebrici:

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata • La probabilità: • è uguale alla confidenza con cui possiamo affermare che:

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata possiamo quindi sostenere che: estraendo a caso un campione di n elementi da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a1 - a che l’intervallo casualecon Z variabile normale standard e con z1-a/2 il valore del suo quantile (1 - a/2)contenga il valore della media m per l’intera popolazione. I1-a è l’intervallo di confidenza allo 1 - a per la media

Lezione 6 Inferenza statistica