Lezione 6 inferenza statistica
This presentation is the property of its rightful owner.
Sponsored Links
1 / 67

Lezione 6 Inferenza statistica PowerPoint PPT Presentation


  • 116 Views
  • Uploaded on
  • Presentation posted in: General

Lezione 6 Inferenza statistica. parte 1 Stime per punti e per intervalli della media. la media campionaria come strumento di inferenza. Si definiscono “ stimatori ” quelle statistiche che vengono usate per stimare un parametro o una sua funzione.

Download Presentation

Lezione 6 Inferenza statistica

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Lezione 6 inferenza statistica

Lezione 6Inferenzastatistica


Parte 1 stime per punti e per intervalli della media

parte 1Stime per punti e per intervalli della media


La media campionaria come strumento di inferenza

la media campionariacome strumento di inferenza

  • Si definiscono “stimatori” quelle statistiche che vengono usate per stimare un parametro o una sua funzione.

    • I valori ottenuti mediante gli stimatori si dicono “stime” del parametro.

  • La media campionaria può essere usata come stimatore della media m dell’intera popolazione essendo uno stimatore corretto e consistente.


Media campionaria e stima puntuale di m

media campionaria e stima puntuale di m

  • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la media campionaria per stimare il valore del parametro m relativo all’intera popolazione.

  • il valore ottenuto viene indicato come “stima puntuale di m ”


Lezione 6 inferenza statistica

Strumenti di misura e strumenti di inferenza


Incertezza dello stimatore campionario

incertezza dello stimatore campionario

  • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la media campionaria per stimare il valore del parametro m relativo all’intera popolazione.

  • come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che deve essere quantificata.


Incertezza dello strumento di misura

incertezza dello strumento di misura

Fascia di valore (a meno di 60 ppm)


Incertezza dello strumento di misura1

incertezza dello strumento di misura


Incertezza dello strumento di misura2

incertezza dello strumento di misura


Incertezza dello stimatore campionario1

incertezza dello stimatore campionario

  • Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, il valore della media m della variabile X per la intera popolazione sia compreso nell’intervallo


Incertezza dello stimatore campionario2

  • Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, l’intervallo casuale

    contenga il valore della media m della variabile X per la intera popolazione?

incertezza dello stimatore campionario


Incertezza dello stimatore campionario3

incertezza dello stimatore campionario

  • Con quale “confidenza”, dopo aver estratto a caso un campione di n elementi dalla popolazione e calcolato il valore della corrispondente media campionaria, si può affermare che il valore della media m della variabile X per la intera popolazione è compreso nell’intervallo


Incertezza dello stimatore campionario4

incertezza dello stimatore campionario

  • La “probabilità” dell’evento:

    è uguale alla “confidenza” con cui posso affermare:

“ Intervallo di confidenza ”


Incertezza dello stimatore campionario5

incertezza dello stimatore campionario

  • La determinazione dell’incertezza degli stimatori campionari si conduce tramite lo studio della distribuzione di probabilità della variabile casuale costituita dallo stimatore.


Distribuzione della media campionaria

Distribuzione della media campionaria


Distribuzione della media campionaria1

  • estraendo da una popolazione per cui è definita la variabile casuale Xavente densità f (x) qualsiasi, media m e varianza s2, un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }, se n è sufficientemente grande la media campionariafornisce una variabile casuale distribuita in modo normale, con media m e varianza s2 / n

distribuzione della media campionaria


Distribuzione della media campionaria2

distribuzione della media campionaria

  • Avendo una popolazione per cui è definita la variabile casuale X con densità f (x) qualsiasi, media m e varianza s2 ed estraendo da essa un campione di n elementi a cui corrisponde l’insieme di vc. { X1, X2, …, Xn }, qual è la probabilità che la media campionariadifferisca da m per una quantità minore di ?


Distribuzione della media campionaria3

distribuzione della media campionaria

  • La risposta al quesito si ottiene individuando la probabilità dell’evento:

  • Tale probabilità è rappresentata dall’area della regione evidenziata in verde nel grafico sopra riportato.


Distribuzione della media campionaria4

  • il valore ricercato si ottiene da:in cui:

distribuzione della media campionaria


Distribuzione della media campionaria5

  • il valore ricercato si ottiene da:in cui:

distribuzione della media campionaria


Distribuzione della media campionaria6

distribuzione della media campionaria

  • sviluppando i calcoli si ottiene:con:


Distribuzione della media campionaria7

distribuzione della media campionaria

  • esplicitando l’espressione dell’evento si ottiene:

  • è quindi possibile fare la seguente affermazione:


Distribuzione della media campionaria8

estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon densità f (x) qualsiasi, media m e varianza s2, c’è una probabilità pari a0,68 che la media campionaria appartenga all’intervallo

distribuzione della media campionaria


Distribuzione della media campionaria9

distribuzione della media campionaria

  • Ricordiamo che: la “probabilità” dell’evento:è uguale alla “confidenza” con cui posso affermare:


Distribuzione della media campionaria10

distribuzione della media campionaria

che può essere tradotta nelle seguenti affermazioni:

  • estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che un intervallo di ampiezzacentrato sul valore della variabile casuale “media campionaria”

    contenga il valore della media m della popolazione.


Intervallo di confidenza per la media

intervallo di confidenza per la media

  • estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che l’intervallo casualecontenga il valore della media m .

  • questo intervallo viene chiamato:intervallo di confidenza allo 0,68 per la media


Intervallo di confidenza allo 1 a per la media

intervallo di confidenza allo ( 1 – a) per la media

in generale, se

sono i quantili a/2 e 1 – a/2 per la media campionaria


Intervallo di confidenza allo 1 a per la media1

intervallo di confidenza allo ( 1 – a) per la media

con una confidenza pari a 1 – apossiamo affermare che


Propriet della media campionaria

Proprietà della media campionaria

teorema 4.4:

  • dato un campione di n elementi prelevato senza ripetizione da una popolazione composta da N elementi per cui è deifinita la variabile casuale X, posto :

  • si ha:


Distribuzione della media campionaria se n n

Distribuzione della media campionaria se n≈N

se il numero n degli elementi del campione non è molto minore della numerosità N (finita) della popolazione.


Attenzione alla numerosit del campione

Attenzione alla numerosità del campione!!!


Dalla lezione 4 distribuzione della media campionaria

Dalla lezione 4:Distribuzione della media campionaria


Dalla lezione 4 distribuzione della media campionaria1

Dalla lezione 4:Distribuzione della media campionaria

teorema 4.3:

  • Sia data una popolazione su cui è definita una variabile causale X condensità f (x) ed avente media m e varianza s 2finite.

  • Detta: la media campionaria di un campione casuale di dimensione n estratto da essa,

  • allora, al tendere di n ad infinito,la media campionaria

    - segue una distribuzione normale

    - conmediam e varianzas 2 / n

    - qualunque sia la distribuzione della popolazione


Dalla lezione 4 distribuzione della media campionaria2

Dalla lezione 4:Distribuzione della media campionaria

  • La possibilità di costruire un campione di dimensione n che tende all’infinito è ovviamente solo teorica, ma l’enunciato del teorema deve essere inteso nel senso che:

    • quanto più il campione è numeroso,

    • tanto meglio la distribuzione della media campionaria approssima una distribuzione normale con media m e con varianza s 2 / n

    • in pratica si può ritenere che un valore di n non inferiore a 30 sia già sufficiente per approssimare la distribuzione della media campionaria con quella normale con media m e con varianza s 2 / n.


Lezione 6 inferenza statistica

la caratteristica comune di una popolazionee il suo modello probabilistico: la distribuzione “normale”


Lezione 6 inferenza statistica

la caratteristica comune di una popolazionee il suo modello probabilistico: la distribuzione “normale”

  • Il modello basato sulla distribuzione “normale” può essere usato per descrivere l’andamento della caratteristica comune di una popolazione quando i valori assunti da tale caratteristica sono determinati dalla azionedi molteplici cause che agiscono indipendentemente le une dalle altre


Distribuzione della media campionaria11

Distribuzione della media campionaria

  • Sia data una popolazione su cui è definita una variabile causale X con distribuzione normale, media m e varianza s 2finite.

  • Detta: la media campionaria di un campione casuale di dimensione n estratto da essa,

  • allora, per qualsiasi n,la media campionaria

    - segue una distribuzione normale

    - conmediam e varianzas 2 / n


Dalla media campionaria alla media campionaria standardizzata

dalla media campionariaallamedia campionaria standardizzata


Intervallo di confidenza per la media1

intervallo di confidenza per la media

  • Ricordiamo che: la “probabilità” dell’evento:è uguale alla “confidenza” con cui posso affermare:


Dalla media campionaria alla media campionaria standardizzata1

Dalla media campionaria alla media campionaria standardizzata

nota:

  • La determinazione del valore della probabilità di un evento analogo a quelli studiati richiede il calcolo di un integrale definito in cui figurano, oltre agli estremi di integrazione, tre parametri variabili in funzione della popolazione e del campione che ne viene estratto: i valori della mediam e della varianzas2della popolazione e la numerositàn del campione estratto.

  • Ciò rende di fatto impossibile fornire in forma tabulare i valori di probabilità degli eventi.

  • Per questi motivi si introduce la versione standardizzata della media campionaria.


Dalla media campionaria alla media campionaria standardizzata2

  • è quindi facile costruire una variabile casualecon distribuzionenormale standard, cioè con media nulla e varianza unitaria.

Dalla media campionaria alla media campionaria standardizzata

  • Considerazioni già fatte ci permettono di affermare che la media campionaria, sotto determinate ipotesi, segue una distribuzione normale con media m e varianza s2 / n


Dalla media campionaria alla media campionaria standardizzata3

  • La probabilità che il valore della variabile Z sia compreso fra gli estremi a e b:

    si può facilmente ricavare dalle tabelle che ogni libro di probabilità e statistica riporta.

Dalla media campionaria alla media campionaria standardizzata


Intervallo di confidenza a 1 a media campionaria standardizzata

Intervallo di confidenza a (1 – a ) : media campionaria standardizzata

  • se indichiamo con z1-a/2 il quantile 1 - a/2 della variabile Z :

pertanto :


Intervallo di confidenza a 1 a media campionaria standardizzata1

Intervallo di confidenza a (1 – a ) : media campionaria standardizzata

  • Per la simmetria della distribuzione della variabile Z :

da cui :


Intervalli di confidenza a 1 a media campionaria standardizzata

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata

  • se esplicitiamo la variabile Z:


Intervalli di confidenza a 1 a media campionaria standardizzata1

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata

  • da cui:


Intervalli di confidenza a 1 a media campionaria standardizzata2

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata

  • Esaminiamo l’evento di cui abbiamo determinato la probabilità:


Intervalli di confidenza a 1 a media campionaria standardizzata3

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata

  • da cui, con passaggi algebrici:


Intervalli di confidenza a 1 a media campionaria standardizzata4

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata

  • La probabilità:

  • è uguale alla confidenza con cui possiamo affermare che:


Intervalli di confidenza a 1 a media campionaria standardizzata5

Intervalli di confidenza a (1 – a ) : media campionaria standardizzata

possiamo quindi sostenere che:

estraendo a caso un campione di n elementi da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a1 - a che l’intervallo casualecon Z variabile normale standard e con z1-a/2 il valore del suo quantile (1 - a/2)contenga il valore della media m per l’intera popolazione.

I1-a è l’intervallo di confidenza allo 1 - a per la media


Campioni con bassa numerosit n 30

W.S.Gosset – “ Student ”

Campioni con bassa numerositàn < 30


Distribuzione t di student con n 1 g d l

Distribuzione t di Student con n-1 g.d.l.

  • La variabile casuale

  • in cui:

    • Z è una variabile casuale normale standardizzata,

    • c2 è una variabile chi-quadro con n-1 gradi di libertà,

    • Z e c2 sono indipendenti l’una dall’altra,

  • segue una distribuzione t di Student con n-1 gradi di libertà


Distribuzione t di student con n 1 g d l1

Distribuzione t di Student con n-1 g.d.l.


Distribuzione t di student con n 1 g d l2

Distribuzione t di Student con n-1 g.d.l.


Distribuzione t di student con n 1 g d l3

Distribuzione t di Student con n-1 g.d.l.

segue una distribuzione t di Student con n-1 gradi di libertà


Distribuzione t di student con n g d l

Distribuzione t di Student con n g.d.l.


Distribuzione della media campionaria standardizzata per n finito

Distribuzione della media campionaria standardizzata per n finito

teorema 5.1:

  • estraendo a caso un campione di numerosità n finita da una popolazione su cui è definita una variabile casuale Xcon distribuzionenormale e media m,

    la variabile casualesegue una distribuzione t di Student con n-1 gradi di libertà


Intervalli di confidenza media campionaria standardizzata con n finito

Intervalli di confidenza: media campionaria standardizzata con n finito

  • La distribuzione t di Student è simmetrica rispetto allo 0, pertanto gli intervalli di confidenza sono centrati sul valore dello stimatore


Intervalli di confidenza media campionaria standardizzata con n finito1

Intervalli di confidenza: media campionaria standardizzata con n finito

  • se indichiamo con t1-a/2 il quantile 1-a/2 della variabile T :


Intervalli di confidenza media campionaria standardizzata con n finito2

Intervalli di confidenza: media campionaria standardizzata con n finito

  • se esplicitiamo la variabile T:


Intervalli di confidenza media campionaria standardizzata con n finito3

Intervalli di confidenza: media campionaria standardizzata con n finito

  • da cui:


Intervalli di confidenza media campionaria standardizzata con n finito4

Intervalli di confidenza: media campionaria standardizzata con n finito

  • dall’evento sopra riportato, con passaggi algebrici, si ricava:


Intervalli di confidenza media campionaria standardizzata con n finito5

Intervalli di confidenza: media campionaria standardizzata con n finito

  • La probabilità:

  • è uguale alla confidenza con cui possiamo affermare che:


Intervalli di confidenza media campionaria standardizzata con n finito6

Intervalli di confidenza: media campionaria standardizzata con n finito

possiamo quindi sostenere che:

estraendo a caso un campione con n finito da una popolazione per cui è definita una variabile casuale Xcon distribuzione normale c’è una probabilità pari a1 - ache l’intervallo casuale

in cui t1-a/2 è il valore del quantile (1 - a/2) di una variabile T distribuita secondo la t di Student conn -1 g.d.lcontenga il valore della media m della popolazione.


Intervalli di confidenza media campionaria standardizzata con n finito7

Intervalli di confidenza: media campionaria standardizzata con n finito

è l’intervallo di confidenza allo 1 - a per la media m nel caso di campioni di ridotta numerosità estratti da popolazioni con distribuzione normale!


Distribuzione t di student con n 1 g d l4

Distribuzione t di Student con n-1 g.d.l.

  • La variabile casuale

  • in cui:

    • Z è una variabile casuale normale standardizzata,

    • c2 è una variabile chi-quadro con n-1 gradi di libertà,

    • Z e c2 sono indipendenti l’una dall’altra,

  • segue una distribuzione t di Student con n-1 gradi di libertà


La prossima puntata

La prossima puntata…

Stime per punti e per intervalli della varianza


  • Login