lezione 6 inferenza statistica
Download
Skip this Video
Download Presentation
Lezione 6 Inferenza statistica

Loading in 2 Seconds...

play fullscreen
1 / 67

Lezione 6 Inferenza statistica - PowerPoint PPT Presentation


  • 194 Views
  • Uploaded on

Lezione 6 Inferenza statistica. parte 1 Stime per punti e per intervalli della media. la media campionaria come strumento di inferenza. Si definiscono “ stimatori ” quelle statistiche che vengono usate per stimare un parametro o una sua funzione.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Lezione 6 Inferenza statistica' - hada


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
la media campionaria come strumento di inferenza
la media campionariacome strumento di inferenza
  • Si definiscono “stimatori” quelle statistiche che vengono usate per stimare un parametro o una sua funzione.
    • I valori ottenuti mediante gli stimatori si dicono “stime” del parametro.
  • La media campionaria può essere usata come stimatore della media m dell’intera popolazione essendo uno stimatore corretto e consistente.
media campionaria e stima puntuale di m
media campionaria e stima puntuale di m
  • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la media campionaria per stimare il valore del parametro m relativo all’intera popolazione.
  • il valore ottenuto viene indicato come “stima puntuale di m ”
incertezza dello stimatore campionario
incertezza dello stimatore campionario
  • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la media campionaria per stimare il valore del parametro m relativo all’intera popolazione.
  • come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che deve essere quantificata.
incertezza dello strumento di misura
incertezza dello strumento di misura

Fascia di valore (a meno di 60 ppm)

incertezza dello stimatore campionario1
incertezza dello stimatore campionario
  • Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, il valore della media m della variabile X per la intera popolazione sia compreso nell’intervallo
incertezza dello stimatore campionario2
Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, l’intervallo casuale

contenga il valore della media m della variabile X per la intera popolazione?

incertezza dello stimatore campionario
incertezza dello stimatore campionario3
incertezza dello stimatore campionario
  • Con quale “confidenza”, dopo aver estratto a caso un campione di n elementi dalla popolazione e calcolato il valore della corrispondente media campionaria, si può affermare che il valore della media m della variabile X per la intera popolazione è compreso nell’intervallo
incertezza dello stimatore campionario4
incertezza dello stimatore campionario
  • La “probabilità” dell’evento:

è uguale alla “confidenza” con cui posso affermare:

“ Intervallo di confidenza ”

incertezza dello stimatore campionario5
incertezza dello stimatore campionario
  • La determinazione dell’incertezza degli stimatori campionari si conduce tramite lo studio della distribuzione di probabilità della variabile casuale costituita dallo stimatore.
distribuzione della media campionaria1
estraendo da una popolazione per cui è definita la variabile casuale Xavente densità f (x) qualsiasi, media m e varianza s2, un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }, se n è sufficientemente grande la media campionariafornisce una variabile casuale distribuita in modo normale, con media m e varianza s2 / ndistribuzione della media campionaria
distribuzione della media campionaria2
distribuzione della media campionaria
  • Avendo una popolazione per cui è definita la variabile casuale X con densità f (x) qualsiasi, media m e varianza s2 ed estraendo da essa un campione di n elementi a cui corrisponde l’insieme di vc. { X1, X2, …, Xn }, qual è la probabilità che la media campionariadifferisca da m per una quantità minore di ?
distribuzione della media campionaria3
distribuzione della media campionaria
  • La risposta al quesito si ottiene individuando la probabilità dell’evento:
  • Tale probabilità è rappresentata dall’area della regione evidenziata in verde nel grafico sopra riportato.
distribuzione della media campionaria6
distribuzione della media campionaria
  • sviluppando i calcoli si ottiene:con:
distribuzione della media campionaria7
distribuzione della media campionaria
  • esplicitando l’espressione dell’evento si ottiene:
  • è quindi possibile fare la seguente affermazione:
distribuzione della media campionaria8
estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon densità f (x) qualsiasi, media m e varianza s2, c’è una probabilità pari a0,68 che la media campionaria appartenga all’intervallo distribuzione della media campionaria
distribuzione della media campionaria9
distribuzione della media campionaria
  • Ricordiamo che: la “probabilità” dell’evento:è uguale alla “confidenza” con cui posso affermare:
distribuzione della media campionaria10
distribuzione della media campionaria

che può essere tradotta nelle seguenti affermazioni:

  • estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che un intervallo di ampiezzacentrato sul valore della variabile casuale “media campionaria”

contenga il valore della media m della popolazione.

intervallo di confidenza per la media
intervallo di confidenza per la media
  • estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che l’intervallo casualecontenga il valore della media m .
  • questo intervallo viene chiamato:intervallo di confidenza allo 0,68 per la media
intervallo di confidenza allo 1 a per la media
intervallo di confidenza allo ( 1 – a) per la media

in generale, se

sono i quantili a/2 e 1 – a/2 per la media campionaria

intervallo di confidenza allo 1 a per la media1
intervallo di confidenza allo ( 1 – a) per la media

con una confidenza pari a 1 – apossiamo affermare che

propriet della media campionaria
Proprietà della media campionaria

teorema 4.4:

  • dato un campione di n elementi prelevato senza ripetizione da una popolazione composta da N elementi per cui è deifinita la variabile casuale X, posto :
  • si ha:
distribuzione della media campionaria se n n
Distribuzione della media campionaria se n≈N

se il numero n degli elementi del campione non è molto minore della numerosità N (finita) della popolazione.

dalla lezione 4 distribuzione della media campionaria1
Dalla lezione 4:Distribuzione della media campionaria

teorema 4.3:

  • Sia data una popolazione su cui è definita una variabile causale X condensità f (x) ed avente media m e varianza s 2finite.
  • Detta: la media campionaria di un campione casuale di dimensione n estratto da essa,
  • allora, al tendere di n ad infinito, la media campionaria

- segue una distribuzione normale

- conmediam e varianzas 2 / n

- qualunque sia la distribuzione della popolazione

dalla lezione 4 distribuzione della media campionaria2
Dalla lezione 4:Distribuzione della media campionaria
  • La possibilità di costruire un campione di dimensione n che tende all’infinito è ovviamente solo teorica, ma l’enunciato del teorema deve essere inteso nel senso che:
    • quanto più il campione è numeroso,
    • tanto meglio la distribuzione della media campionaria approssima una distribuzione normale con media m e con varianza s 2 / n
    • in pratica si può ritenere che un valore di n non inferiore a 30 sia già sufficiente per approssimare la distribuzione della media campionaria con quella normale con media m e con varianza s 2 / n.
slide35
la caratteristica comune di una popolazionee il suo modello probabilistico: la distribuzione “normale”
slide36
la caratteristica comune di una popolazionee il suo modello probabilistico: la distribuzione “normale”
  • Il modello basato sulla distribuzione “normale” può essere usato per descrivere l’andamento della caratteristica comune di una popolazione quando i valori assunti da tale caratteristica sono determinati dalla azione di molteplici cause che agiscono indipendentemente le une dalle altre
distribuzione della media campionaria11
Distribuzione della media campionaria
  • Sia data una popolazione su cui è definita una variabile causale X con distribuzione normale, media m e varianza s 2finite.
  • Detta: la media campionaria di un campione casuale di dimensione n estratto da essa,
  • allora, per qualsiasi n, la media campionaria

- segue una distribuzione normale

- conmediam e varianzas 2 / n

intervallo di confidenza per la media1
intervallo di confidenza per la media
  • Ricordiamo che: la “probabilità” dell’evento:è uguale alla “confidenza” con cui posso affermare:
dalla media campionaria alla media campionaria standardizzata1
Dalla media campionaria alla media campionaria standardizzata

nota:

  • La determinazione del valore della probabilità di un evento analogo a quelli studiati richiede il calcolo di un integrale definito in cui figurano, oltre agli estremi di integrazione, tre parametri variabili in funzione della popolazione e del campione che ne viene estratto: i valori della mediam e della varianzas2della popolazione e la numerositàn del campione estratto.
  • Ciò rende di fatto impossibile fornire in forma tabulare i valori di probabilità degli eventi.
  • Per questi motivi si introduce la versione standardizzata della media campionaria.
dalla media campionaria alla media campionaria standardizzata2
è quindi facile costruire una variabile casualecon distribuzionenormale standard, cioè con media nulla e varianza unitaria.Dalla media campionaria alla media campionaria standardizzata
  • Considerazioni già fatte ci permettono di affermare che la media campionaria, sotto determinate ipotesi, segue una distribuzione normale con media m e varianza s2 / n
dalla media campionaria alla media campionaria standardizzata3
La probabilità che il valore della variabile Z sia compreso fra gli estremi a e b:

si può facilmente ricavare dalle tabelle che ogni libro di probabilità e statistica riporta.

Dalla media campionaria alla media campionaria standardizzata
intervallo di confidenza a 1 a media campionaria standardizzata
Intervallo di confidenza a (1 – a ) : media campionaria standardizzata
  • se indichiamo con z1-a/2 il quantile 1 - a/2 della variabile Z :

pertanto :

intervallo di confidenza a 1 a media campionaria standardizzata1
Intervallo di confidenza a (1 – a ) : media campionaria standardizzata
  • Per la simmetria della distribuzione della variabile Z :

da cui :

intervalli di confidenza a 1 a media campionaria standardizzata
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata
  • se esplicitiamo la variabile Z:
intervalli di confidenza a 1 a media campionaria standardizzata2
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata
  • Esaminiamo l’evento di cui abbiamo determinato la probabilità:
intervalli di confidenza a 1 a media campionaria standardizzata3
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata
  • da cui, con passaggi algebrici:
intervalli di confidenza a 1 a media campionaria standardizzata4
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata
  • La probabilità:
  • è uguale alla confidenza con cui possiamo affermare che:
intervalli di confidenza a 1 a media campionaria standardizzata5
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata

possiamo quindi sostenere che:

estraendo a caso un campione di n elementi da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a1 - a che l’intervallo casualecon Z variabile normale standard e con z1-a/2 il valore del suo quantile (1 - a/2)contenga il valore della media m per l’intera popolazione.

I1-a è l’intervallo di confidenza allo 1 - a per la media

distribuzione t di student con n 1 g d l
Distribuzione t di Student con n-1 g.d.l.
  • La variabile casuale
  • in cui:
    • Z è una variabile casuale normale standardizzata,
    • c2 è una variabile chi-quadro con n-1 gradi di libertà,
    • Z e c2 sono indipendenti l’una dall’altra,
  • segue una distribuzione t di Student con n-1 gradi di libertà
distribuzione t di student con n 1 g d l3
Distribuzione t di Student con n-1 g.d.l.

segue una distribuzione t di Student con n-1 gradi di libertà

distribuzione della media campionaria standardizzata per n finito
Distribuzione della media campionaria standardizzata per n finito

teorema 5.1:

  • estraendo a caso un campione di numerosità n finita da una popolazione su cui è definita una variabile casuale Xcon distribuzionenormale e media m,

la variabile casualesegue una distribuzione t di Student con n-1 gradi di libertà

intervalli di confidenza media campionaria standardizzata con n finito
Intervalli di confidenza: media campionaria standardizzata con n finito
  • La distribuzione t di Student è simmetrica rispetto allo 0, pertanto gli intervalli di confidenza sono centrati sul valore dello stimatore
intervalli di confidenza media campionaria standardizzata con n finito1
Intervalli di confidenza: media campionaria standardizzata con n finito
  • se indichiamo con t1-a/2 il quantile 1-a/2 della variabile T :
intervalli di confidenza media campionaria standardizzata con n finito2
Intervalli di confidenza: media campionaria standardizzata con n finito
  • se esplicitiamo la variabile T:
intervalli di confidenza media campionaria standardizzata con n finito4
Intervalli di confidenza: media campionaria standardizzata con n finito
  • dall’evento sopra riportato, con passaggi algebrici, si ricava:
intervalli di confidenza media campionaria standardizzata con n finito5
Intervalli di confidenza: media campionaria standardizzata con n finito
  • La probabilità:
  • è uguale alla confidenza con cui possiamo affermare che:
intervalli di confidenza media campionaria standardizzata con n finito6
Intervalli di confidenza: media campionaria standardizzata con n finito

possiamo quindi sostenere che:

estraendo a caso un campione con n finito da una popolazione per cui è definita una variabile casuale Xcon distribuzione normale c’è una probabilità pari a1 - ache l’intervallo casuale

in cui t1-a/2 è il valore del quantile (1 - a/2) di una variabile T distribuita secondo la t di Student conn -1 g.d.lcontenga il valore della media m della popolazione.

intervalli di confidenza media campionaria standardizzata con n finito7
Intervalli di confidenza: media campionaria standardizzata con n finito

è l’intervallo di confidenza allo 1 - a per la media m nel caso di campioni di ridotta numerosità estratti da popolazioni con distribuzione normale!

distribuzione t di student con n 1 g d l4
Distribuzione t di Student con n-1 g.d.l.
  • La variabile casuale
  • in cui:
    • Z è una variabile casuale normale standardizzata,
    • c2 è una variabile chi-quadro con n-1 gradi di libertà,
    • Z e c2 sono indipendenti l’una dall’altra,
  • segue una distribuzione t di Student con n-1 gradi di libertà
la prossima puntata
La prossima puntata…

Stime per punti e per intervalli della varianza

ad