1 / 145

TEORIA DELLA PROBABILIT Á E DELL’INFERENZA STATISTICA

TEORIA DELLA PROBABILIT Á E DELL’INFERENZA STATISTICA. CALCOLO DELLE PROBABILITA’.

chesmu
Download Presentation

TEORIA DELLA PROBABILIT Á E DELL’INFERENZA STATISTICA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TEORIA DELLA PROBABILITÁ E DELL’INFERENZA STATISTICA

  2. CALCOLO DELLE PROBABILITA’ Esperimento casuale: una generica operazione la cui esecuzione, detta prova, è suscettibile di fornire un risultato – compreso in un insieme di risultati necessari ed incompatibili – che non può essere previsto con certezza. • Esempio: Lancio di un dado (prova) • necessarietà: si presenterà almeno uno dei possibili risultati • incompatibilità: si presenterà solo uno dei possibili risultati. • Gli esperimenti casuali riguardano quindi tutti i casi in cui bisogna effettuare una previsione in condizioni di incertezza. • Nel formulare tali previsioni, si esprime il “grado di incertezza” relativo al presentarsi di un certo risultato con una valutazione numerica che prende il nome di PROBABILITA’.

  3. CONCEZIONI ALTERNATIVE DELLA PROBABILITA’ • Impostazione classica: la probabilità del verificarsi di un certo risultato è data dal rapporto tra numero di casi favorevoli al verificarsi di quel risultato ed il numero totale di casi possibili, ammesso che questi possano essere considerati tutti ugualmente possibili. Critica: Non applicabile agli esperimenti i cui risultati non possono ritenersi tutti ugualmente possibili • Impostazione frequentista: all’aumentare del numero delle prove (per n) la probabilità del verificarsi di un certo risultato coincide con la frequenza relativa di tale risultato. a condizione che le prove si svolgano tutte nelle medesime condizioni. Critica: Non sempre tutte le prove si svolgono nelle stesse condizioni.

  4. Impostazione soggettiva: la probabilità è l’espressione del grado di fiducia che un individuo ripone nel verificarsi di un certo evento. Critica: Le valutazioni della probabilità possono variare da individuo ad individuo • Impostazione assiomatica • Concetti primitivi • “La prova genera l’evento con una certa probabilità” • Prova: esperimento il cui risultato non è prevedibile con certezza • Evento: possibile risultato di una prova • Probabilita: numero associato al presentarsi di un evento • Assiomi: regole formali a cui deve sottostare una valutazione di probabilità. A partire dagli assiomi è possibile costruire tutta la teoria della probabilità.

  5. SPAZIO CAMPIONARIO Insieme dei possibili risultati ottenibili da una prova. Esempi: 1. Lancio di una moneta: 2. Lancio di un dado: 3. Numero di minuti in cui una lampadina resta accesa prima di bruciarsi: N.B. Nei primi due esempi S ha cardinalità finita, nel terzo esempio S ha cardinalità nel continuo.

  6. EVENTO Un qualunque sottoinsieme dello spazio campionario S. Si realizza il risultato della prova appartenente ad A. Tipi di Eventi (es: lancio di un dado): Eventi Elementari Eventi Composti Evento Certo Evento Impossibile Esempio: sottoinsiemi dell’evento “durata di una lampadina”

  7. OPERAZIONI SUGLI EVENTI • Unione o Somma Logica fra due eventi A e B è quell'evento C che si verifica quando si verifica A oppure B oppure A e B contemporaneamente: B A S • Intersezione o Prodotto Logico fra due eventi A e B è quell'evento D che si verifica quando si verificano siaA che Bcontemporaneamente: B A S

  8. Complementazione o Negazione di un evento A è quell'evento E che si verifica allorquando A non si verifica: S Esempio: lancio di un dado Eventi Incompatibili: non contengono elementi comuni e quindi la loro intersezione da luogo all’evento impossibile.

  9. B B A A In pratica, il verificarsi dell’uno implica il non verificarsi dell’altro in una prova. Rappresentazioni Grafiche Eventi Compatibili S S Unione Intersezione Eventi Incompatibili S S B B A A Unione Intersezione

  10. SPAZIO DEGLI EVENTI (Z) Una classe di eventi ai quali si vuole assegnare una probabilità. Questa classe deve essere un'algebra, ovvero deve contenere lo spazio campionario S e  come elementi Quando S è costituito da un numero finito k di elementi, lo spazio degli eventi può essere rappresentato dall'insieme di tutti i possibili sottoinsiemi di S ed ha cardinalità 2k. Esempio: lancio di un dado k = 6

  11. In alcuni casi interessano solo alcuni eventi di un esperimento. Esempio: Costruire lo spazio degli eventi relativo all’alternativa tra punteggio pari e punteggio dispari nel lancio di un dado. ASSIOMI P(·): funzione di probabilità Le impostazioni classica e frequentista soddisfano gli assiomi. Solitamente, nel misurare la probabilità si fa sempre riferimento alla definizione classica. L’assioma iii) permette di definire una misura della probabilità per tutti gli eventi (elementari e composti) inclusi nello spazio degli eventi Z.

  12. TEOREMI 1) 2) 3) Teorema delle Probabilità Totali A B S Generalizzazione al caso di 3 eventi A B S C

  13. PROBABILITA’ DI EVENTI SUBORDINATI.INDIPENDENZA STOCASTICA Tra 2 eventi A e B può sussistere una relazione per la quale, sapendo che una prova ha generato un risultato che appartiene a B, si è indotti a modificare la valutazione del verificarsi di A.Esempio: probabilità che una certa squadra vince una partita dopo che alla fine del primo tempo è in svantaggio di 3 reti a zero. PROBABILITA’ SUBORDINATA La probabilità dell'evento B, dato che si è verificato l'evento A, è il rapporto fra la probabilità del contemporaneo verificarsi di A e B e la probabilità di A, se questa è diversa da zero:

  14. Teorema delle Probabilità Composte Dati 2 eventi A e B per i quali P(A)>0 e P(B)>0,se i due eventi sono stocasticamente dipendenti risulta: • si verifica B • B nuovo S • la probabilità subordinata è data dall’area dell’intersezione rispetto all’area di B B A S Se risulta: allora A e B sono stocasticamente indipendenti. In questo caso:

  15. Problema La produzione di pneumatici in una fabbrica avviene in tre turni: il 50% di giorno – il 30% di sera – il 20% di notte. Il controllo della conformità dei pneumatici prodotti si basa su un campione di 200 pezzi, ripartiti secondo le proporzioni dei 3 turni di produzione, che ha rivelato ciò che segue: 1) Calcolare la probabilità che un pneumatico scelto a caso: a) sia difettoso; b) sia difettoso e prodotto in ciascuno dei 3 turni; c) sia difettoso essendo stato prodotto in ciascuno dei 3 turni; d) essendo difettoso sia stato prodotto in ciascuno dei 3 turni. 2) È lecito sostenere che la qualità del prodotto è influenzata dal turno di produzione?

  16. Le probabilità cercate possono essere ottenute dalla tabella delle frequenze relative: a) P(D) = 0,08 b) b.1 P(D  G) = 0,015 b.2 P(D  S) = 0,03 b.3 P(D  N) = 0,035 c) c.1 P(D|G) = c.2 P(D|S) = c.3 P(D|N) =

  17. d)d.1 P(G|D) = d.2 P(S|D) = d.3 P(N|D) = 2) Se la qualità del prodotto non fosse influenzata dal turno di produzione, si dovrebbe avere: P(D|G) = P(D|S) = P(D|N) = P(D) ma evidentemente così non è.

  18. INTRODUZIONE ALL’INFERENZA STATISTICA 1) PRINCIPALI DISTRIBUZIONI DI PROBABILITA’ Binomiale, Poisson • Normale o Gaussiana • Chi – quadrato • t di Student • F di Fisher-Snedecor 2) UNIVERSO E CAMPIONE Campionamento non probabilistico Campionamento probabilistico 3) DISTRIBUZIONI CAMPIONARIE E PROPRIETA’ DEGLI STIMATORI 4) METODI DI STIMA PUNTUALE ED INTERVALLARE 5) TEST PER LA VERIFICA DI IPOTESI

  19. VARIABILE CASUALE Una Variabile CasualeX è una regola (funzione reale) che associa ad E (evento elementare di S) uno ed un solo numero reale. Notazione:X: variabile casualex: realizzazione di una variabile casuale N.B.: la precedente corrispondenza è UNIVOCA. E’ possibile associare una misura di probabilità allo spazio numerico della v.c. utilizzando la misura di probabilità definita sui sottoinsiemi dello spazio campionario S. "Si verifica l'evento E con probabilità P(E)“ "La v.c. X assume il valore x con probabilità P(x)"

  20. 1 P[X(E)] S E X(E) 0 Â Rappresentazione grafica dello schema di costruzione di una v.c. discreta 1 p 3 E E 2 1 E p 3 2 p E E 1 R 5 E 6 4 0 x x x S 1 2 3 Una v.c. X è una variabile che assume valori nello spazio dei numeri reali secondo una funzione di probabilità P(X). Una Variabile Casuale è nota se è nota la sua distribuzione di probabilità

  21. X pi 0 1/8 1 3/8 2 3/8 3 1/8 ESEMPI 1. Consideriamo una famiglia con 3 figli E1 E2 E3 E4 E5 E6 E7 E8 S={MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF} P = 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 Variabile casuale X=“numero dei figli maschi” 1

  22. pi x1 x2 x3 xi VARIABILI CASUALI DISCRETE Assumono valori discreti (solitamente sono ottenute come risultato di un conteggio). Per ogni realizzazione xi risulta: pi = p(xi) = probabilità che X assuma il valore xi

  23. xi pi 0 1/4 1 2/4 2 1/4 Esempio: si lanciano simultaneamente 2 monete. Eventi elementari di S: E1=TT E2=TC E3=CT E4=CC Variabile casuale “X=numero di croci” EiTT TC CT CC xi0 1 1 2 pi1/4 1/4 1/4 1/4 Ad ogni xi associamo una probabilità pari alla somma delle probabilità degli eventi corrispondenti. Le xi sono le realizzazione della v.c., mentre le piidentificano la distribuzione di probabilità della v.c. in questione

  24. VARIABILI CASUALI CONTINUE Ammettono infiniti valori, quindi non è possibile attribuire le singole probabilità ad ogni realizzazione xi. Si associa ad ogni intervallo una funzione f(x) detta funzione di densità di probabilità. N.B.: f(x)NON è la probabilità che X assuma il valore x! f(x) x f(x) è la probabilità che X sia compresa in un intervallo infinitesimale intorno dx ad x .

  25. La funzione di densità f(x) è nulla per quei valori compresi in intervalli esterni al campo di definizione Condizione necessaria affinché una funzione di densità f(x) individui una v.c. X continua è : N.B.:

  26. FUNZIONE DI RIPARTIZIONE Ordinando le realizzazioni della v.c.: v.c. discrete v.c. continue Proprietà: 1) è non decrescente 2) 3)

  27. F(x) 1 pi X P(x) 1 5/6 1 1/6 4/6 2 1/6 1/6 3/6 3 1/6 2/6 4 1/6 xi 5 6 1 2 3 4 5 1/6 1/6 6 1/6 0 1 5 6 2 3 4 x v.c. discrete X: “Punteggio ottenuto nel lancio di un dado”

  28. v.c. continue x x x F ( x ) F ( x ) 1 F ( x ) 0 x x 1 0 x 1 0 Relazione importante: 

  29. MODELLI PER VARIABILI CASUALI DISCRETE Variabile Casuale di Bernoulli Regola i casi riconducibili ad una prova che si può concludere con 2 possibili risultati: INSUCCESSO SUCCESSO p = probabilità di successo Esempi: lancio di una moneta, Espressione di un voto referendario, Lancio di un dado (pari-dispari)

  30. Distribuzione di probabilità Media e varianza N.B.: la varianza è massima se p = 0,5

  31. Problema Una macchina di precisione produce pezzi di ricambio per macchine agricole con una percentuale pari al 10% di pezzi difettosi. Su una produzione oraria di 5 pezzi, si richiede: a) qual e’ la probabilità di avere meno di 3 pezzi difettosi? b) qual e’ la probabilità di avere tra 2 e 4 pezzi difettosi? c) qual e’ la probabilità di avere al più 2 pezzi difettosi? d) qual e’ la probabilità di avere almeno 4 pezzi difettosi? • disegnare la funzione di probabilità e di ripartizione della v.c. che descrive i risultati dell’esperimento • calcolare la media e la varianza della distribuzione.

  32. Variabile Casuale Binomiale Regola la probabilità in tutti i casi riconducibili ad una estrazionecon reimmissione di n palline da un’urna. p(x) = probabilità di x successi in n prove In ognuna delle n prove p è la probabilità di successo ed è costante. p(0) = p(X = 0) = Probabilità che in n prove non si verifichi alcun successo Probabilità che in n prove si verifichi 1 successo p(1) = p(X = 1) = Probabilità che in n prove si verifichino n successi p(n) = p(X = n) =

  33. n = numero di prove Quindi: x = numero di successi in n prove n – x = numero di insuccessi in n prove La funzione di probabilità deve tener conto di tutte le possibili sequenze di successi ed insuccessi (principio della probabilità totale per eventi incompatibili). Numero di possibili sequenze di successi ed insuccessi (corrispondente al numero di elementi dello spazio degli eventi) Quanti sono i modi di combinarsi di una specifica sequenza? n elementi presi x ad x Qual è la probabilità di ognuna delle sequenze?

  34. La funzione di probabilità della v.c. binomiale è quindi: Media Varianza

  35. La variabile casuale “numero di pezzi difettosi (successo) su 5 pezzi prodotti (prove)” segue la distribuzione Binomiale, con parametri n = 5 e p = 0,1 (10%)  = np = 5  0,1 = 0,5 quindi: 2 = np(1-p) = 5  0,1  0,9 = 0,45 Le probabilità elementari possono essere determinate per mezzo della funzione: con

  36. Dati n = 5 e p = 0,1, la v.c. X = “numero di pezzi difettosi su 5 prodotti” è definita come segue: a) P(X < 3) = P(0) + P(1) + P(2) = = 0,59049 + 0,32805 + 0,0729 = 0,99144 b) P(2  X  4) = P(2) + P(3) + P(4) = = 0,0729 + 0,0081 + 0,00045 = 0,08145 c) P(X  2) = P(0) + P(1) + P(2) = = 0,59049 + 0,32805 + 0,0729 = 0,99144 d) P(X  4) = P(4) + P(5) = = 0,00045 + 0,00001 = 0,00046

  37. Variabile Casuale di Poisson

  38. LA VC NORMALE O GAUSSIANA Una vc si dice normale o gaussiana (da Gauss che la propose come modello descrittivo degli errori di misura) se la sua fd è la seguente: dove rispettivamente rappresentano il valor medio e la varianza di X; è una vc continua; (base dei logaritmi neperiani) sono note costanti matematiche.

  39. La sua rappresentazione grafica è la seguente: ed ovviamente la probabilità dell’evento certo sarà data da Oltre ai due valori caratteristici appena esaminati se ne possono definire altri; tra essi una certa importanza ha la media quadratica:

  40. È facile dimostrare che: Per la dimostrazione basta svolgere il quadrato dell’altra formulazione di , semplificare ed ottenere la seconda formulazione che è di maggiore praticità a fini computazionali.

  41. Lo studio analitico della funzione evidenzia: 1) la curva è simmetrica rispetto all’ordinata del punto di massimo; 2) quest’ultimo si trova in corrispondenza del valore ; segue che la mediana (MED , valore che divide una distribuzione di frequenze in due parti esattamente uguali) e la moda (MOD , valore cui corrisponde il massimo valore di una distribuzione di frequenze) coincidono, nella normale, con la media aritmetica; 3) la curva è definita tra meno infinito e più infinito; 4) La curva presenta due punti di flesso (cambiamento di concavità) in corrispondenza con i valori

  42. L’assetto grafico della curva è determinato dai parametri µ e σ , il primo determina il posizionamento della curva sull’asse delle ascisse; per questo µ si definisce come un parametro di posizione. Il secondo, essendo una misura di variabilità con riferimento alla media, mostra quanto siano più o meno dispersi i valori della distribuzione intorno al valore medio. Allora, bassi valori di σ indicano valori della distribuzione (probabilità) poco dispersi o anche, come si dice, molto concentrati, intorno a µ , al contrario alti valori di σ indicano valori della distribuzione molto dispersi rispetto alla media. Pertanto il parametro σ è detto parametro di forma della distribuzione.

  43. Se una vc ha una distribuzione normale la probabilità che x assuma un certo valore in un certo intervallo, poniamo a-b, si ottiene da: che in termini grafici altro non è se non la superficie delimitata a sinistra dall’ordinata nel punto a, a destra dall’ordinata del punto b, inferiormente dall’asse delle ascisse e superiormente dalla curva normale tra a e b. Ovviamente, la probabilità dell’evento certo, cioè

  44. da cui si ha anche che: Esempio, se una vc normale ha media pari a 3,6 e varianza pari a 81, la probabilità che x sia compreso tra -4,2 e 7,5 si ha risolvendo l’integrale

  45. Per fortuna esiste la possibilità di operare in modo estremamente più semplice, ma a tale fine occorre definire una particolare vc normale, detta vc normale standardizzata, la cui caratteristica è quella di avere media pari a zero e varianza unitaria, cioè: Si può dimostrare che data una normale si può sempre passare ad una semplicemente trasformando le x in z con la relazione

  46. Siccome per la normale standardizzata esistono tavole che contengono la determinazione degli integrali coinvolti con il calcolo di allora basta passare da X a Z, risolvere il nostro problema su Z ed averlo risolto per X senza dover calcolare alcun integrale. Tutto questo sarà molto più chiaro con alcuni esempi numerici; prima vediamo più da vicino come sono costruite le tavole per la normale standardizzata.

More Related