1 / 15

Unità 4

Unità 4. La curva gaussiana Variabili standardizzate. L’espressione matematica della distribuzione gaussiana è data da Osservazione. Questa funzione densità probabilità è completamente definita dai parametri  e  .

Download Presentation

Unità 4

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Unità 4 La curva gaussiana Variabili standardizzate

  2. L’espressione matematica della distribuzione gaussiana è data da Osservazione.Questa funzione densità probabilità è completamente definita dai parametri  e  . La curva corrispondente ha una forma a campana del tipo in figura sotto ed è simmetrica rispetto al valore medio.

  3. Essendo la curva simmetrica rispetto al valore medio, è chiaro che le aree sottese alla curva stessa fra – e  e fra  e +, valgono entrambi 0,5. In altre parole c’è una probabilità pari al 50% che la variabile casuale X assuma un valore più basso o più alto del valore medio. • Il valore medio coincide quindi con la mediana. • Il valore medio coincide anche con la moda. • Valore medio, moda e mediana coincidono.

  4. Le ascisse – e + individuano i due punti (punti di flesso) in cui la curva cambia la concavità. • L’area sottesa alla curva nell’intervallo [–, +] è circa il 68% dell’area sottesa a tutta la curva (vale infatti 0,6827). • A ciascuna delle due rimanenti code della curva corrisponde perciò un’area pari a circa 0,16. • L’area che sta sotto la curva nell’intervallo [–1,96, +1,96] vale 0,95; c’è cioè una probabilità del 95% che un’osservazione cada all’interno di questo intervallo. • Tale probabilità sale al 99% se si considera l’intervallo [–2,58, +2,58].

  5. In generale la probabilità che un’osservazione cada all’interno di un generico intervallo[–h, +h], con h arbitrario, può essere facilmente dedotta da tabelle riportate nei principali manuali di statistica. • Il parametro (valore medio) individua la posizione occupata dalla curva nel piano. Infatti, tenendo costante e facendo variare , la curva trasla semplicemente lungo l’asse delle ascisse, come è mostrato in figura sotto.

  6. Il parametro  (deviazione standard) dà invece informazioni su come i valori sono più o meno dispersi attorno alla media. • Ciò è evidente guardando la figura sotto che riporta tre diverse curve gaussiane aventi lo stesso valore di , ma valori differenti per . All’aumentare di  la curva diventa più piatta, poiché i valori sono più dispersi attorno alla media.

  7. LA STANDARDIZZAZIONE La standardizzazione è un procedimento che riconduce una variabile aleatoria distribuita con media μ e deviazione standard σ, ad una variabile aleatoria con distribuzione standard, ossia con media zero e deviazione standard pari a 1. È particolarmente utile nel caso della variabile casuale normale per il calcolo della funzione densità di probabilità e dei percentili con le tavole della gaussiana standard. Infatti i valori della distribuzione normale sono tabulati per media zero e varianza unitaria.

  8. Curva gaussiana standardizzata Il procedimento prevede di sottrarre alla variabile aleatoria la sua media e dividere il tutto per la deviazione standard, passando così dalla variabile originaria X ad una nuova variabile Z (Z-score o standard score):

  9. Area sottesa alla curva di Gauss standardizzata nella coda a destra di Z Area a destra di Z

  10. Area sottesa alla curva di Gauss standardizzata a sinistra di Z Area a sinistra di Z

  11. Uso della tavola di probabilità gaussiana • Due sono gli usi della tavola di probabilità: • Definito un intervallo di valori per X, si vuole calcolare la probabilità che un valore x cada al suo interno. • Definita una probabilità, si vuole calcolare l’intervallo dei valori X che corrisponde a tale probabilità.

  12. Esercizio 1 Si consideri una popolazione con altezza distribuita in maniera gaussiana con media (µ) pari a 172,5 cm e con deviazione standard (σ) pari a 6,25 cm. Qual è la probabilità di incontrare un individuo estratto da tale popolazione di altezza superiore a cm 190? Z = (190 – 172,5) / 6,25 = 2,8 Dalla tavola precedente risulta P = 1 – 0,9974 = 0,0026 Quindi la probabilità di trovare un soggetto più alto di 190 cm è inferiore a 0,3%.

  13. Esercizio 2 Qual è la probabilità di incontrare un individuo estratto dalla popolazione dell’esercizio 1 con un’altezza compresa tra cm 165 e175? Z1= (165 – 172,5) / 6,25 = -1,2 Z2= (175 – 172,5) / 6,25 = 0,4 P(Z1) = 0,115 P(Z2) = 0,345 P(165 ≤ X ≤ 175) = = P(-1,2 ≤ Z ≤ 0,4) = = 1- [0,115 + 0,345] = 0,54

  14. Esercizio 3 Qual è quel valore di altezza che delimita il 5% superiore della distribuzione? P= 0,05  z = 1,645 z = (x-172,5)/6,25 = 1,645 ↓ x = 172,5 + 6,25∙1,645 = 182,78 Circa il 5% della popolazione in studio ha un’altezza superiore di 182,78 cm.

More Related