Download
relazioni tra 2 fenomeni quantitativi n.
Skip this Video
Loading SlideShow in 5 Seconds..
RELAZIONI TRA 2 FENOMENI QUANTITATIVI PowerPoint Presentation
Download Presentation
RELAZIONI TRA 2 FENOMENI QUANTITATIVI

RELAZIONI TRA 2 FENOMENI QUANTITATIVI

142 Views Download Presentation
Download Presentation

RELAZIONI TRA 2 FENOMENI QUANTITATIVI

- - - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

  1. RELAZIONI TRA 2 FENOMENI QUANTITATIVI STATISTICA A – K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it

  2. RELAZIONI TRA 2 FENOMENI QUANTITATIVI • Vi è una relazione tra le variabili oggetto di studio? • Di quanto variano i valori d’una variabile quando cambiano i valori dell’altra? • CORRELAZIONE • REGRESSIONE

  3. X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0

  4. E (30 6,2) G (14 2,3) DIAGRAMMA DI DISPERSIONE (SCATTER) M(Y) = 3,0 M(X) = 16

  5. DIAGRAMMA DI DISPERSIONE (SCATTER) • I quadranti in cui compare la maggioranza dei punti indicano il tipo di relazione • Punti in I e III  relazione diretta • Punti in II e IV  relazione inversa • Punti si distribuiscono casualmente in tutti i quadranti all’incirca nella stessa proporzione  nessuna relazione lineare tra le due variabili • L’osservazione della “nuvola” di punti nel diagramma di dispersione fornisce una prima idea sulla relazione eventualmente esistente tra i due fenomeni.

  6. X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0

  7. COVARIANZA • = MEDIA ARITMETICA DEI PRODOTTI DEGLI SCOSTAMENTI • COV(X,Y) >0  RELAZIONE DIRETTA • COV(X,Y) <0  RELAZIONE INVERSA • COV(X,Y) =0  X, Y INCORRELATE

  8. X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0 COV(X,Y)=66,6/7=9,514

  9. Osservazione: per ottenere la covarianza è sufficiente calcolare solo gli scostamenti di una variabile, moltiplicandoli per i valori dell'altra variabile (p. 153)

  10. X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0 COV(X,Y)=66,6/7=9,514

  11. Osservazione: può essere ottenuta anche in funzione dei dati originari (p.154) M(X) = 16 M(Y) = 3,0 COV(X,Y) = 402,6/7-16*3=9,514

  12. Proprietà della covarianza • E’ ESPRESSA NEL PRODOTTO DELLE UNITA’ DI MISURA DI X E DI Y • COV(X,X)=VAR(X) • E’ scale equivariant

  13. Proprietà della covarianza

  14. Proprietà della covarianza • max | COV (X, Y) | = = [VAR(X) VAR(Y)]1/2= = σ(X) σ(Y)

  15. Dimostrazione • var(tX-Y)>0 • t2 var(X) -2t cov(X,Y) + var(Y) >0 • h(t) è una funzione quadratica in t. Se h(t)>0 le radici non sono reali • Δ<0 implica che • 4 [cov(X,Y)]2 -4 var(X) var(Y) <0 • [cov(X,Y)]2 < var(X) var(Y) • |cov(X,Y)| < σ(X) σ(Y)

  16. Come ovviare ai difetti della COV? • La covarianza ha il difetto di risentire dell'unità di misura e dell'ordine di grandezza dei due fenomeni originari essendo espressa in termini del prodotto delle unità di misura di X e Y • I valori che essa può assumere non sono compresi in un intervallo di interpretazione immediata,

  17. RICHIAMO SCOSTAMENTI STANDARDIZZATI(p. 125) • Proprietà: • Mz = 0 • z = 1 • puri numeri  confronto tra fenomeni diversi

  18. COEFFICIENTE DI CORRELAZIONE rxy • (media dei prodotti degli scostamenti standardizzati  è un numero puro)

  19. SCOSTAMENTI STANDARDIZZATI

  20. rxy=6,73/7 =0,961

  21. Formule di calcolo alternative (p. 157)

  22. Formule di calcolo alternative:

  23. Interpretazione di r • rxy = -1 perfetta relazione lineare inversa tra X ed Y (cioè quando yi = a + bxi, con b < 0 e a numero qualsiasi) • rxy = 0 X ed Y sono incorrelate (non vi è tra loro un legame lineare; non si esclude però l’eventuale esistenza d’una relazione non lineare, ad esempio parabolica o sinusoidale) rxy = +1 perfetta relazione lineare diretta tra X ed Y (cioè quando yi = a + bxi, con b > 0 e a numero qualsiasi)

  24. Punti in situazioni estreme e rxy

  25. Esemplificazione di dati con diverso valore del coefficiente di correlazione lineare

  26. |rxy |= 1 se e solo c’è perfetta relazione lineare tra X ed Y • Se Y = a+|b| X

  27. Esempio: 7 supermercati COV(X,Y) = 66,6/7=9,514 VAR(X) = 336/7 = 48 VAR(Y) = 14,28/7 =2,04

  28. Esempio: 7 supermercati (continua) COV(X,Y) = 66,6/7=9,514 VAR(X) = 336/7 = 48 VAR(Y) = 14,28/7=2,04

  29. Caratteristiche di r • Dato che rxy = ryx, il coefficiente di correlazione è una misura simmetrica in X ed Y interdipendenza tra le due variabili. • In esso non si assume una variabile come antecedente e l’altra come conseguente, ma si valuta semplicemente il legame vicendevole tra X ed Y.

  30. Proprietàdirxy(p. 160) • è invariante in senso forte (cioè presenta lo stesso valore numerico) per trasformazioni lineari crescenti di una o di entrambe le variabili

  31. Proprietà di rxy • Proprietà di invarianza per trasformazioni lineari: il coefficiente di correlazione lineare rimane invariato effettuando una trasformazione lineare crescente di una o di entrambe le variabili. •  se si cambia l’origine del sistema di misurazione e/o l’unità di misura in cui sono espresse le variabili, il valore del coefficiente di correlazione non varia.

  32. Applicazione della precedente proprietà • Si ottiene il medesimo valore di rxy anche effettuando il calcolo sui n.i. a base fissa

  33. Esemplificazione di dati con diverso valore del coefficiente di correlazione lineare, in presenza di dati contaminati indicati con il simbolo * (p. 162)

  34. Es: 6 famiglie, ammontare della spesa annua (in euro) per l’acquisto di due generi di largo consumo: latte fresco e biscotti. • (i) rxy? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra rxy e diagramma di dispersione (v) Perché rxy invece della retta di regressione? M(x)= 132.5 M(y)=119.2

  35. CORRELAZIONE FRA DUE S.S. • Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount • Calcolare e commentare rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile