1 / 18

STATISTICA DESCRITTIVA BIVARIATA

STATISTICA DESCRITTIVA BIVARIATA. Studio simultaneo di due caratteri distinti della popolazione. Consideriamo un gruppo di 9 studenti dei quali vengono raccolte informazioni su sesso e regione di provenienza. Popolazione statistica?. Variabili statistiche?. Sesso. Regione.

zed
Download Presentation

STATISTICA DESCRITTIVA BIVARIATA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. STATISTICA DESCRITTIVA BIVARIATA Studio simultaneo di due caratteri distinti della popolazione

  2. Consideriamo un gruppo di 9 studenti dei quali vengono raccolte informazioni su sesso e regione di provenienza. Popolazione statistica? Variabili statistiche? Sesso Regione Tabella di distribuzione doppia disaggregata

  3. Una distribuzione doppia può essere: * Quantitativa se entrambe le variabili sono quantitative * Qualitativa se entrambe le variabili sono qualitative * Mista negli altri casi

  4. TABELLA DELLA DISTRIBUZIONE CONGIUNTA Ogni casella contiene la FREQUENZA CONGIUNTA delle 2 variabili Vantaggio: facilità di lettura dati

  5. DISTRIBUZIONI MARGINALI Sommando le frequenze per riga si ottengono le FREQUENZE MARGINALI per la VS sesso Sommando le frequenze per colonna si ottengono le FREQUENZE MARGINALI per la VS regione

  6. Si dice distribuzione marginale ogni distribuzione di frequenza che si ottiene considerando le frequenze associate a una sola variabile, indipendentemente dall’altra.

  7. Ci si può domandare come si distribuisce la variabile sesso per gli studenti che provengono da una certa regione. Ad esempio considerando la regione Lombardia In questo caso si studia la variabile sesso CONDIZIONATA dalla variabile regione VS Sesso | Regione = Lombardia

  8. Data una distribuzione doppia (X,Y) si ottiene la distribuzione condizionata di Y rispetto a xi osservando come si distribuisce Y solo per i soggetti della popolazione che hanno per la variabile X il valore fissato xi In simboli Y|(X = xi ) N.B: Nelle frequenze condizionate si formano tante tabelle quante le modalità della variabile X

  9. Lo scopo dell’analisi di una distribuzione doppia è stabilire un legame tra le due variabili X e Y E’ stata effettuata un’indagine sulla soddisfazione di 1316 utenti di una compagnia ferroviaria rispetto al tipo di treno su cui hanno viaggiato

  10. Calcoliamo le frequenze condizionate della soddisfazione X al tipo di treno Y La soddisfazione dipende dal treno! La variabile X dipende da Y

  11. Se la tabella delle frequenza condizionate fosse stata La soddisfazione sarebbe stata indipendente dal tipo di treno La variabile soddisfazione dipende perfettamente dal tipo di treno

  12. Come misurare il grado di dipendenza tra 2 variabili? Test del 2 Pearson 1900 Come si calcola questo indice?

  13. Frequenza teorica in caso di indipendenza Soddisfatti dei treni AV 1) Si calcola la frequenza relativa dei soddisfatti 499/1316 2) Si moltiplica la frequenza relativa per il numero di utenti del treno AV (499/1316 )*325 FREQUENZA TEORICA IN CASO DI INDIPENDENZA

  14. Frequenza teorica in caso di indipendenza insoddisfatti dei treni AV 1) Si calcola la frequenza relativa degli insoddisfatti 817/1316 2) Si moltiplica la frequenza relativa per il numero di utenti del treno AV (817/1316 )*325 FREQUENZA TEORICA IN CASO DI INDIPENDENZA ECC. ECC.

  15. Calcolo della contingenza Treno AV Contingenza = frequenza misurata – frequenza teorica in caso di indipendenza Si ripete il calcolo delle contingenze per tutte le tipologie di treno

  16. Si dividono i quadrati delle contingenze per le frequenze teoriche La somma degli elementi della tabella è l’indice c2 Qual è il suo significato?

  17. Se i 2 caratterisono indipendenti, la somma delle contingenze è nulla c2 è uguale a zero Se i 2 caratterisono dipendenti, il valore di chi-quadro aumenta all’aumentare della dipendenza

  18. c2 NORMALIZZATO c2 C = (h-1) N N = numero di unità statistiche considerate h = minore tra il numero delle righe e delle colonne 0 < C < 1

More Related