1 / 17

Unità 9

Unità 9. Frequenze osservate e frequenze teoriche Test del Tabelle di contingenza. FREQUENZE OSSERVATE E FREQUENZE TEORICHE

dora-potter
Download Presentation

Unità 9

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Unità 9 Frequenze osservate e frequenze teoricheTest del Tabelle di contingenza

  2. FREQUENZE OSSERVATE E FREQUENZE TEORICHE Spesso in medicina è necessario verificare se vi sia una differenza significativa tra due o più categorie di esiti di trattamenti, ciascuna espressa dal numero (frequenza) degli esiti stessi. Come abbiamo già detto, i risultati ottenuti nei campioni non sempre concordano esattamente con i risultati teorici attesi secondo le regole di probabilità. Per esempio, benché considerazioni teoriche ci portino ad attenderci 50 teste e 50 croci da 100 lanci di una moneta non truccata, è raro che questi risultati siano ottenuti esattamente.

  3. DEFINIZIONE DI (CHI-QUADRATO) Una misura della discrepanza esistente tra le frequenze osservate e quelle teoriche è fornita dalla statistica . La formula generale per il calcolo del è data da dove k è il numero di possibile eventi, mentre Oj ed Ej sono le corrispondenti frequenze osservate e teoriche (o attese). È ovvio che se la frequenza totale è N si ha . Se le frequenze teoriche possono essere calcolate senza dovere stimare parametri della popolazione per mezzo delle statistiche campionarie, il numero ν dei gradi di libertà è dato da ν = k–1.

  4. TEST PER L’ANALISI DELLE TABELLE DI CONTINGENZA Per illustrare il test può essere utile fare riferimento ad un esempio. Il passaggio al caso generale è banale. Si pensi di considerare 3 trattamenti (A, B e C) con 3 categorie di esiti ciascuno (I, II e III). I risultati ottenuti possono essere riassunti in una tabella simile alla Tabella 1 in cui a1 rappresenta il numero (frequenza) di individui che, sottoposti al trattamento A, hanno avuto esito I, b1 il numero di individui che sottoposti a B hanno anche essi avuto esito I, e così via. Tale rappresentazione sintetica prende il nome di tabella di contingenza.

  5. hi (i = 1, 2, 3) rappresenta il numero di pazienti che globalmente ha avuto esito i (hi = ai + bi + ci), mentre nj(j = a, b, c) rappresenta il numero di pazienti che globalmente è stato sottoposto al trattamento j (nj = j1 + j2 + j3). Infine T rappresenta il numero totale degli individui osservati.

  6. CALCOLO: • Il test su questa tabella può essere descritto nei seguenti punti: • a. si calcola per ogni trattamento (riga) la somma dei quadrati delle frequenze, divise per il proprio totale di colonna:

  7. b. si dividono i valori ottenuti per il rispettivo totale di riga e si sommano i risultati ottenuti: c. al valore Z si toglie 1 e quindi si moltiplica per il numero totale di osservazioni: d. fissato il livello αdi significatività, si va nella tabella del chi-quadrato con (t – 1)∙(c – 1) gradi di libertà dove t è il numero di trattamenti e c il numero delle categorie di esiti [(3–1)·(3–1) = 4 nel caso considerato]. e. se il valore ottenuto è superiore a quello tabulare allora la differenza è significativa con p < α.

  8. Per comodità di consultazione si riporta di nuovo a lato la Tabelladei valori critici per la distribuzione del chi-quadrato. ν indica il numero di gradi di libertà.

  9. Esercizio 1 I dati nella tabella sotto derivano da uno studio su individui affetti da tumori cerebrali, classificati per tipo di tumore e sede. Si stabilisca se il tipo di tumore è indipendente dalla sede con α=5%. Risposta Applicando il test ai dati in tabella si ottiene = 7,844. I gradi di libertà sono (3 – 1)x(3 – 1) = 4. Si consulti ora la tabella dei valori critici del in corrispondenza a 4 gradi di libertà.

  10. Il valore di = 7,844 ottenuto è maggiore di quello corrispondente a p = 0,10. Esso è tuttavia minore di quello corrispondente a p = 0,05. Avendo fissato α = 0,05, non è quindi possibile rifiutare l’ipotesi nulla che “il tipo di tumore è indipendente dalla sede”; ovvero con i dati a disposizione non è possibile concludere che “il tipo di tumore dipende dalla sede”. Il valore esatto di p calcolato dal test è pari a 0,097.

  11. TABELLA 2 x 2 Nel caso t = 2 e c = 2 la tabulazione assume la configurazione 2 x 2 con 1 grado di libertà (tabella 2 x 2). In questo caso particolare la formula per il calcolo del chi-quadrato diventa semplicemente: Tale espressione tende però a dare risultati viziati, nel senso che porta ad affermare l’efficacia di un trattamento anche quando i dati non lo confermano.

  12. Per questo motivo per le tabelle 2 x 2, particolarmente quando i valori delle frequenze in tabella sono piccoli, è stato proposto di utilizzare la correzione di Yates (o correzione per la continuità) nel calcolo del valore del chi-quadrato. La correzione consiste nel modificare la formula come segue: Bisogna stare attenti al fatto che per campioni poco numerosi il test del chi-quadrato è poco accurato anche se si impiega la correzione di Yates.

  13. Esercizio 2 In un esperimento sulla efficacia della vaccinazione antipoliomielitica, un gruppo di 244 conviventi di malati di poliomielite è stato sottoposto a vaccinazione, mentre un altro gruppo di 233 conviventi di malati di poliomielite non è stato vaccinato. Nel gruppo dei non vaccinati si sono avuti 8 casi di poliomielite (3,43%), mentre fra i vaccinati si è avuto un solo caso (0,41%). La differenza parla a favore del vaccino, ma possiamo considerarla significativa con α = 0,05? Risposta Si organizzino i dati in tabella. Si calcoli ora il valore del , impiegando le formule precedentemente discusse. I valori che si ottengono sono 5,886 e 4,366, rispettivamente senza e con la correzione di Yates.

  14. Si consulti ora la tabella dei valori critici del in corrispondenza a 1 grado di libertà. Il valore critico corrispondente ad α = 0,05 è 3,8415. Sia il valore di corretto sia (a maggior ragione) quello non corretto superano il valore critico. Avendo fissato α = 0,05, è quindi possibile rifiutare l’ipotesi nulla che “i casi di poliomielite sono indipendenti dalla vaccinazione”, ovvero le differenze osservate fra vaccinati e non vaccinati sono significative. Il problema può essere ovviamente risolto anche utilizzando un pacchetto di software statistico, quale, ad esempio, GraphPad. I risultati così ottenuti sono mostrati di seguito.

More Related