Analisi della Varianza
Download
1 / 123

Analisi della Varianza Giulio Vidotto Raffaele Cioffi - PowerPoint PPT Presentation


  • 143 Views
  • Uploaded on

Analisi della Varianza Giulio Vidotto Raffaele Cioffi. Indice. Introduzione, Piano degli Esperimenti ad Un Solo Criterio di Classificazione, Verifica delle Ipotesi nell'Analisi della Varianza, Analisi della Varianza a Due Criteri di Classificazione,

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Analisi della Varianza Giulio Vidotto Raffaele Cioffi' - shaine-hodges


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Analisi della varianza giulio vidotto raffaele cioffi

Analisi della Varianza

Giulio Vidotto

Raffaele Cioffi


Indice
Indice

  • Introduzione,

  • Piano degli Esperimenti ad Un Solo Criterio di Classificazione,

  • Verifica delle Ipotesi nell'Analisi della Varianza,

  • Analisi della Varianza a Due Criteri di Classificazione,

  • Piano degli Esperimenti a Due Criteri Con Replicazione,

  • Quadrato Latino.


Introduzione
Introduzione

  • Un capitolo molto importante della statistica è quello che studia le sperimentazioni ripetute e le modalità di esaminarle statisticamente per verificare certe ipotesi.

  • La sperimentazione ripetuta, tecnicamente chiamata “piano degli esperimenti” (design, of experiments) e l'esame statistico dei risultati si effettuano con la tecnica nota come “ analisi della varianza ”.


Analisi della varianza giulio vidotto raffaele cioffi

  • Nel settore psicologico, molte ipotesi di ricerca implicano sperimentazioni ripetute.

  • Ad esempio, se si studiassero gli effetti di due differenti metodi di insegnamento in relazione a due livelli di intelligenza misurati con test di profitto, ci si troverebbe di fronte a un disegno sperimentale 2x2, implicante ben quattro medie, come schematicamente viene indicato nella tabella….


Analisi della varianza giulio vidotto raffaele cioffi

Tale disegno potrebbe risultare ulteriormente più complesso se si considerassero tre strategie di insegnamento in relazione a tre diversi livelli di intelligenza, tenendo contemporaneamente conto della differenza di sesso; in questo caso il disegno sperimentale sarebbe di 3 X 3 x 2, che verrebbe ad implicare ben 18 medie, come viene indicato nello schema….


Analisi della varianza giulio vidotto raffaele cioffi

Rispetto al metodo del confronto tra medie, simili disegni sperimentali presentano notevoli vantaggi. In primo luogo, offrono informazioni sui principali effetti delle variabili in gioco, cioè se l'effetto sia dovuto o esclusivamente al metodo, o alla sola intelligenza, oppure al sesso solamente.


Analisi della varianza giulio vidotto raffaele cioffi

  • Contemporaneamente consentono di trarre informazioni sulla reciproca interazione delle variabili in gioco, come potrebbe essere l'interazione tra metodo e intelligenza o tra metodo e sesso.

  • Permettono poi di comparare nello stesso momento tutte le medie dei campioni e indicare se tra di esse esista o meno una differenza statisticamente significativa.

  • Infine consentono una più accurata stima della variabilità della popolazione, in quanto basano tale stima su tutti i dati campionari considerati insieme e non su quelli di due campioni per volta, come nel caso dello z-test e del t-test.


Analisi della varianza giulio vidotto raffaele cioffi

  • Se si dovesse eseguire separatamente il confronto tra tutte le combinazioni rilevanti delle medie dei tre o più gruppi e calcolare i singoli punti z critici o i t-test il lavoro diventerebbe quanto mai lungo.

  • Se per disgrazia, poi, nessuno dei numerosi confronti risultasse statisticamente significativo, si compirebbe uno sforzo inutile.

  • Di fronte a una prospettiva del genere, è quanto mai evidente il pregio di un test, come l'analisi della varianza, che consente di tener conto di tutti questi aspetti.


Nozioni fondamentali e terminologia
Nozioni Fondamentali e Terminologia le combinazioni rilevanti delle medie dei tre o più gruppi e calcolare i singoli punti

  • L'analisi della varianza (detta spesso ANOVA, dalle prime lettere in inglese: ANalysis Of VAriance, oppure anche F-test) è una metodologia statistica messa a punto da RA. Fisher e collaboratori.

  • Inizialmente fu utilizzata per analizzare dati provenienti da disegni sperimentali complessi relativi ai settori agricolo e biologico; presto però si rivelò per le indagini psicologiche”.


Analisi della varianza giulio vidotto raffaele cioffi

  • Il principio generale su cui si fonda tale metodo dice che la variabilità di tre o più gruppi di dati è il risultato di numerose cause, ciascuna delle quali esercita una qualche azione.

  • Una scomposizione di tale variabilità, in relazione alle cause che presumibilmente incidono su di essa, può far capire se la diversità tra i gruppi di dati sia da attribuire a cause sistematiche oppure semplicemente a cause accidentali.

  • Le prime in genere modificano il risultato di una sperimentazione, le seconde invece non lo modificano, almeno in media.


Analisi della varianza giulio vidotto raffaele cioffi

  • Quando si ricorre all'analisi della varianza si mettono a confronto le medie ottenute in più campioni. Pertanto, come nel caso del confronto tra due medie, anche nell'analisi della varianza si devono fare alcune assunzioni:

    • a) che le distribuzioni delle popolazioni da cui sono estratti i campioni siano normali;

    • b) che i campioni siano estratti in modo casuale e siano tra loro indipendenti;

    • e) che le varianze dei gruppi siano omogenee.


Analisi della varianza giulio vidotto raffaele cioffi

  • L'analisi della varianza esamina la variabilità totale dei dati mediante una sottile scomposizione in variabilità tra i gruppi (che è la variabilità sperimentale in quanto dovuta alle variabili introdotte dallo sperimentatore) e variabilità nei gruppi (dovuta a variabili difficilmente controllabili).

  • È, pertanto, un procedimento statistico che da una risposta alla seguente domanda:

  • “La variabilità tra i gruppi, rispetto a quella nei gruppi, è talmente grande da giustificare l'inferenza che le medie delle popolazioni, di cui sono campioni, sono del tutto differenti? ”


Analisi della varianza giulio vidotto raffaele cioffi

  • Da quanto si è detto, è evidente che l'analisi della varianza presuppone l'esistenza di un disegno sperimentale mediante il quale si sottopone ad osservazione un certo numero r di gruppi di unità.

  • Ognuno di questi deve contenere nk unità e costituire un campione casuale estratto da un certo universo, in modo indipendente rispetto ai rimanenti r - 1 campioni.

  • Tali gruppi sono il risultato della classificazione delle n unità considerate rispetto alle modalità di un certo numero “ m ” di caratteristiche, dette variabili indipendenti, criteri di classificazione o fattori.


Analisi della varianza giulio vidotto raffaele cioffi

  • Ogni gruppo, pertanto, è caratterizzato da una certa modalità di ciascuna variabile indipendente e le unità dei gruppi si distinguono per possedere una diversa modalità di almeno una delle “m” variabili indipendenti.

  • Per quanto riguarda la misurazione, le variabili dipendenti devono essere misurate almeno a livello di scala ad intervallo, mentre quelle indipendenti possono essere misurate anche a livello di scala nominale.


Piano degli esperimenti ad un solo criterio di classificazione
Piano degli Esperimenti ad Un Solo Criterio di Classificazione

  • II più semplice piano degli esperimenti si ha quando si opera con un solo criteriodi classificazione o un solo fattore.

  • Si considerino, ad esempio, k popolazioni con distribuzione normale, le cui medie

    1, 2, … k

  • non siano note, ma aventi la stessa varianza 2.


Analisi della varianza giulio vidotto raffaele cioffi

  • L'assunzione della costanza della varianza è detta Classificazione“omoschedasticità”, cioè variabilità costante.

  • Ora si supponga di estrarre da ognuna di queste popolazioni n unità.

  • A motivo delle oscillazioni di natura casuale presenti in ogni campionamento, le medie campionarie possono differire anche nell'ipotesi che quelle delle popolazioni siano tutte uguali.

  • Il problema cruciale consiste nell'accettare o respingere l'ipotesi nulla che le medie delle k popolazioni siano tutte uguali tra loro:

    Ho : 1 = 2 = 3 = …. = k


Analisi della varianza giulio vidotto raffaele cioffi

  • Non esisterebbe un tal problema se si operasse con le medie delle popolazioni, in quanto un semplice confronto risolverebbe ogni dubbio.

  • Le difficoltà nascono perché si opera con valori campionari, che sono il risultato della sperimentazione.

  • L'importanza di sapere, sulla base dei dati campionari, se le medie delle popolazioni siano tutte uguali è dovuta alle conseguenze che da ciò si possono ricavare.


Analisi della varianza giulio vidotto raffaele cioffi

  • Ad esempio, si consideri un ipotetico esperimento in cui si studia la relazione tra distanza fisica e manifestazione della propria vita psichica.

  • Si può pensare che la gente si confidi in maniera più completa quando un intervistatore è seduto vicino che a distanza ragguardevole.

  • Per verificare questa supposizione, si conduca un esperimento mediante intervista.

  • Ai Soggetti sottoposti ad esperimento si dica che si stanno studiando le tecniche dell'intervista.


Analisi della varianza giulio vidotto raffaele cioffi

  • Ognuno di essi venga fatto sedere in una stanza; l'intervistatore entri e sieda in una delle tre sedie poste a distanze diverse dal soggetto: vicino: 61 cm.; distanza media: 1 metro e 22 cm.; distanza elevata: 1 metro e 83 cm.

  • Le distanze scelte dall'intervistatore costituiscano la variabile indipendente manipolabile, chiamata anche, come si è detto, fattore.

  • Trenta soggetti, scelti casualmente da una medesima popolazione, vengano assegnati a caso nelle tre diverse condizioni di distanza, e il comportamento dell'intervistatore sia costante in tutte le situazioni.


Analisi della varianza giulio vidotto raffaele cioffi

  • L'intervista consista in un numero di domande e la l'intervistatore entri e sieda in una delle tre sedie poste a distanze diverse dal soggetto: vicino: 61 cm.; distanza media: 1 metro e 22 cm.; distanza elevata: 1 metro e 83 cm.variabile dipendente sia il numero di affermazioni di carattere personale e rilevanti fatte dal soggetto sperimentale durante l'intervista.

  • Le ipotesi possono essere così formulate:

    Ho : 1 = 2 = 3

  • H1: almeno dei medie significativamente diverse tra loro


Analisi della varianza giulio vidotto raffaele cioffi

  • Il ricercatore è interessato a conoscere quanta l'intervistatore entri e sieda in una delle tre sedie poste a distanze diverse dal soggetto: vicino: 61 cm.; distanza media: 1 metro e 22 cm.; distanza elevata: 1 metro e 83 cm.varianza totale dei punteggi debba essere attribuita al cambiamento della variabile indipendente (la distanza), che egli ha ipotizzato essere la causa della sistematica variabilità nelle risposte degli intervistati.

  • In altre parole, desidera conoscere quanto le differenti distanze influiscano sulla varianza totale dei punteggi e quanto la differenza dei soggetti sottoposti ad esperimento.

  • È quindi una conoscenza che ha una notevole rilevanza nelle applicazioni pratiche.


La scissione della varianza totale
La Scissione della Varianza Totale l'intervistatore entri e sieda in una delle tre sedie poste a distanze diverse dal soggetto: vicino: 61 cm.; distanza media: 1 metro e 22 cm.; distanza elevata: 1 metro e 83 cm.

  • L'analisi della varianza si fonda su due principi generali. Questi sono:

    • a) la scissione della devianza totale in due o più partì,

    • b) la scissione dei gradi di libertà in due o più partì.

  • Queste due scissioni assumono forme diverse a seconda del tipo di analisi intrapresa.


Analisi della varianza giulio vidotto raffaele cioffi

Nel caso di l'intervistatore entri e sieda in una delle tre sedie poste a distanze diverse dal soggetto: vicino: 61 cm.; distanza media: 1 metro e 22 cm.; distanza elevata: 1 metro e 83 cm.un solo criterio di classificazione o un solo fattore si considerano k campioni, ognuno costituito da n osservazioni, per cui il numero totale dei dati è:N = n X k


Analisi della varianza giulio vidotto raffaele cioffi

  • Gli l'intervistatore entri e sieda in una delle tre sedie poste a distanze diverse dal soggetto: vicino: 61 cm.; distanza media: 1 metro e 22 cm.; distanza elevata: 1 metro e 83 cm.N dati possono essere disposti in una tabella come quella disegnata sopra.

  • Per una lettura esatta di questa tabella, è necessario tener presente, con riferimento a Xij che se si varia il primo dei due indici (i) e si tiene fisso il secondo (j) ci si sposta lungo una colonna.

  • Se invece si varia il secondo dei due indici (j) e si tiene fisso il primo ci si sposta lungo una riga.


Analisi della varianza giulio vidotto raffaele cioffi
Andiamo a considerare l' l'intervistatore entri e sieda in una delle tre sedie poste a distanze diverse dal soggetto: vicino: 61 cm.; distanza media: 1 metro e 22 cm.; distanza elevata: 1 metro e 83 cm.j-esimo campione e calcoliamo la sua devianza (somma dei quadrati degli scarti dalla media) ossia:

se ricorriamo al principio della scomposizione degli scarti in modo da introdurre la media del campione considerato , si avrà l'equazione di base:


Dal momento che la somma degli scarti dalla media nulla ossia
Dal momento che la somma degli scarti dalla media è nulla, ossia:

l'intero ultimo addendo sarà uguale a zero….


In oltre dal momento che sussiste l uguaglianza
In oltre, dal momento che sussiste l'uguaglianza: ossia:

se quest'ultima viene sostituita nell'equazione di base, si avrà:


Se questa si estende ai k campioni che costituiscono l insieme degli n dati si avr
Se questa si estende ai ossia:k campioni che costituiscono l'insieme degli n dati, si avrà…


L equazione ora esposta si scompone nelle seguenti parti

Devianza totale (D ossia:tot ) =

Devianza tra i campioni (tra i gruppi) (Dtra) =

Devianza nei campioni (Dnei) o Devianza residua (Dres) =

L'equazione ora esposta si scompone nelle seguenti parti:


Analisi della varianza giulio vidotto raffaele cioffi


Analisi della varianza giulio vidotto raffaele cioffi

  • Ad esempio, supponiamo di voler studiare l'influenza di tre diverse condizioni sperimentali di luminosità sul rendimento del controllo del confezionamento di capi di abbigliamento, per eseguire tale esperimento, si ricorre ad un campione di 9 donne assegnando a caso 3 di esse a ciascuna condizione di luminosità (alta, media e bassa).

  • Si faccia riferimento alla tabella...


Calcoliamo la devianza totale d tot d tra d nei ossia
Calcoliamo la devianza totale: diverse condizioni sperimentali di luminosità sul rendimento del controllo del confezionamento di capi di abbigliamento, per eseguire tale esperimento, si ricorre ad un campione di 9 donne assegnando a caso 3 di esse a ciascuna condizione di luminosità (alta, media e bassa).Dtot = Dtra + Dneiossia…

quindi…


Devianza totale d tot
devianza diverse condizioni sperimentali di luminosità sul rendimento del controllo del confezionamento di capi di abbigliamento, per eseguire tale esperimento, si ricorre ad un campione di 9 donne assegnando a caso 3 di esse a ciascuna condizione di luminosità (alta, media e bassa). totale (Dtot) =


Devianza tra i campioni d tra
devianza tra i campioni (D diverse condizioni sperimentali di luminosità sul rendimento del controllo del confezionamento di capi di abbigliamento, per eseguire tale esperimento, si ricorre ad un campione di 9 donne assegnando a caso 3 di esse a ciascuna condizione di luminosità (alta, media e bassa).tra) =


Devianza nei campioni d nei o devianza residua d res
devianza nei campioni (D diverse condizioni sperimentali di luminosità sul rendimento del controllo del confezionamento di capi di abbigliamento, per eseguire tale esperimento, si ricorre ad un campione di 9 donne assegnando a caso 3 di esse a ciascuna condizione di luminosità (alta, media e bassa).nei) o Devianza residua (Dres)


Analisi della varianza giulio vidotto raffaele cioffi


Scissione dei gradi di libert
Scissione dei Gradi di Libertà sono o meno esatti:

  • Quando si lavora con diverse devianze, necessariamente si opera anche con un certo numero di gradi di libertà (o di indipendenza); i gradi di libertà (v)si ottengono sottraendo dal numero dei dati il numero dei vincoli lineari.


Analisi della varianza giulio vidotto raffaele cioffi

  • Dal momento che i gruppi sperimentali sono 3 (testo dell'esercizio precedente) si avranno 3 gradi di libertà. I gradi di libertà totali quindi sono dati dalla formula:

    vtot = N - 1 = n  k - 1

  • I gradi di libertà tra i campioni saranno dati da:

    ntra = k - 1


Analisi della varianza giulio vidotto raffaele cioffi

  • i gradi di libertà residui, infine, si determinano… dell'esercizio precedente) si avranno 3 gradi di libertà. I gradi di libertà totali quindi sono dati dalla formula:

    vres = (n - 1)  k

  • anche nel caso dei gradi di libertà la relazione è paritaria, ossia…

    vtot = vtra + vres

  • in quanto:

    (k - 1) + (n - 1)  k = k - 1 + n  k - k = n  k - 1


Analisi della varianza giulio vidotto raffaele cioffi


Analisi della varianza giulio vidotto raffaele cioffi

  • i gradi di libertà tra i campioni saranno dati da: alla somma di quelli tra campioni e di quelli residui o nei campioni.

    ntra = k - 1 = 3 - 1 = 2

  • i gradi di libertà residui, infine, si determinano…

    vres = (n - 1)  k = (3 - 1)  3 = 6

  • i gradi di libertà totali quindi sono dati dalla formula:

    vtot = N - 1 = n  k - 1 = 3  3 - 1 = 8

  • perciò….

    8 = 2 + 6


Calcolo delle tre varianze
Calcolo delle Tre Varianze alla somma di quelli tra campioni e di quelli residui o nei campioni.

  • È possibile riunire le dure relazioni fondamentali della scissione delle devianze e dei gradi di libertà nella seguente maniera:


Analisi della varianza giulio vidotto raffaele cioffi
Quindi: il rapporto tra una devianza e i corrispondenti gradi di libertà genera a una varianza. Infatti si ha che:

le due precedenti relazioni (quelle precedute da parentesi graffa) danno luogo a tre varianze campionarie (media dei quadrati, o in inglese, mean square); ossia…


Varianza totale
Varianza totale gradi di libertà genera a una varianza. Infatti si ha che:


Varianza tra campioni
Varianza tra campioni gradi di libertà genera a una varianza. Infatti si ha che:


Varianza residua
Varianza residua gradi di libertà genera a una varianza. Infatti si ha che:


Analisi della varianza giulio vidotto raffaele cioffi

Si può dimostrare che la varianza totale ( gradi di libertà genera a una varianza. Infatti si ha che:s2tot) è la media aritmetica ponderata delle altre due varianze parziali, con pesi uguali ai rispettivi gradi di libertà, infatti:


Riassumiamo tutti gli elementi necessari per effettuare un analisi della varianza a mano
Riassumiamo tutti gli elementi necessari per effettuare un'analisi della varianza "a mano":


Analisi della varianza giulio vidotto raffaele cioffi


Analisi della varianza giulio vidotto raffaele cioffi


Analisi della varianza giulio vidotto raffaele cioffi

si deduce che la varianza totale non corrisponde alla somma delle due varianze tra i gruppi e residua, invece la media ponderata delle varianze parziali con pesi uguali ai gradi di libertà è…

  • che corrisponde alla varianza totale.


Verifica delle ipotesi nell analisi della varianza
Verifica delle Ipotesi nell'Analisi della Varianza delle due varianze tra i gruppi e residua, invece la media ponderata delle varianze parziali con pesi uguali ai gradi di libertà è…

  • Fino a questo punto abbiamo visto i concetti fondamentali relativi all'analisi della varianza e il calcolo della varianza totale, della varianza tra i gruppi, di quella nei gruppi e dei g.d.l.

  • Non abbiamo detto ancora nulla sulla verìfica delle ipotesi utilizzando tale metodo.

  • Quello che si è detto fino a questo punto è, però, una premessa indispensabile per poter verificare l'ipotesi nulla relativa alla uguaglianza delle k medie di k popolazioni.


Analisi della varianza giulio vidotto raffaele cioffi

  • Va ricordato che la prova di questa ipotesi richiede la presenza delle tre caratteristiche elencate all'inizio, e cioè che:

    • 1) le variabili Xìj siano distribuite in modo normale in ciascuna popolazione,

    • 2) le popolazioni siano indipendenti,

    • 3) le popolazioni abbiano la stessa varianza 2.


Analisi della varianza giulio vidotto raffaele cioffi

  • La verifica della ipotesi nulla passa attraverso l'utilizzo del test F.

  • Si ricorderà che il test F ha una distribuzione conosciuta solo quando le due stime sono indipendenti runa dall'altra.

  • Abbiamo visto che solo la varianza tra i gruppi (s2tra) e la varianza residua (s2res) sono indipendenti, mentre non lo è la varianza totale.

  • La varianza totale, essendo la media ponderata delle altre due varianze, non può godere della proprietà dell'indipendenza e quindi non può essere usata per il calcolo del test F.


Analisi della varianza giulio vidotto raffaele cioffi
Le due varianze indipendenti possono, allora, dar luogo al rapporto del test F, anzi a due rapporti, uno reciproco dell'altro; cioè:


Analisi della varianza giulio vidotto raffaele cioffi

  • Le tavole rapporto del F sono costruite con l'assunzione che al numeratore si trovi la varianza maggiore.

  • Il problema è allora di sapere quale delle due menzionate varianze andrà al numeratore.

  • È stato dimostrato che la varianza S2traè significativamente superiore alla varianza residua S2resnel caso di ipotesi non nulla.

  • Perciò il test F é:

dove l'indice (cal) indica che si tratta di un valore calcolato o sperimentale di F.


Analisi della varianza giulio vidotto raffaele cioffi

  • Il confronto tra valore calcolato di rapporto del F e valore tabulare (F5%, F1% ecc.) offre il criterio per decidere se accettare o respingere l'ipotesi nulla relativa all'uguaglianza della media di tutte le k popolazioni.

  • La regione crìtica è data dalla coda destra della distribuzione F, come si può vedere nella figura della prossima diapositiva; e pertanto se Fcalcade entro quest'area si respinge l'ipotesi nulla Ho, cioè si respinge la supposizione che le medie delle k popolazioni siano uguali.


Analisi della varianza giulio vidotto raffaele cioffi

Si supponga ad esempio di aver raccolto alcuni dati sulla natalità in tre diverse città: città prevalentemente industriali, città prevalentemente commerciali e città in cui la vita è prevalentemente politico-amministrativa:


Scissione della devianza

D natalità in tre diverse città: città prevalentemente industriali, città prevalentemente commerciali e città in cui la vita è prevalentemente politico-amministrativa:tot =

Scissione della devianza:

=(4.2-6.625)2+(2.8-6.625)2+…. +(3.3 - 6.625)2= 372.585


Analisi della varianza giulio vidotto raffaele cioffi

D natalità in tre diverse città: città prevalentemente industriali, città prevalentemente commerciali e città in cui la vita è prevalentemente politico-amministrativa:tra =

Dres =

=8(8.5+6.625)2+(5.5+6.625)2+(5.875-6.625)2=42.75

=(4.2 - 8.5)2+(5.0 - 8.5)2+… + (12.4 - 5.875)2 = 329.835


Analisi della varianza giulio vidotto raffaele cioffi

  • Si può subito verificare che: natalità in tre diverse città: città prevalentemente industriali, città prevalentemente commerciali e città in cui la vita è prevalentemente politico-amministrativa:

    372,585 = 42,75 + 329,835

  • Scissione dei gradi di libertà

    vtot = nk - 1 = 8  3 - 1 = 23

    vtra = k - 1 = 3 - 1 = 2

    vres = k (n - 1) = 3 (8 - 1) = 21

  • Anche in questo caso si vede subito che:

    23 = 2 + 21.


Analisi della varianza giulio vidotto raffaele cioffi
Con i dati precedenti si possono calcolare le varianze e quindi anche il test F. Riassumiamo questi calcoli nella tabella sottostante:

Appare chiaro che il test Fcal è pari a 1,36. Una volta in possesso di questo dato, è possibile verificare l'ipotesi nulla.


Decisione
Decisione: quindi anche il test

  • Per decidere di respingere l'ipotesi nulla bisogna che il valore Fcalcada nella regione critica.

  • Ricordiamo che i gradi di libertà relativi al numeratore (stima tra j gruppi) vanno ricercati nella prima riga della tabella, quelli relativi al denominatore (stima residua o nei gruppi) nella prima colonna.


Analisi della varianza giulio vidotto raffaele cioffi

  • Nel nostro problema è risultato che quindi anche il test Fcalcon due gradi di libertà al numeratore e 21 gradi di libertà al denominatore (abbreviato in F2,21) è pari a 1.36

  • Usando la tabella del livello di significatività dello 0,05 e controllando i gradi di libertà troviamo che il valore critico di F è pari a 3,47.

  • Sappiamo, quindi, che, se tutti i requisiti indicati, dovremmo trovare un Fcalmaggiore o uguale a questo meno del cinque per cento delle volte.

  • Dal momento che Fcal ottenuto nel è minore di 3,47 non possiamo respingere l'ipotesi al livello di significatività dello 0,05.

  • Dobbiamo quindi dire che i dati non forniscono la prova che i vari tipi di abbiano diversi tassi di incremento nelle nascite.


Confronto tra test della varianza e test della differenza tra medie
Confronto tra Test della Varianza e Test della Differenza Tra Medie

  • II problema che abbiamo appena risolto poteva essere trattato anche con il test della differenza tra le medie, ricorrendo al test t. In questo caso, sarebbero stati necessari tre diversi confronti: la prima città con la seconda, la prima con la terza e la seconda con la terza.


Analisi della varianza giulio vidotto raffaele cioffi

  • Il vantaggio dell'analisi della varianza sta, come dicevamo all'inizio del capitolo, nel permettere di accertare in una sola volta l'esistenza o meno della differenza significativa delle medie di tre diversi gruppi.

  • Se le classi fossero 4, con il test della differenza tra le medie sarebbe necessario effettuare 4 x 3/2, cioè 6 test, anziché uno solo come nell'analisi della varianza.


Analisi della varianza giulio vidotto raffaele cioffi

  • Da queste osservazioni non si deve concludere che l'analisi della varianza è sempre preferibile a una serie di test sulla differenza tra le medie.

  • Rimane sempre vero che il test sulla differenza tra le medie, se eseguito con le dovute cautele, offre una ricchezza di informazioni superiore a quella offerta dall'analisi della varianza.


Analisi della varianza giulio vidotto raffaele cioffi

  • Ad esempio, quest'ultima può indicare una differenza significativa anche quando una sola delle medie si discosta dall'andamento delle altre, ma non si sa quale sia; invece questa indicazione non sfuggirebbe ad una serie di test sulla differenza tra le medie.

  • Gli statistici suggeriscono che è tanto più opportuno ricorrere ai test sulla differenza tra le medie invece che all'analisi della varianza quanto più numerose sono le informazioni di cui si dispone per predire le grandezze relative alle differenze.

  • L'analisi della varianza si dimostra, invece, più adatta ad un esame di prima approssimazione.


Analisi della varianza a due criteri di classificazione

le medie delle righe significativa anche quando una sola delle medie si discosta dall'andamento delle altre, ma non si sa quale sia; invece questa indicazione non sfuggirebbe ad una serie di test sulla differenza tra le medie.

le medie delle colonne

la media totale

Analisi della Varianza a Due Criteri di Classificazione

  • Nel caso di due criteri di classificazione, con una osservazione per casella, gli N = nk dati da sottoporre all'analisi della varianza vanno posti in una tabella a doppia entrata in cui sono indicate anche:


Analisi della varianza giulio vidotto raffaele cioffi

  • Come nel caso precedente, anche per due criteri di classificazione, l'analisi della varianza si fonda sulla scomposizione di varie devianze (somma dei quadrati degli scarti dalla media).

  • Con due criteri di classificazione, oltre ad avere le tre devianze già esaminate precedentemente (totale, tra i gruppi e residua), la devianza totale presenta una sotto - suddivisione:


Effetto delle colonne dato dalla differenza tra la media della colonna e la media generale
effetto delle colonne: dato dalla differenza tra la media della colonna e la media generale,

  • effetto delle righe: quantità dovuta alla differenza tra la media delle righe e la media generale,

  • Nella prossima tabella riportiamo un profilo standard di dati per una analisi della varianza a due criteri di classificazione.


Dal momento che la devianza totale composta essa va scissa mediante la scomposizione dello scarto
Dal momento che la devianza totale è composta, essa va scissa mediante la scomposizione dello scarto

in questo modo si ottengono i seguenti effetti:


Analisi della varianza giulio vidotto raffaele cioffi

effetto totale = scissa mediante la scomposizione dello scarto

effetto colonne =

effetto righe =

effetto residuo =


Con la seguente equazione
con la seguente equazione: scissa mediante la scomposizione dello scarto

l'effetto residuo, detto più comunemente scarto residuo, è di solito indicato con il simbolo dij; quindi la formula precedente diviene…


Analisi della varianza giulio vidotto raffaele cioffi
Elevando al quadrato ambo i membri ed effettuando la somma di tutti gli nk dati, si hanno le quattro devianze:

in quanto tutti i doppi prodotti (termini rettangolari) sono uguali a zero.

A questo punto possiamo attribuire un nome alle quattro componenti della formula precedente…


Analisi della varianza giulio vidotto raffaele cioffi

  • Da ciò si deduce che: di tutti gli

    Dtot = Dcol + Drig + Dres

  • Adesso si può passare al calcolo delle quattro varianze mettendo in rapporto le devianze con i rispettivi gradi di libertà; le varianze per tanto sono le seguenti:


Analisi della varianza giulio vidotto raffaele cioffi

  • Si può bene notare che la varianza totale, ancora una volta, non è data dalla somma delle tre varianze parziali, ma dalla media aritmetica ponderata con pesi uguali ai corrispondenti gradi di libertà.

  • L'esame statistico dei risultati, quindi, prevederà la formulazione di due ipotesi nulle: l'ipotesi nulla relativa alla uguaglianza delle medie delle colonne…

    H0,c : c1 = c2 = ….. = cj

  • l'ipotesi nulla è relativa alla uguaglianza delle medie delle righe…

    H0, r : r1 = r2 = ….. = rj


Analisi della varianza giulio vidotto raffaele cioffi

  • In questo modo si devono calcolare due valori di volta, non è data dalla somma delle tre varianze parziali, ma dalla media aritmetica ponderata con pesi uguali ai corrispondenti gradi di libertà.F, il primo relativo alla varianza delle righe ed il secondo alla varianza delle colonne.

  • In ambedue i casi, al denominatore vi sarà sempre la varianza residua, ossia…


Analisi della varianza giulio vidotto raffaele cioffi

  • A seconda che ognuno di questi volta, non è data dalla somma delle tre varianze parziali, ma dalla media aritmetica ponderata con pesi uguali ai corrispondenti gradi di libertà.Fcal cada o meno all'interno della zona critica, si respinge o si accetta l'ipotesi nulla.

  • Come esempio, si faccia riferimento alla tabella sottostante:


Analisi della varianza giulio vidotto raffaele cioffi

= 3 volta, non è data dalla somma delle tre varianze parziali, ma dalla media aritmetica ponderata con pesi uguali ai corrispondenti gradi di libertà.(10 -11)2 + (12 - 11)2 + (11 - 11)2 = 6

= 3 (4 - 11)2 + (11-11)2 +(18 - 11)2 = 324

Mediante l'analisi della varianza si deve provare l'effetto delle colonne e delle righe sui dati. La scissione delle devianze si esegue come indicato di seguito:

Dres = Dtot - Dc - Dr = 312 - 6 - 294 = 12


Analisi della varianza giulio vidotto raffaele cioffi



Analisi della varianza giulio vidotto raffaele cioffi

  • I valori critici di seguente maniera:F sono uguali fra loro in quanto i gradi di libertà delle righe sono uguali a quelli delle colonne; pertanto, con un livello di fiducia al 5%, Fc è:

    F5% = (v1 = 2, v2 = 4) = 6,94

  • Si deve, allora, concludere che:

    • a) l'effetto delle colonne non è significativo, perché il valore di Fcalnon raggiunge quello teorico Fc

    • b) l'effetto delle righe è significativo al 5%, perché il valore calcolato supera quello critico.


Piano degli esperimenti a due criteri con replicazione
Piano degli Esperimenti a Due Criteri Con Replicazione seguente maniera:

  • In molti casi, la sperimentazione a due criteri viene fatta con replicazione, cioè in ciascuna casella si hanno due o più osservazioni.

  • Si supponga che si debba effettuare una scelta tra diversi metodi di insegnamento e si chieda a quattro insegnanti di provare tutti i tre metodi.


Analisi della varianza giulio vidotto raffaele cioffi

  • Può verificarsi una situazione del genere; supponiamo che l'insegnante A sia, in linea di massima, migliore dell'insegnante B e che il metodo 1° sia superiore al metodo 2°.

  • Quando l'insegnante A usa il metodo 1° ottiene risultati inferiori alla somma delle due superiorità: insegnante e metodo 1°.

  • In questo caso c'è interazione tra insegnante e metodo.


Analisi della varianza giulio vidotto raffaele cioffi

  • Col termine interazione infatti, si intende indicare il mutuo effetto che i due fattori esercitano a vicenda; chiaro che l'interazione può essere positiva o negativa; questo va verificato di volta in volta.

  • Le sperimentazioni che comportano l'interazione tra due fattori presentano aspetti in parte uguali e in parte diversi da quelli esposti nel precedente paragrafo.

  • Infatti il test per la verifica dell'interazione richiede qualche passaggio in più.

  • La somma dei quadrati, cioè la devianza, che non viene spiegata dalle differenze intra-classi, può essere suddivisa sottraendo la parte che può essere spiegata dall'interazione.


Analisi della varianza giulio vidotto raffaele cioffi

  • Quindi la devianza può essere scomposta in: mutuo effetto che i due fattori esercitano a vicenda; chiaro che l'interazione può essere positiva o negativa; questo va verificato di volta in volta.

    • ) devianza totale,

    • ) devianza tra colonne,

    • ) devianza tra righe,

    • ) devianza residua,

    • ) devianza di interazione.


Analisi della varianza giulio vidotto raffaele cioffi

  • Questo risultato viene ottenuto considerando ciascuna delle combinazioni formate dalle classi A e B come una classe di un'unica variabile composita.

  • Infatti avendo più di una osservazione per casella, si può calcolare la media, la quale sintetizza l'effetto di ciascuna combinazione dei due fattori.

  • In altri termini, il problema viene visto come se vi fosse una sola scala nominale composta dalle classi:

    A1, B1, …, Ak, Bl


Analisi della varianza giulio vidotto raffaele cioffi

  • Se tra le classi non vi fosse alcuna interazione, si otterrebbe lo stesso residuo che risulterebbe sommando gli effetti separati delle righe e delle colonne.

  • Se, invece, è presente una interazione significativa, quando si usa questo secondo approccio il residuo è minore.

  • La differenza tra la devianza spiegata attraverso le sotto-classi e quella spiegata mediante la proprietà additiva può essere attribuita all'interazione.


Analisi della varianza giulio vidotto raffaele cioffi

  • Anche in questo caso, per ottenere la varianza è necessario operare la scissione delle devianze e dei corrispondenti g.d.l.

  • Senza entrare troppo nei dettagli, il test F, che verifica la presenza o meno dell'interazione, viene calcolato come è stato indicato precedentemente.

  • Ci si può chiedere che cosa si debba fare quando l'interazione risulta significativa.

  • Non è facile rispondere a questo interrogativo; qualche suggerimento, però, può essere utile.


Analisi della varianza giulio vidotto raffaele cioffi

  • Se l'interazione è significativa, osservando la tabella dei dati dell'analisi della varianza, si riesce ad individuare le sotto-classi che più delle altre contribuiscono a rendere alta l'interazione.

  • È possibile allora effettuare diversi test dell'analisi della varianza trascurando queste sotto-classi, oppure ricorrere a diversi test della differenza tra medie per valutare la significatività del contributo di ciascuna sotto-classe al fenomeno dell'interazione.


Metodo dei blocchi casuali
Metodo dei Blocchi Casuali dati dell'analisi della varianza, si riesce ad individuare le sotto-classi che più delle altre contribuiscono a rendere alta l'interazione.

  • In certi esperimenti accade che i soggetti formino dei gruppi le cui unità sono più simili tra loro di quanto lo siano i soggetti nel loro insieme.


Analisi della varianza giulio vidotto raffaele cioffi

  • Un fenomeno del genere si potrebbe riscontrare nella sperimentazione sui topi:

    • i nati di una stessa nidiata possono dare risultati più omogenei rispetto a quelli di un'altra nidiata;

    • oppure i dati relativi all'autoritarismo, tratti da gruppi composti dai k membri di una stessa famiglia (nonno, padre, figlio), potrebbero essere più omogenei di quelli di un altro gruppo familiare.


Analisi della varianza giulio vidotto raffaele cioffi

  • In questi casi, l'efficacia di un esperimento ripetuto viene potenziata se si ricorre ai seguenti tre artifici:

    • a) riunire le unità più omogenee in un primo blocco;

    • b) scegliere in modo casuale da ciascun blocco le unità da sottoporre a trattamento;

    • c) inserire in ciascun blocco tante unità quanti sono i trattamenti.


Analisi della varianza giulio vidotto raffaele cioffi

  • Supponiamo ad esempio di voler studiare l'influenza della quantità dei rinforzi sull'apprendimento di un labirinto da parte dei topi.

  • Si può ritenere che, nella situazione in esame, i risultati dipendano dalla quantità dei rinforzi.

  • Si costruiscono allora tre blocchi di topi:

    • 1°: un blocco di topi di controllo (vengono messi nel labirinto e all'uscita non viene dato alcun rinforzo);

    • 2°: un blocco di topi con dose ridotta di rinforzo (viene dato il rinforzo solo qualche volta all'uscita dal labirinto);

    • 3°: un blocco di topi con dose elevata di rinforzo (viene dato il rinforzo quasi tutte le volte che escono dal labirinto).


Analisi della varianza giulio vidotto raffaele cioffi

  • Ciascun blocco, formato da topi della stessa nidiata, deve essere composto di tante unità quanti sono i trattamenti; nel nostro caso tre unità:

    • nessun rinforzo (N),

    • basso rinforzo (B),

    • alto rinforzo (A).

  • Supponendo di ripetere la sperimentazione 4 volte, si ha un totale di 12 prove (3 4), che possono essere distribuite come segue:


Analisi della varianza giulio vidotto raffaele cioffi

L'attribuzione del carattere essere composto di tante unità quanti sono i trattamenti; nel nostro caso tre unità:N, B, A, a ciascun blocco deve essere fatta a caso, ad esempio ricorrendo alle tavole dei numeri casuali.


Analisi della varianza giulio vidotto raffaele cioffi

  • Evitando di entrare in ulteriori dettagli, concludiamo questo paragrafò rilevando che questo piano degli esperimenti consente di studiare contemporaneamente f l'azione di due sorgenti di variazione: i trattamenti e il blocco.

  • È chiaro che allo sperimentatore interessa soprattutto l'azione della variazione proveniente dai trattamenti; per questo motivo ha tutto l'interesse di ridurre la varianza residua, cioè quella che va al denominatore di F, rendendo simili i blocchi quanto possibile. In questo modo ottiene una maggiore precisione nella ricerca.


Quadrato latino
Quadrato Latino questo paragrafò rilevando che questo piano degli esperimenti consente di studiare contemporaneamente f l'azione di due sorgenti di variazione: i trattamenti e il blocco.

  • Finora abbiamo visto l'analisi della varianza nel caso di uno e di due criteri .di classificazione.

  • In teoria non vi è nulla che impedisca di effettuare l'analisi della varianza anche in quei casi in cui esistono ulteriori variabili.


Analisi della varianza giulio vidotto raffaele cioffi

  • In pratica però, le difficoltà per mettere a punto un'analisi della varianza con più di due fattori sono notevoli, in quanto non è facile trovare lo stesso numero di casi per tutte le sotto-classi.

  • Se si verifica questa situazione, si può rappresentarla con una t quadrata, di tipo particolare, chiamata “ quadrato latino ”.

  • Si supponga di dover confrontare n trattamenti, ciascuno ripetuto n volterà quanto si è detto precedentemente, occorrono n unità da disporre in un quadrato di n righe ed n colonne.


Analisi della varianza giulio vidotto raffaele cioffi

  • Ciascuna casella, infatti, deve contenere una lettera un'analisi della varianza con più di due fattori sono notevoli, in quanto non è facile trovare lo stesso numero di casi per tutte le sotto-classi.(A, B, C, D,...) che deve comparire una sola volta in ciascuna riga e in ciascuna colonna.

  • In questo modo si evita che delle componenti sistematiche interagiscano sullo schema.

  • Nel caso di n = 4, si possono avere 756 diverse disposizioni a quadrato latino, simili a quelle riportate nella figura sottostante:


Analisi della varianza giulio vidotto raffaele cioffi

  • Ciascuna lettera un'analisi della varianza con più di due fattori sono notevoli, in quanto non è facile trovare lo stesso numero di casi per tutte le sotto-classi.(A, B, C,...) rappresenta una diversa condizione sperimentale e ciascuna riga si riferisce a un diverso soggetto.

  • In tal modo, il quadrato latino ora rapresentato serve per quattro soggetti, ciascuno dei quali viene sottoposto a quattro diverse situazioni sperimentali, in ciascuna delle possibili posizioni: una volta primo, una volta secondo, ecc.

  • L'efficacia di ciascun trattamento può essere calcolata misurando l'influenza media sui soggetti che sono stati sottoposti al trattamento.


Analisi della varianza giulio vidotto raffaele cioffi


Scissione delle devianze
Scissione delle devianze. considerato affetto da 3 indici

  • Partendo dalla identità:

dove


Elevando al quadrato e sommando si ha
elevando al quadrato e sommando, si ha: considerato affetto da 3 indici

Dtot = Dc + Dr + Dt + Dres


Analisi della varianza giulio vidotto raffaele cioffi

  • da cui la regola che dice che in uno schema a quadrato latino, “ la devianza totale è scindibile nella somma di quattro devianze elementari, dovute rispettivamente all'azione delle colonne, delle righe, dei trattamenti e del residuo ”.

  • La scissione dei g.d.1. delle colonne, righe e trattamenti sono uguali tra loro ed uguali ad n2 - 1 perché si basano su n osservazioni:

    vc = vr = vt = n - 1


Analisi della varianza giulio vidotto raffaele cioffi

  • I latino, “ la devianza totale è scindibile nella somma di quattro devianze elementari, dovute rispettivamente all'azione delle colonne, delle righe, dei trattamenti e del residuo ”.g.d.l. del residuo di solito vengono calcolati per differenza.

  • I g.d.l. totali sono n2 - 1, e quindi:

    vres = (n2 - 1) - 3 (n - 1) = (n - 1) (n + 1 - 3 (n - 1) = (n - 1) (n + 1 - 3) = (n - 1) (n - 2)

  • ossia:

    vres = (n - 1) (n - 2)


Rapportando ciascuna devianza ai corrispondenti g d 1 si ottengono le seguenti quattro varianze
Rapportando ciascuna devianza ai corrispondenti latino, “ la devianza totale è scindibile nella somma di quattro devianze elementari, dovute rispettivamente all'azione delle colonne, delle righe, dei trattamenti e del residuo ”.g.d.1., si ottengono le seguenti quattro varianze:


Analisi della varianza giulio vidotto raffaele cioffi


Analisi della varianza giulio vidotto raffaele cioffi

  • Tutti questi rapporti tra varianze hanno come ricorrere, come di consueto, al g.d.l. per numeratore (n - 1) e per denominatore (n - 1) (n - 2).

  • Il confronto tra valori calcolati e quelli critici, ricavati dalla tavole F (5% o 1%), consente di mettere in evidenza l'eventuale significatività delle tre cause in gioco.


Analisi della varianza giulio vidotto raffaele cioffi

  • La economicità è uno dei principali vantaggi del disegno a quadrato latino. In esso, infatti, tutti i soggetti vengono sottoposti singolarmente a ciascun trattamento.

  • Non vengono, cioè, suddivisi in gruppi.

  • Questo fatto consente di controllare l'effetto esercitato sui soggetti dall'ordine in cui vengono esposti ai diversi trattamenti.