1 / 11

Analýza variance (ANOVA).

Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno použít ANOVu se stejnými P. U 4 odrůd brambor se zjišťovala celková hmotnost brambor z jednoho trsu: 1.odrůda: 0.9, 0.8, 0.6, 0.9

irisa
Download Presentation

Analýza variance (ANOVA).

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno použít ANOVu se stejnými P. U 4 odrůd brambor se zjišťovala celková hmotnost brambor z jednoho trsu: 1.odrůda: 0.9, 0.8, 0.6, 0.9 2. odrůda: 1.3, 1, 1.3 3. odrůda: 1.3, 1.5, 1.6, 1.1, 1.5 4. odrůda: 1.1, 1.2, 1 Liší se průměrné hmotnosti brambor z 1 trsu u těchto 4 odrůd? H0: m1 = m2 = m3 = m4 H1: některá z rovností neplatí Porovnávání dvojic, tj. 6 t-testů pravděpodobnost chyby 1. druhu se zvyšuje Proto se porovnávání dvojic neprovádí. Model: Xij = m + ai + chyba ij Neboli ANOVA umí odhalit posun celých sloupců hodnot o ai, tedy přičtením/odečtením a1 k mse dostávám od dat 1. druhu k 2. druhu.

  2. Předpoklady. • normalita rozdělení – neověřuje e • homogenita variancí - základní předpoklad – ověřuje se Průměry: Chyby průměru: • 1. odhad variance (variabilita mezi sloupci): • s2 (mezi) = S.E.*n = (0.07*4 + 0.1*3 + 0.089*5 + 0.058*3)/4 =0.029975 2. odhad variance (variabilita uvnitř souboru): s2 (uvnitř) = 0.025 Za platnosti H0 je s2 (mezi)/ s2 (uvnitř) = 1. Proto Analýza variance. Pokud máme a sloupců, v každém ni měření, pak testovací rozdělení je F – rozdělení s (a – 1) a (S (ni) – a) stupni volnosti. Příznivá pro platnost H0 je F = 1.

  3. Pokračování příkladu. F(3, 11) = 9.9733, P = 0.001805  některá z rovností neplatí Patrně se budou lišit odrůdy 1 a 3.

  4. Post – hoc testy: H0: průměr sloupce i = průměr sloupce j, i≠ j H1: nerovnost mezi průměry sloupců i a j. Zodpoví otázku, KDE je rozdíl zjištěný Anovou. Statistica ukazuje rozdíl mezi 1. a 3. odrůdou ve smyslu, že hmotnost trsu 1. odrůdy je nižší, než u 3. odrůdy (P = 0.001182/2 = 0.000591), rozdíl mezi 2. a 3. odrůdou ve smyslu, že hmotnost trsu 1. odrůdy je nižší, než u 3. odrůdy (P = 0.03829/2 = 0.019145). V příkladu jsme měli 1 třídící znak “odrůda“  jednofaktorová ANOVA

  5. Analýza variance vícefaktorová (ANOVA). A. Faktoriální uspořádání. Příklad: Krysy byly krmeny 73 dní čerstvým nebo žluklým tukem. Zajímá nás spotřeba kvality tuku v závislosti na pohlaví krys [g]. Samci spotřebují více než samice Čerstvý tuk je atraktivnější než žluklý. Nulové hypotézy: H01: není rozdíl mezi samci a samicemi H02: není rozdíl mezi čerstvým a žluklým tukem H03: nejsou průkazné interakce. Model:

  6. Spojnice přibližně rovnoběžné “H“ pouze posunuty (přibližně) Interakce neprůkazné

  7. H01 nezamítáme  není statisticky průkazný rozdíl mezi samci a samicemi. H02 zamítáme  je rozdíl ve spotřebě čerstvého tuku a žluklého tuku. H03 nezamítáme  nejsou průkazné interakce. Neprůkazné interakce  model je v pořádku, lze použít Anovu. Průkazné interakce  něco dalšího (další faktor) ovlivňuje měření  nutno zdůvodnit. Post-hoc testy: Pouze pro tuk: čerstvý se spotřebovává více než žluklý. Modifikace příkladu.

  8. Průkazné interakce  přímky nejsou rovnoběžné Samci mají zcela jiné preference než samice, model není aditivní (posun), Něco dalšího vstupuje do pokusu?? Anovu nelze použít. Někdy nelze průkazné interakce odstranit  je nutno zdůvodnit.

  9. B. Hierarchická Anova (Nested design). Připravím 2 akvária: Do prvního dám čerstvý tuk, do druhého žluklý tuk. Do první nádoby vyberu náhodně 6 krys, do druhého náhodně 6 krys. 2. nádoba 1. nádoba 6 krys 6 krys 2 faktory: Krysy - náhodný faktor Tuk - pevný faktor Sestoupili jsme na úroveň jedinců – nejde o rozdíly “samice – samec“, jde o rozdíly mezi jedinci Faktor “krysa“ je vnořen (nested in) do faktoru strava Na toto uspořádání lze pohlížet jako na jednofaktorovou Anovu a krysy se berou jako opakování.

  10. ANOVA – náhodné bloky. Příklad: Na 10 místech jezera byla měřena teplota vody v hloubce 0, 2 a 5 metrů. Liší se teploty v jednotlivých hloubkách? 1. místo 2. místo 3. místo 10. místo 0 m 0 m 0 m 0 m …. 2 m 2 m 2 m 2 m 5 m 5 m 5 m 5 m Náhodné bloky

  11. Každá hloubka je na daném místě měřena jen jednou Jedná se vlastně o 1-faktorovou Anovu s faktorem “hloubka“. 1-faktorová ANOVA: F(2, 27) = 571.23, P = 0 2-faktorová ANOVA: F(2, 18) = 1119.491, P = 0

More Related