1 / 28

Faktory a jejich uspořádání

Faktory a jejich uspořádání. Faktor (kvalitativní proměnná) factor (= categorial variable = categorical v. ) Hladina faktoru factor level Máme-li dva nebo více faktorů, záleží správná volba modelu ANOVA na jejich vzájemném vztahu (uspořádání, design )

nicki
Download Presentation

Faktory a jejich uspořádání

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Faktory a jejich uspořádání • Faktor (kvalitativní proměnná)factor (= categorial variable = categorical v.) • Hladina faktorufactor level • Máme-li dva nebo více faktorů, záleží správná volba modelu ANOVA na jejich vzájemném vztahu (uspořádání, design) • Faktoriální (factorial design) x hierarchické (nested = hierarchical design)

  2. Faktoriální uspořádání • Každá hladina určitého faktoru je kombinována s každou hladinou ostatních faktorů • Mají-li naše faktory jen 2 hladiny, pakpři 2 faktorech máme 4 kombinacepři 3 faktorech máme 8 kombinací ... • Obecně, mají-li faktory A, B, C,... a, b, c,... hladin, pak je počet kombinací a*b*c*...

  3. Hierarchické uspořádání • tři lokality • na každé lokalitě tři kytky • na každé pět měření Faktor Kytka je vložen do faktoru Lokalita(Kytka is nested in Lokalita) Kytka 1 (kyt1) z první lokality nemá nicspolečného s kytkou 1 z druhé lokality

  4. Faktoriální uspořádání: vyváženost • Je nejlepší, pokud máme pro každou kombinaci hladin faktorů stejný počet pozorování, dostáváme pak nejsilnějšía nejvíce robustní test • Přinejmenším bychom ale měli mít proporční uspořádání

  5. Dvoucestná ANOVAbez interakce • Nejprve začneme s modelem, ve kterém předpokládáme, že vlivy hnojení a kosení jsou aditivní: Xijk = m+ ai + bj + eijk • m je celkový (společný) průměr (např. 22.5) • a je vliv kosení (např. a1=-5.0, a2=+5.0) • b je vliv hnojení (např. b1=+2.5, b2=-2.5) • e je náhodná variabilita, nezávislá na hodnotách faktorů

  6. Dvoucestná ANOVAbez interakce • Aditivitu faktorů často nemůžeme předpokládat a priori, ověřujeme ji použitím neaditivního modelu (s interakcí): test interakčního členu a interaction plot SSTotal=SShnojeno+SSkoseno+SShnojeno*koseno+SSerror H0A: a1=a2=0 hnojení nemá vliv H0B: b1=b2=0 kosení nemá vliv H0AB: g11=g12=g21=g22=0 není interakce

  7. Dvoucestná ANOVA s interakcí • Model bez interakce: Xijk = m+ ai + bj + eijk • Přidáme-li interakci: Xijk = m+ ai + bj + gij + eijk • Interakce mezi faktory je symetrická, a tak nám říká buď: „velikost (případně i směr) vlivu hnojení závisí na tom, zda je plocha kosená nebo ne“ nebo „velikost (případně i směr) vlivu kosení závisí na tom, zda je plocha hnojená nebo ne“ • Speciální případ: “kosení má vliv jen u nehnojených ploch“

  8. Dvoucestná ANOVA s interakcí • Není interakce: • Je interakce: Hlavní efekt (main effect) Je třeba zdůraznit, že spojováníprůměrů tady není interpolací:jde nám o zobrazení interakcepomocí (ne)rovnoběžnosti čar Když popisuji výsledky, nestačí říct,že interakce je průkazná, musím uvéstproč (kde a jaká je odchylka od aditivity)

  9. Méně častý typ interakce • Vliv 2 léků (A a B) na snížení teploty testován faktoriálním experimentem • Hlavní efekt léku A vyšel neprůkazný, hlavní efekt léku B také, ale vyšla průkazná interakce • Interaction plot vypadá takto: Výsledek neznamená,že by léky nebyly účinné! Jejich účinek se přispolečném podání ruší.

  10. F statistika v dvoucestné ANOVAfaktory s pevným efektem • Fhnojeno, Fkoseno, Fhnojeno*koseno jsou všechny počítány dělením příslušného MS hodnotou MSError • Například: Fhnojeno=352.8/8.025 = 43.963 • Není tomu ale tak v případě faktorů s náhodným efektem!

  11. Mnohonásobná porovnání • Ve faktoriální analýze variance (s 2 a více faktory) provádím obdobně jako ve one-way ANOVA • V našem příkladu nemá smysl: máme jen dvě hladiny pro každý z faktorů • Mohu porovnávat buď pro hlavní efekty nebo i pro interakci (tj. všechny faktoriálně vytvořené skupiny mezi sebou) • Co budu porovnávat rozhoduji já (ovšems ohledem na výsledky testu)

  12. F statistika v dvoucestné ANOVAmixed effects (náhodný+pevný) • Zkoumám vliv kosení na druhovou bohatost, máme tři lokality, na každé mám tři kosené a tři nekosené plochy Fkoseno = MSkoseno / MSlokalita*koseno tj. 206.72 / 5.39

  13. Experimentální uspořádání:1 – úplně znáhodněné • Máme experiment se 4 zásahy (K, Z1, Z2, Z3) a se 4 opakováními pro každý typ zásahu (= pro každou hladinu faktoru) • Je-li všech 16 ploch rozmístěno zcela náhodně (completely randomised design), hodnotím jednocestnou analýzou variance

  14. Experimentální uspořádání:2 – zcela nesprávné • Vliv zásahu nelze v datech získanýchz tohoto špatného uspořádání odlišit od vlivu umístění v prostoru • Pojem pseudoreplikace (pseudoreplication)

  15. Experimentální uspořádání:3 – znáhodněné bloky • Randomised blocks, ale pozor, někdy též jako Completely randomised blocks! • Náhodný faktor Blok, two-way ANOVA bez interakce. Silnější test, pokud se bloky liší

  16. Experimentální uspořádání:4 – Latinský čtverec • Latin square • Známe směry prostorové variability a buď je jen jeden (např. vlhkost) nebo jsou kolmé • 3-way ANOVA, náhodné fak. řádek a sloupec

  17. Friedmanův test • Neparametrický test, zobecnění Wilcoxonova testu • Založeno na pořadí hodnot (pro jednotlivé hladiny faktoru) uvnitř bloků a je počet hladin studovaného faktoru b je počet bloků Rije součet hodnot pořadí pro i-tou hladinu

  18. Transformace: problémy s aditivitou 1 • Porovnávám výšky sedmikrásek a slunečnic a jejich odpověď na přidání živin • Faktoriální uspořádání, 2 faktory s pevným efektem a 2 hladinami (druh a živiny) • Tři testovatelné hypotézy (2 hlavní efekty plus interakce): • výška sedmikrásek a slunečnic se neliší • výška rostlin se mění po přidání živin • vliv přidání živin je stejný pro oba druhy

  19. Transformace: problémy s aditivitou 2 • Lze očekávat heterogenitu variancí (hodnoty výšky budou mít asi větší varianci u slunečnic než u sedmikrásek) S.D. bude lineárně závislá na průměru (CV bude konstantní) • Interakce v ANOVA modelu testuje aditivitu, a tedy nárůst výšky díky přidání živin stejný(v cm) u obou druhů – např. 10 cm:

  20. Transformace: problémy s aditivitou 3 • Taková aditivita ale neodpovídá „biologické realitě“ – lze spíše očekávat nárůst proporční, např. o 100% • Odpovídající model pro vliv druhu (slunečnice je 10-krát vyšší než sedmikráska; hnojení zvýší výšku 2-krát) je: • Chceme-li dostat model ANOVA, musíme logaritmovat • Tabulka logaritmů průměrných výšek pak vypadá takto:

  21. Logaritmická transformace • Pokud byla v původních datech S.D. lineárně závislá na průměru, vede k homogenitě var. • Mění multiplikativní efekty na aditivní • Mění lognormální rozdělení e na normální • Problém s nulami: v biologických datech časté (pokryvnost či početnost druhu ve vzorku) • X’ = log(X+c), c by mělo odpovídat škále hodnot X (c=1 vhodné pro počty, procenta) • Přičtení c narušuje převod multiplikativity na aditivitu

  22. Jiné transformace • Předpokládáme-li pro závislou proměnnou Poissonovu distribuci: • Pro procenta a podíly (na škále 0 – 1):

  23. Hierarchické uspořádání(nested design) • tři lokality • na každé lokalitě tři kytky • na každé pět měření • V příkladě je faktor Kytka jasně s náhodným efektem, u faktoru Lokalita si lze představit obě možnosti. Takto vypadají nejčastější případy hierarchické analýzy variance • Vyrovnanost počtu pozorování je i zde velmi důležitá

  24. Hierarchické uspořádánípříklad s délkou trubky 1 1 3 2

  25. Hierarchické uspořádánípříklad s délkou trubky 2 • Při rozkladu sumy čtverců (SS) počítáme čtverce rozdílů každého pozorování (průměru) od jeho hierarchicky nejbližšího vyššího příslušného průměru • Jsou-li hierarchicky nižší efekty náhodné, je F statistikou poměr MS efektu a MS nejbližšího hierarchicky nižšího efektu

  26. Nejčastější použitíhierarchické analýzy variance • Rozklad variability znaků mezi jednotlivé hierarchické úrovně (taxonomické / prostorové) • Často mne zajímá především hierarchicky nejvýše postavený faktor, podřazené faktory umožňují oddělení variability na nižších úrovních  zvýšení síly testu Příklad: vliv pastvy – 6 ohrad: 3 + 3ale v každé 5 ploch (zachytí variabilitu uvnitř ohrad), z každé plochy 3 vzorky pro analýzy (zachytí variabilitu v biomase a v anal. metodě)

  27. Pseudoreplikace ještě jednou • Pozor na směsné vzorky: umožní zprůměrovat „nezajímavou variabilitu“, ale ztrácí se nezávislost pozorování v nich zahrnutých vzorků! Tohle nejsou nezávislápozorování !!

  28. Složitější modely ANOVA • Faktoriálně a hierarchicky uspořádané faktory se mohou různě kombinovat, některé s pevným a některé s náhodným efektem • Split-plot design: whole-plots vs. split-plots • Opakovaná pozorování (repeated measures) • BACI: before-after control-impact

More Related