480 likes | 704 Views
Statistika a výpočetní technika www.vfu.cz/stat Doc.RNDr.Iveta Bedáňová, Ph.D. Biostatistika - sleduje biologické vlastnosti živých jedinců na základě vybraných statistických znaků. znaky zpravidla nabývají číselných hodnot více-méně kvantifikují sledovanou vlastnost.
E N D
Statistika a výpočetní technika www.vfu.cz/stat Doc.RNDr.Iveta Bedáňová, Ph.D.
Biostatistika - sleduje biologické vlastnosti živých jedinců na základě vybraných statistických znaků • znaky zpravidla nabývají číselných hodnot více-méně kvantifikují sledovanou vlastnost
Statistické znaky Kvalitativní (nominální)– pouze 2 stavy: ano-ne, (ne)přítomnost znaku Kvantitativní: • ordinální– vzestupné (sestupné) uspořádání intenzity (subjektivní měřítko) • kardinální– přesná číselná hodnota(objektivní měřítko, přístroj) Z formálního hlediska:diskrétní spojité
Statistický soubor • Výběrový soubor(VS, výběr) – n-omezený počet jedinců(náhodný výběr) nepřesnost výpočtů • Základní soubor (ZS, populace) – N= • - „všichni“, u nichž se sledovaný znak může vyskytovat
Náhodná veličina - diskrétní - spojitá Variační řada- vzestupně (sestupně) uspořádané hodnoty souboru Např.: 2,3,4,4,5,5,5,6,6,7,7,8 (diskrétní veličina) Četnost varianty - počet opakování stejné hodnoty ve variační řadě Rozdělení četností NV- grafické vyjádření rozložení hodnot v souboru
četnost 3 2 1 Rozdělení četností – diskrétní veličina: 0 1 2 3 4 5 6 7 8 x (počet mláďat) Diskrétní veličina – počet mláďat ve vrhu: 2,3,4,4,5,5,5,6,6,7,7,8
četn. polygon histogram x (hmotnost) střed třídy Rozdělení četností – spojitá veličina:
empirické křivky (VS) teoretická křivka (ZS) Rozdělení četností (pravděpodobností) f(x) - hustota pravděpodobnosti x (hmotnost)
Typy teoretických křivek rozdělení a) normální (Gaussovo) b) neznámé (asymetrické, extrémní, nepravidelné)
Gaussovo normální rozdělení ( - střední hodnota, - směrodatná odchylka)
Podle typu rozdělení(testy normality) metody statistického zpracování Soubory s GNR: parametrické metody Soubory s neznámým r.: neparametrické metody
Popisné charakteristiky statistických souborů
Základní soubor - přesné parametry (nelze empiricky zjistit) Výběrový soubor - výběrové charakteristiky (odhad skutečných parametrů ZS)
A) Střední hodnoty 1) Aritmetický průměr:(ZS), (VS) (střední hodnota) Vlastnosti: - ovlivněn extrémními hodnotami ! ( použití u stejnorodých souborů s pravidelným r. - GNR) -
2)Medián:(ZS), (VS) = prostřední hodnota variační řady(průměr 2 prostředních) Vlastnosti: - není ovlivněn extrémními hodnotami 50% 50% 50% 50%
B) Míry variability (proměnlivosti souboru) 1) Rozptyl:(ZS), (VS) = průměr čtverců odchylek jednotlivých hodnot xi od aritmetického průměru souboru „Odhad rozptylu“
2) Směrodatná odchylka:(ZS),(VS) (SD – Standard Deviation) = odmocnina z rozptylu stejný rozměr jako měřená veličina 3) Variační koeficient: (relativní směrodatná odchylka) není závislý na absolutních hodnotách znaku
Testování hypotéz Využití: vyhodnocování experimentů VS platnost hypotézy o ZS
Parametrické testy– pro soubory s GNR, hypotéza o a . Výpočty vycházejí z odhadů těchto parametrů u VS. Neparametrické testy– pro soubory s neznámým rozdělením, hypotéza o shodě rozdělení. Výpočty vycházejí z pořadí hodnot VS. Hypotéza nulová (testovaná) - H0: = konst. 1= 2 12 = 22 Hypotéza alternativní - H1: popírá platnost H0
(Vyhodnocení experimentů: Pokus x Kontrola ) • Testovací kritérium: • Např.: t– Studentův t-test (průměry) H0: 1=2 • F– Fisherův F-test (rozptyly) H0: 12=22 • 2 – testování rozdílu četností (2- test) Překročení kritické hodnoty(tab.) zamítáme nulovou hypotézu (statisticky významný rozdíl mezi testovanými parametry) Hladina významnosti testu: zvolená chyba =0,05 (0,01)
Parametrické testy (GNR: ,) F-test- rozdíl 2 rozptylů t- test- rozdíl 2 průměrů
F-test (H0: 12=22) - vliv pokusného zásahu na rozptýlení hodnot sledované veličiny 1.VS : n1, s12 2.VS : n2, s22 Testovací krirérium: Je-li vypočítané F > Fkrit. 12 22 (významný rozdíl rozptylů- pokusný zásahbyl účinný) Je-li vypočítané F Fkrit. 12= 22 (nevýznamný rozdíl rozptylů - pokusný zásahbyl neúčinný)
Studentův t-test (testování rozdílu 2 středních hodnot) I.Porovnání ZS x VS(jednovýběrový t-test) - použití v pokusech, kdy známe u ZS (např. fyziol. hodnoty biochem. ukazatelů)= konst. - testujeme hypotézu, že pokusný VS pochází z populace stouto (H0: = konst.) Experiment: VS (n) – aplikace pokusného zásahu XZS – známe
Testovací kritérium t: • Je-li t tkrit. statisticky nevýznamnýrozdíl při zvolené (p>0,05) H0 platí(pokusný zásah bylneúčinný- VS pochází ze ZS se =konst.) • Je-li t >tkrit. statisticky významný rozdíl (při = 0,05) (p<0,05) • vysoce významný rozdíl (při = 0,01) (p<0,01) • H0 neplatí (pokusný zásah bylúčinný, způsobil změnu konst.)
Nevýznamný rozdíl (-): p>0,05 Významný rozdíl (+): p<0,05 Vysoce významný rozdíl (++): p<0,01
Příklad V chovu koní je střední hladina glukózy krevního séra = 3.1mmoll-1. Koním byl aplikován v krmivu energetický přípravek a byl zjišťován jeho účinek na hladinu glukozy krevního séra koní: v odebrané krvi u 10 náhodně vybraných jedinců byla stanovena hladina glukozy kr.séra v mmoll-1: 3.1, 2.7, 3.3, 3.1, 3.1, 3.2, 3.0, 2.8, 2.9, 2.7. Měl přípravek vliv na hladinu glukózy krevního séra koní?
H0: =3.1 Výběr: Testovací kritérium: tkrit.(0.05;9) = 2.262 t < tkrit.statisticky nevýznamný rozdíl (H0 platí; výběrový soubor pochází z populace se =3.1). Závěr: Aplikace přípravku neměla vliv na hladinu glukózy v krevním séru [P>0.05].
II.Porovnání VS x VS(dvojvýběrový t-test) • Párový pokus • - u 1 VS provedena 2 měření: před Ppo P č. xixi´rozdíly 1.x1x1´x1-x1´ 2.x2x2´x2-x2´ ….. i. xixi´xi-xi´ ….. n. xnxn´xn-xn´ páry
Testujeme hypotézu, že měření před pokusem a po pokuse se rovnají Testovací kritérium t: • Je-li t tkrit. statisticky nevýznamnýrozdíl, H0 platí (p>0,05) • Je-li t tkrit. statisticky významnýrozdíl (při = 0,05) (p<0,05) • stat.vysoce významný rozdíl (při = 0,01) (p<0,01) • H0 neplatí (pokusný zásah byl účinný - způsobil změnu střední hodnoty 2.měření oproti 1.měř.)
Příklad: Zjistěte, zda režim s fyzickou zátěží způsobí změnu hmotnosti u lab.potkanů poté, co byli režimu podrobeni. Změny hmotnosti u 12 pokusných jedinců (váha po zátěži – váha před zátěží) v g:0.2, -0.5, -1.3, -1.6, -0.7, 0.4, -0.1, 0.0, -0.6, -1.1, -1.2, -0.8.
H0: rozd.=0 Testovací kritérium: Rozdíly: tkrit.(0.05;11)=2.201 tkrit.(0.01;11)=3.106 t > tkrit.(0.01) H0neplatí: statisticky vysoce významný rozdíl Závěr: Režim s fyzickou zátěží způsobí vysoce významnou ztrátu hmotnosti u lab.potkanů [P<0.01].
2)Nepárový pokus -porovnání 2 různých VS: 1.VS x 2.VS Pokusný Kontrolní - testujeme hypotézuH0: 1 =2 1.VS (n1) : vypočteme 2.VS (n2) : vypočteme
Soubory mohou mít stejný nebo různý rozptyl ovlivňuje provedení t-testu. • Podle výsledku F-testu: • Je-li FFkrit. a) 12=22 • Je-li FFkrit. b) 12 22
a) 12=22 : b) 12 22 : Pro n1=n2=n:
Je-li t tkrit. statistickynevýznamný rozdíl mezi 1 a 2 (p>0,05) • H0: 1=2 platí, pokusný zásah byl neúčinný • Je-li t tkrit statistickyvýznamnýrozdíl (při = 0,05)(p<0,05) • stat. vysoce významnýrozdíl (při = 0,01)(p<0,01) • H0 neplatí, pokusný zásah byl účinný – způsobil změnu střední hodnoty(1 2 )
Příklad: Zjistěte vliv trasportního stresu u brojlerů na celkový počet leukocytů v krvi. Z trasportu bylo náhodně vybráno 7 brojlerů (pokusná skup.), kontrolní skupina (n=7) přepravována nebyla. Po hematologickém vyšetření byly zjištěny následující hodnoty počtu Leu (G/l): Pokusná sk. (P): 9.9, 9.0, 11.1, 9.6, 8.7, 10.4, 9.5. Kontrolní sk. (K): 8.8, 8.4, 7.9, 8.7, 9.1, 9.6, 8.7.
H0: 1 =2 Pokus: Kontrola: F<Fkrit.12=22(5.820)
H0: 1 =2 Pokus: Kontrola: F<Fkrit.12=22(5.820) Testovací kritérium t: =(7-1).2=12 tkrit.(0.05;12)=2.179 tkrit.(0.01;12)=3.055 t > tkrit.(0.01) H0: 1=2 neplatí (na hladině =0.01). Závěr : Transport brojlerů způsobil statisticky vysoce významné zvýšení počtu leukocytů v krvi. [P<0.01]
Charakteristika • Pro soubory sneznámýmrozdělením • Hypotéza: shoda rozdělení četností (tvar křivky) • Výpočty: z pořadových čísel naměřených hodnot souboru - „pořadové testy“ • (i pro ordinální znaky, nevyžadují přesné hodnoty) • Jednodušší výpočet, ale nižší přesnost a spolehlivost (síla testu) • Obecnější použití (i pro data s GNR – orientační hodnocení předběžných pokusů)
Př: byl sledován vliv vit.B12 na zvyšování hmotnosti u selat – zjistěte účinnost : (A – standardní krmná směs, B – přídavek vit. B12)
Pozn.: při výpočtu testovacího kritéria jde o dosažení minima Závěr: vitamín B12 zvyšuje statisticky vysoce významně hmotnostní přírůstky u selat.
Wilcoxonův test (párový pokus: 2 měření 1VS) před P (X):x1, x2, x3, x4, x5, x6, ..………….xn po P (X´): x1´, x2´, x3´, x4´, x5´, x6´ ….………..xn´ rozdíly X-X´:+z1, -z2, +z3, -z4, -z5, +z6 ….…0…….zn seřazení:+z3< +z1<-z5< -z4 <+z6 <-z2 ………. pořadí:1. 2. 3. 4. 5. 6. …….…n. (průměrné pořadí u stejných rozdílů)
V případě platnosti H0: (ideálně: všechny rozdíly =0) rozdíly jsou rozloženy symetricky kolem 0 (stejný počet + a – rozdílů). W+- pořadových čísel kladných rozdílů W-- pořadových čísel záporných rozdílů Je-li W W(, n) zamítáme H0 o shodnosti rozdělení veličiny X a X´ (pokusný zásah byl účinný – hodnoty před pokusem a po pokusu se liší) Je-li W W(, n) platí H0 o shodnosti rozdělení veličiny X a X´ (pokusný zásah byl neúčinný – hodnoty před pokusem a po pokusu se neliší)
Př: zhodnoťte výsledky testu bakteriální kontaminace po ošetření 2 preparáty (A, B) (1.polovina každého vzorku byla ošetřena preparátem A, 2.polovina prep.B). Zjistěte rozdíl v účinnosti : Závěr: preparát B má statisticky významně vyšší antibakteriální účinnost.