1 / 48

Statistika a výpočetní technika vfu.cz/stat Doc.RNDr.Iveta Bedáňová, Ph.D.

Statistika a výpočetní technika www.vfu.cz/stat Doc.RNDr.Iveta Bedáňová, Ph.D. Biostatistika - sleduje biologické vlastnosti živých jedinců na základě vybraných statistických znaků. znaky zpravidla nabývají číselných hodnot  více-méně kvantifikují sledovanou vlastnost.

geneva
Download Presentation

Statistika a výpočetní technika vfu.cz/stat Doc.RNDr.Iveta Bedáňová, Ph.D.

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statistika a výpočetní technika www.vfu.cz/stat Doc.RNDr.Iveta Bedáňová, Ph.D.

  2. Biostatistika - sleduje biologické vlastnosti živých jedinců na základě vybraných statistických znaků • znaky zpravidla nabývají číselných hodnot  více-méně kvantifikují sledovanou vlastnost

  3. Statistické znaky Kvalitativní (nominální)– pouze 2 stavy: ano-ne, (ne)přítomnost znaku Kvantitativní: • ordinální– vzestupné (sestupné) uspořádání intenzity (subjektivní měřítko) • kardinální– přesná číselná hodnota(objektivní měřítko, přístroj) Z formálního hlediska:diskrétní spojité

  4. Statistický soubor • Výběrový soubor(VS, výběr) – n-omezený počet jedinců(náhodný výběr)  nepřesnost výpočtů • Základní soubor (ZS, populace) – N= • - „všichni“, u nichž se sledovaný znak může vyskytovat

  5. Náhodná veličina - diskrétní - spojitá Variační řada- vzestupně (sestupně) uspořádané hodnoty souboru Např.: 2,3,4,4,5,5,5,6,6,7,7,8 (diskrétní veličina) Četnost varianty - počet opakování stejné hodnoty ve variační řadě Rozdělení četností NV- grafické vyjádření rozložení hodnot v souboru

  6. četnost 3 2 1 Rozdělení četností – diskrétní veličina: 0 1 2 3 4 5 6 7 8 x (počet mláďat) Diskrétní veličina – počet mláďat ve vrhu: 2,3,4,4,5,5,5,6,6,7,7,8

  7. četn. polygon histogram x (hmotnost) střed třídy Rozdělení četností – spojitá veličina:

  8. empirické křivky (VS) teoretická křivka (ZS) Rozdělení četností (pravděpodobností) f(x) - hustota pravděpodobnosti x (hmotnost)

  9. Typy teoretických křivek rozdělení a) normální (Gaussovo) b) neznámé (asymetrické, extrémní, nepravidelné)

  10. Gaussovo normální rozdělení (  - střední hodnota, - směrodatná odchylka)

  11. Podle typu rozdělení(testy normality) metody statistického zpracování Soubory s GNR: parametrické metody Soubory s neznámým r.: neparametrické metody

  12. Popisné charakteristiky statistických souborů

  13. Základní soubor - přesné parametry (nelze empiricky zjistit) Výběrový soubor - výběrové charakteristiky (odhad skutečných parametrů ZS)

  14. A) Střední hodnoty 1) Aritmetický průměr:(ZS), (VS) (střední hodnota) Vlastnosti: - ovlivněn extrémními hodnotami ! ( použití u stejnorodých souborů s pravidelným r. - GNR) -

  15. 2)Medián:(ZS), (VS) = prostřední hodnota variační řady(průměr 2 prostředních) Vlastnosti: - není ovlivněn extrémními hodnotami 50% 50% 50% 50%

  16. B) Míry variability (proměnlivosti souboru) 1) Rozptyl:(ZS), (VS) = průměr čtverců odchylek jednotlivých hodnot xi od aritmetického průměru souboru „Odhad rozptylu“

  17. 2) Směrodatná odchylka:(ZS),(VS) (SD – Standard Deviation) = odmocnina z rozptylu stejný rozměr jako měřená veličina 3) Variační koeficient: (relativní směrodatná odchylka) není závislý na absolutních hodnotách znaku

  18. Testování hypotéz Využití: vyhodnocování experimentů VS  platnost hypotézy o ZS

  19. Parametrické testy– pro soubory s GNR, hypotéza o  a . Výpočty vycházejí z odhadů těchto parametrů u VS. Neparametrické testy– pro soubory s neznámým rozdělením, hypotéza o shodě rozdělení. Výpočty vycházejí z pořadí hodnot VS. Hypotéza nulová (testovaná) - H0:  = konst. 1= 2 12 = 22 Hypotéza alternativní - H1: popírá platnost H0

  20. (Vyhodnocení experimentů: Pokus x Kontrola ) • Testovací kritérium: • Např.: t– Studentův t-test (průměry) H0: 1=2 • F– Fisherův F-test (rozptyly) H0: 12=22 • 2 – testování rozdílu četností (2- test) Překročení kritické hodnoty(tab.)  zamítáme nulovou hypotézu (statisticky významný rozdíl mezi testovanými parametry) Hladina významnosti testu: zvolená chyba =0,05 (0,01)

  21.  = 0,05 - hladina významnosti testu (0,01)

  22. Parametrické testy (GNR: ,) F-test- rozdíl 2 rozptylů t- test- rozdíl 2 průměrů

  23. F-test (H0: 12=22) - vliv pokusného zásahu na rozptýlení hodnot sledované veličiny 1.VS : n1, s12 2.VS : n2, s22 Testovací krirérium: Je-li vypočítané F > Fkrit.  12  22 (významný rozdíl rozptylů- pokusný zásahbyl účinný) Je-li vypočítané F  Fkrit.  12= 22 (nevýznamný rozdíl rozptylů - pokusný zásahbyl neúčinný)

  24. Studentův t-test (testování rozdílu 2 středních hodnot) I.Porovnání ZS x VS(jednovýběrový t-test) - použití v pokusech, kdy známe  u ZS (např. fyziol. hodnoty biochem. ukazatelů)= konst. - testujeme hypotézu, že pokusný VS pochází z populace stouto  (H0:  = konst.) Experiment: VS (n) – aplikace pokusného zásahu XZS – známe 

  25. Testovací kritérium t: • Je-li t  tkrit.  statisticky nevýznamnýrozdíl při zvolené  (p>0,05) H0 platí(pokusný zásah bylneúčinný- VS pochází ze ZS se =konst.) • Je-li t >tkrit.  statisticky významný rozdíl (při = 0,05) (p<0,05) • vysoce významný rozdíl (při = 0,01) (p<0,01) • H0 neplatí (pokusný zásah bylúčinný, způsobil změnu konst.)

  26. Nevýznamný rozdíl (-): p>0,05 Významný rozdíl (+): p<0,05 Vysoce významný rozdíl (++): p<0,01

  27. Příklad V chovu koní je střední hladina glukózy krevního séra  = 3.1mmoll-1. Koním byl aplikován v krmivu  energetický přípravek a byl zjišťován jeho účinek na hladinu glukozy krevního séra koní: v odebrané krvi u 10 náhodně vybraných jedinců byla stanovena hladina glukozy kr.séra v mmoll-1: 3.1, 2.7, 3.3, 3.1, 3.1, 3.2, 3.0, 2.8, 2.9, 2.7. Měl přípravek vliv na hladinu glukózy krevního séra  koní?

  28. H0: =3.1 Výběr: Testovací kritérium: tkrit.(0.05;9) = 2.262 t < tkrit.statisticky nevýznamný rozdíl (H0 platí; výběrový soubor pochází z populace se =3.1). Závěr: Aplikace přípravku neměla vliv na hladinu glukózy v krevním séru [P>0.05].

  29. II.Porovnání VS x VS(dvojvýběrový t-test) • Párový pokus • - u 1 VS provedena 2 měření: před Ppo P č. xixi´rozdíly 1.x1x1´x1-x1´ 2.x2x2´x2-x2´ ….. i. xixi´xi-xi´ ….. n. xnxn´xn-xn´ páry

  30. Testujeme hypotézu, že  měření před pokusem a po pokuse se rovnají Testovací kritérium t: • Je-li t  tkrit.  statisticky nevýznamnýrozdíl, H0 platí (p>0,05) • Je-li t  tkrit.  statisticky významnýrozdíl (při = 0,05) (p<0,05) •  stat.vysoce významný rozdíl (při = 0,01) (p<0,01) • H0 neplatí (pokusný zásah byl účinný - způsobil změnu střední hodnoty 2.měření oproti 1.měř.)

  31. Příklad: Zjistěte, zda režim s fyzickou zátěží způsobí změnu hmotnosti u lab.potkanů poté, co byli režimu podrobeni. Změny hmotnosti u 12 pokusných jedinců (váha po zátěži – váha před zátěží) v g:0.2, -0.5, -1.3, -1.6, -0.7, 0.4, -0.1, 0.0, -0.6, -1.1, -1.2, -0.8.

  32. H0: rozd.=0 Testovací kritérium: Rozdíly: tkrit.(0.05;11)=2.201 tkrit.(0.01;11)=3.106 t > tkrit.(0.01) H0neplatí: statisticky vysoce významný rozdíl Závěr: Režim s fyzickou zátěží způsobí vysoce významnou ztrátu hmotnosti u lab.potkanů [P<0.01].

  33. 2)Nepárový pokus -porovnání 2 různých VS: 1.VS x 2.VS Pokusný Kontrolní - testujeme hypotézuH0: 1 =2 1.VS (n1) : vypočteme 2.VS (n2) : vypočteme

  34. Soubory mohou mít stejný nebo různý rozptyl ovlivňuje provedení t-testu. • Podle výsledku F-testu: • Je-li FFkrit. a) 12=22 • Je-li FFkrit. b) 12  22

  35. a) 12=22 : b) 12 22 : Pro n1=n2=n:

  36. Je-li t  tkrit.  statistickynevýznamný rozdíl mezi 1 a 2 (p>0,05) • H0: 1=2 platí, pokusný zásah byl neúčinný • Je-li t  tkrit  statistickyvýznamnýrozdíl (při = 0,05)(p<0,05) •  stat. vysoce významnýrozdíl (při = 0,01)(p<0,01) • H0 neplatí, pokusný zásah byl účinný – způsobil změnu střední hodnoty(1 2 )

  37. Příklad: Zjistěte vliv trasportního stresu u brojlerů na celkový počet leukocytů v krvi. Z trasportu bylo náhodně vybráno 7 brojlerů (pokusná skup.), kontrolní skupina (n=7) přepravována nebyla. Po hematologickém vyšetření byly zjištěny následující hodnoty počtu Leu (G/l): Pokusná sk. (P): 9.9, 9.0, 11.1, 9.6, 8.7, 10.4, 9.5. Kontrolní sk. (K): 8.8, 8.4, 7.9, 8.7, 9.1, 9.6, 8.7.

  38. H0: 1 =2 Pokus: Kontrola: F<Fkrit.12=22(5.820)

  39. H0: 1 =2 Pokus: Kontrola: F<Fkrit.12=22(5.820) Testovací kritérium t: =(7-1).2=12 tkrit.(0.05;12)=2.179 tkrit.(0.01;12)=3.055 t > tkrit.(0.01) H0: 1=2 neplatí (na hladině =0.01). Závěr : Transport brojlerů způsobil statisticky vysoce významné zvýšení počtu leukocytů v krvi. [P<0.01]

  40. Neparametrické testy

  41. Charakteristika • Pro soubory sneznámýmrozdělením • Hypotéza: shoda rozdělení četností (tvar křivky) • Výpočty: z pořadových čísel naměřených hodnot souboru - „pořadové testy“ • (i pro ordinální znaky, nevyžadují přesné hodnoty) • Jednodušší výpočet, ale nižší přesnost a spolehlivost (síla testu) • Obecnější použití (i pro data s GNR – orientační hodnocení předběžných pokusů)

  42. Př: byl sledován vliv vit.B12 na zvyšování hmotnosti u selat – zjistěte účinnost : (A – standardní krmná směs, B – přídavek vit. B12)

  43. Pozn.: při výpočtu testovacího kritéria jde o dosažení minima Závěr: vitamín B12 zvyšuje statisticky vysoce významně hmotnostní přírůstky u selat.

  44. Wilcoxonův test (párový pokus: 2 měření 1VS) před P (X):x1, x2, x3, x4, x5, x6, ..………….xn po P (X´): x1´, x2´, x3´, x4´, x5´, x6´ ….………..xn´ rozdíly X-X´:+z1, -z2, +z3, -z4, -z5, +z6 ….…0…….zn seřazení:+z3< +z1<-z5< -z4 <+z6 <-z2 ………. pořadí:1. 2. 3. 4. 5. 6. …….…n. (průměrné pořadí u stejných rozdílů)

  45. V případě platnosti H0: (ideálně: všechny rozdíly =0) rozdíly jsou rozloženy symetricky kolem 0 (stejný počet + a – rozdílů). W+-  pořadových čísel kladných rozdílů W--  pořadových čísel záporných rozdílů Je-li W  W(, n)  zamítáme H0 o shodnosti rozdělení veličiny X a X´ (pokusný zásah byl účinný – hodnoty před pokusem a po pokusu se liší) Je-li W  W(, n)  platí H0 o shodnosti rozdělení veličiny X a X´ (pokusný zásah byl neúčinný – hodnoty před pokusem a po pokusu se neliší)

  46. Př: zhodnoťte výsledky testu bakteriální kontaminace po ošetření 2 preparáty (A, B) (1.polovina každého vzorku byla ošetřena preparátem A, 2.polovina prep.B). Zjistěte rozdíl v účinnosti : Závěr: preparát B má statisticky významně vyšší antibakteriální účinnost.

More Related