1 / 38

TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ

TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ. PREDNÁŠKA 5. testovanie štatistických hypotéz: základná terminológia chyba I. a II. druhu všeobecný postup testovania testy hypotéz o strednej hodnote test zhody strednej hodnoty so známou konštantou test zhody dvoch stredných hodnôt – nezávislé výbery

harry
Download Presentation

TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ

  2. PREDNÁŠKA 5 • testovanie štatistických hypotéz: • základná terminológia • chyba I. a II. druhu • všeobecný postup testovania • testy hypotéz o strednej hodnote • test zhody strednej hodnoty so známou konštantou • test zhody dvoch stredných hodnôt – nezávislé výbery • test zhody dvoch stredných hodnôt – závislé výbery • testy hypotéz o rozptyle • test zhody rozptylu so známou konštantou • test zhody dvoch rozptylov

  3. Testovanie štatistických hypotéz • vychádzame z toho, že parametre ZS nie sú známe • môžeme však o nich vysloviť určité predpoklady • predpoklady overujeme štatistickými metódami, ktoré nazývame štatistické hypotézy • postup = testovanie štatistických hypotéz

  4. Testovanie štatistických hypotéz • vychádzame zo základnej hypotézy = H0 hypotéza • oproti nej je postavená alternatívna hypotézaH1 • cieľom testovanie hypotéz je rozhodnutie o prijatí alebo zamietnutí základnej hypotézy • ak zamietame základnú hypotézu, potom prijímame alternatívnu hypotézu

  5. Testovanie štatistických hypotéz • štatistická hypotéza môže vyjadrovať predpoklad o rovnosti parametra ZS s ľubovoľnou známou konštantou alebo parametrom iného základného súboru • v tomto prípade hovoríme o H0 hypotéze H0: Q=Q0H0: Q-Q0=0 • také hypotézy, pri ktorých sa predpokladá nerovnosť parametra ZS, sa nazývajú H1 hypotézy

  6. Testovanie štatistických hypotéz • H1 hypotézy môžu byť v rôznych tvaroch: • obojstranná H1: Q¹Q0 • jednostranné: • pravostranná H1: Q>Q0 • ľavostranná H1: Q<Q0

  7. Testovanie štatistických hypotéz • parameter Q, o ktorom máme určitú hypotézu, nepoznáme • odhadujeme ho pomocou výberovej charakteristiky un • un je náhodná premenná, pričom predpokladáme, že poznáme jej rozdelenie

  8. Testovanie štatistických hypotéz • rozhodnutie o zamietnutí, resp. nezamietnutí H0 uskutočňujeme na základe náhodného výberu • nemôžeme ho urobiť s absolútnou presnosťou • existuje určité riziko odhadu • za predpokladu, že platí H0, rovná sa parameter Q predpokladanej veličine Q0 • keďže est Q=un, potom rozdiel D=un-Q0 je len náhodnou chybou spôsobenou náhodným výberom

  9. Testovanie štatistických hypotéz • ak však H0 neplatí, t.j. Q¹Q0, potom sa rozdiel môže skladať z náhodnej chyby a systematickej chyby, ktorá odráža skutočný rozdiel medzi parametrom ZS Q a jeho predpokladanou veľkosťou Q0  = un-Q0=(un-Q)+(Q-Q0) náhodná chyba systematická chyba - rozdiel

  10. Testovanie štatistických hypotéz • v praxi nemožno zistiť, či rozdiel  obsahuje iba náhodnú chybu alebo aj systematickú • ak je však malé, pripisujeme ho iba náhodnosti výberu • ak prekročí určitú veľkosť, predpokladáme, že zahrňuje aj systematickú chybu - rozdiel

  11. Testovanie štatistických hypotéz • rozhodnutie o zamietnutí, resp. nezamietnutí H0 predpokladá znalosť kritickej hodnoty, ktorá rozdiel  rozdelí na dve časti : • pri rozdieloch < ako kritická hodnota, H0 nezamietame • pri rozdieloch  ako kritická hodnota, H0 zamietame • veľkosť  v konkrétnych prípadoch kolíše, je náhodnou veličinou,preto sa snažíme transformovať  na veličinu G, ktorá má známe teoretické rozdelenie (napr. normované normálne, resp. Studentovo či iné rozdelenie)

  12. Testovanie štatistických hypotéz G = f(un,Q) Þ G = f() • pričom funkcia hustoty náhodnej premennej G je f(g) • vychádzame z platnosti H0:Q = Q0 a vypočítame testovaciu charakteristiku g =f(un,Q0) • rozhodnutie o výsledku testu: • môžeme potom nájsť také kritické hodnotyg1 a g2 náhodnej veličiny G, pre ktoré platí: P(g1 G g2) =1-alebo P(g1 Gg2) =

  13. Testovanie štatistických hypotéz • hladiny významnosti  • hladina významnosti  rozdeľuje obor hodnôt veličiny G na obor prijatia a obory zamietnutia H0 f(g) 1-a a/2 a/2 g1 g2 kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0 obor prijatia H0

  14. Testovanie štatistických hypotéz • Závery testov je možné robiť dvomi spôsobmi: • klasický (na základe kritickej hodnoty) • moderný prostredníctvom p hodnoty(p value) P hodnotapredstavuje pravdepodobnosť, že výberová charakteristika nadobudne aspoň takú hodnotu ako je skutočne zistená hodnota (hodnota testovacej charakteristiky) p hodnota = P(U>u) p hodnota = vypočítaná hladina významnosti prakticky: ak p hodnota < hladina významnosti (a), tak H0 zamietame ak p hodnota < 0,05  rozdiel je preukazný ak p hodnota < 0,01  rozdiel je vysokopreukazný

  15. Testovanie štatistických hypotéz • CHYBY PRI TESTOVANÍ: • popri správnom rozhodnutí o výsledku testu: • prijatí správnej hypotézy • zamietnutí nesprávnej hypotézy • môže dôjsť k nesprávnemu rozhodnutiu: • zamietnutí správnej hypotézy – chyby I.druhu • prijatí nesprávnej hypotézy – chyby II. druhu

  16. Skutočnosť pravda nepravda H0: pravda Naše rozhodnutie H1: nepravda Testovanie štatistických hypotéz • 1-a – pravdepodobnosť prijatia správnej hypotézy • a– riziko zamietnutia správnej hypotézy • ak sa znižuje a, znižuje sa vznik chyby I. druhu = rozšíri sa obor prijatia H0 • znižovaním a však rastie riziko vzniku chyby II. druhu – označuje sa ako b • potom 1-b udáva silu testu = pravdepodobnosť zamietnutia H0 v prípade, ak je skutočne nesprávna • v praxi: a=0,05, resp. a=0,01 správne Chyba II. typu Chyba I. typu správne

  17. Testovanie štatistických hypotéz chyba I. a II. druhu - graficky H0 hypotéza H1 hypotéza

  18. rovnosť rozdiely definovanie zber údajov testovanie záver testu Testovanie štatistických hypotéz • všeobecný postup testovania: 1. Formulácia hypotéz • nulová hypotéza H0 - obsahuje definíciu rovnosti • alternatíva hypotéza - je opakom k nulovej hypotéze 2. Definovanie hladiny významnosti • akú pravdepodobnosť sme ochotní akceptovať pre chybu I.typu • väčšinou 0,05 alebo 0,01 4. Voľba testovacieho kritéria • na základe typu testu • jeho výpočet 5.Určenie kritických hodnôt 3. Výberové skúmanie • vytvorenie výberového súboru • výpočet výberových charakteristík 6. Rozhodnutie o výsledku testu • prijatie, resp. zamietnutie H0 • interpretácia

  19. Testy hypotéz o strednej hodnote • test zhody strednej hodnoty so známou konštantou • poznáme s2 • nepoznáme s2 a n>30 • nepoznáme s2 a n£30 • test zhody dvoch stredných hodnôt • nezávislé súbory: • poznáme s21, s22 • nepoznáme s21, s22 a n1,n2>30 • nepoznáme s21, s22 a n1, resp. n2£30 • závislé súbory

  20. Test zhody strednej hodnoty so známou konštantou • Test zhody strednej hodnoty so známou konštantou • nech štatistický znak X má v ZS približne normálne rozdelenie X....N (, 2) • predpokladajme, že stredná hodnota m sa rovná známej konštante m0 • formulácia hypotéz: H0: m = m0 H1: m ¹ m0 • odhadujeme, že est m =

  21. Test zhody strednej hodnoty so známou konštantou • predpokladáme, že poznáme s2 ZS (teoretický predpoklad) • testovacia charakteristika • u má N(0,1)

  22. Test zhody strednej hodnoty so známou konštantou • nepoznáme s2 ZS a rozsah VS >30 • est s2 = s12 • testovacia charakteristika • u má N(0,1)

  23. Test zhody strednej hodnoty so známou konštantou • nepoznáme s2 ZS a rozsah VS £ 30 • est s2 = s12 • testovacia charakteristika • t má t (n-1)rozdelenie (Studentove r.)

  24. Test zhody strednej hodnoty so známou konštantou • rozhodnutie o výsledku testu: f(u) 1-a a/2 a/2 u1-a/2 -u1-a/2 kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0 obor prijatia H0 • ak |uvyp, tvyp| < u1-/2, ta, (n-1)Þ H0 nezamietame • ak | uvyp, tvyp| ³ u1-/2, ta, (n-1)Þ H0 zamietame

  25. Test zhody dvoch stredných hodnôt • Test zhody dvoch stredných hodnôt – nezávislé výbery • predpokladáme, že výberové súbory sú nezávislé: • prvky jedného súboru nemôžu byť zároveň prvkami druhého súboru • prvky sa v danom súbore neopakujú • nech štatistický znak X1v prvom ZS má normálne rozdelenie N(1, 12) • nech štatistický znak X2v druhom ZS má normálne rozdelenie N(2, 22)

  26. Test zhody dvoch stredných hodnôt • predpokladajme, že odhadované stredné hodnoty 1 a 2 sú zhodné • formulácia hypotéz: H0: m1 = m2 ,resp. H0: m1 - m2 = 0 H1: m1 ¹ m2 ,resp. H1: m1 - m2 ¹ 0 • odhadujeme, že: • est m1 = • est m2 =

  27. Test zhody dvoch stredných hodnôt • predpokladáme, že poznáme rozptyly ZS1 a ZS2 (teoretický predpoklad) potom aj • testovacia charakteristika • u má N(0,1)

  28. Test zhody dvoch stredných hodnôt • nepoznáme rozptyly ZS1 a ZS2 a rozsahy VS1 a VS2>30 • est s12 = s112, est s22 = s122 • testovacia charakteristika (po úprave), inak rovnaká ako v prípade a) • u má N(0,1)

  29. Test zhody dvoch stredných hodnôt • nepoznáme rozptyly ZS1 a ZS2 a rozsah VS1 £ 30 alebo rozsah VS2£30 est s12 = s112, est s22 = s122 podmienka: rozptyly porovnávaných základných súborov sa rovnajú testovacia charakteristika: t má t (s.v.)rozdelenie (Studentove r.) stupne voľnosti = n1+n2-2

  30. Test zhody dvoch stredných hodnôt • predpokladajme, že rozptyly základných súborov 12 , 22 nepoznáme, pričom aspoň jeden z výberových súborov má malý rozsah n1 30, alebo n2 30. Nemôžeme však predpokladať zhodu rozptylov(12  22 ) (Overuje sa F-testom).Môžeme použiť približný Behrens-Fischerov test zhody stredných hodnôt pri nehomogénnej variancii.

  31. Test zhody dvoch stredných hodnôt • Test zhody dvoch stredných hodnôt – závislé výbery = párový t-test • predpokladáme, že výberové súbory sú závislé: • skúmanie na tej istej štatistickej jednotke dva krát • prvky sa v daných súboroch opakujú • rozsahy výberových súborov sa musia rovnať

  32. Test zhody dvoch stredných hodnôt • test je založený na diferencii di=xi1-xi2 • formulácia hypotéz: H0: m1 = m2 ,resp. H0: md= 0 H1: m1 ¹ m2 ,resp. H1: md ¹ 0 • testovacia charakteristika • t má t (n-1)rozdelenie (Studentove r.)

  33. Testy hypotéz o rozptyle • test zhody rozptylu so známou konštantou • test zhody dvoch rozptylov

  34. Test zhody rozptylu so známou konštantou • Test zhody rozptylu so známou konštantou • nech štatistický znak X má v ZS približne normálne rozdelenie X....N (, 2) • predpokladajme, že rozptyl s2 sa rovná známej konštante s02 • formulácia hypotéz: H0: s2 = s02 H1: s2 ¹ s02 • odhadujeme, že est s2 = s12

  35. Test zhody rozptylu so známou konštantou • testovacia charakteristika • c2 má c2(n-1)rozdelenie (chí kvadrát r.) • Záver testu: • ak c2>c21-a/2Ù c2<c2a/2ÞH0 nezamietame • ak c2£c21-a/2Ú c2³c2a/2ÞH0 zamietame f(2) /2 1 -  /2 obor prijatia H0 OZ OZ 21-/2 2/2

  36. Test zhody dvoch rozptylov • Test zhody dvoch rozptylov • nech štatistický znak X1v prvom ZS má normálne rozdelenie N(1, 12) • nech štatistický znak X2v druhom ZS má normálne rozdelenie N(2, 22) • predpokladajme, že odhadované rozptyly s12 a s22sú zhodné • formulácia hypotéz: H0: s12 = s12 H1: s12> s12(jednostranný test) • odhadujeme, že: est s12 = s112 a est s22 = s122

  37. 1 -  obor prijatia H0 OZ Fa,(n1-1),(n2-1) Test zhody dvoch rozptylov • testovacia charakteristika • F má Fa,(n1-1),(n2-1)rozdelenie (Fischerove r.) f(F) • Záver testu: • ak F< Fa,(n1-1),(n2-1)ÞH0 nezamietame • ak F³Fa,(n1-1),(n2-1)ÞH0 zamietame

  38. ĎAKUJEM ZA POZORNOSŤ

More Related