210 likes | 355 Views
Correlatietoetsen. Toetsen op afhankelijkheid tussen variabelen waarvan minimaal een van de twee niet ordinaal is: afhankelijkheidstabellen. Vb. afhankelijkheid tussen ‘succeskans ope-ratie’ en ‘chirurg’.
E N D
Correlatietoetsen Toetsen op afhankelijkheid tussen variabelen waarvan minimaal een van de twee niet ordinaal is: afhankelijkheidstabellen. Vb. afhankelijkheid tussen ‘succeskans ope-ratie’ en ‘chirurg’. Toetsen op correlatie tussen ordinale variabelen: toets mbv steekproefcorrelatieco-efficiënt of Spearman correlatietoets. Vb.1 Verband tussen leeftijd (niet stochas-tisch!) en bloeddruk. Vb.2 Verband tussen levensduur van familieleden (gem. kinderen vs gem. ouders)
Lineaire correlatie Twee stochasten: X en Y (bijv. lengte en gewicht). Aanname: Y en X zijn bivariaat normaal verdeeld met correlatiecoëfficiënt H0: = 0 vs. H1: 0. De steekproefcorrelatiecoëfficiënt is een schatter voor (zie week 4): Deze vormt de basis van de toetsingsgroot-heid (Stat. Comp., pag. 29):
Lineaire correlatie Verwerp H0 als de realisatie van genaamd tn-2,groter is dan t/2,n-2 of kleiner dan -t/2,n-2. De toets kan ook gebruikt worden als een van de variabelen niet stochastisch is (bijv. ‘tijd’). Dan aanname: Y = ax + b + , met : een normaal verdeelde fout. Lineair model. Hypotheses: H0: a = 0 en H1: a 0. De steekproefcorrelatiecoëfficiënt R wordt dan berekend met dezelfde formule en de tgh is ook hetzelfde.
Rangcorrelatie Wat als verband nirt-lineair is? Of geen normaliteit? We willen in meer algemene zin kunnen toetsen op correlatie. Ook nu biedt een verdelingsvrije toets een uitweg: de Spearman rangcorrelatie toets. Vb. Verband tussen sterkte en microscopi-sche eigenschap van materiaal: # verontrei-nigingen per mm3.
Rangcorrelatie Verband in ieder geval niet lineair. Stap 1: toekennen van rangen per variabele.
Rangcorrelatie Stap 2: som van kwadraten van verschil tussen rangen: Stap 3: bereken de Spearman correlatie-coëfficiënt: Hier rS = 0.66. Stap 4: Vergelijk rSmet kritieke waarde uit tabel 10.22 Stat. Compendium.
Rangcorrelatie Hier rS = 0.66. Stap 4: Vergelijk rSmet kritieke waarde uit tabel 10.22 Stat. Compendium. Hier toetsen we tweezijdig bij = 0.05. Rechterkritieke waarde is gelijk aan 0.56. Linkerkritieke waarde is gelijk aan –0.56. rS = 0.66 > 0.56 dus H0: ‘geen rangcorrelatie’ verwerpen. Er geldt: -1 rS 1. Dus, rS ook een schatter van de correlatiecoëfficiënt. Kritieke waarden alleen in tabel voor n 15. Voor grotere steekproeven: bij benadering tn –2 verdeeld is.
Samenvatting Biostatistiek Week 1 t/m 4: Kansrekening Week 5 t/m 9: Statistiek Nadruk op begrip, niet op het kennen van formules. In principe zullen alle formules, behalve de zeer basale, gegeven worden of in het Stat. Comp. staan. Belangrijkste van alles: wanneer heb ik wat nodig en hoe werkt het?
Week 1 • Begrippen als gebeurtenis, uitkomsten-ruimte, stochast, kans • Basis kansrekening: rekenen met doorsnede (‘A B’) en vereniging (‘A B’, en/of) • Disjunct (‘mutually exclusive’) en onafhankelijk • ‘1-’ regel mbv complement. • Totale kansregel • Voorwaardelijke kans • Stelling van Bayes
Week 2 • Discrete stochasten • Begrippen: kansdichtheidsfunctie f, cumualtieve verdelingsfunctie, F, verwach-ting en variantie • Kansverdelingen: Poisson, Bernoulli, Binomiaal, Uniform • Wat betekenen deze verdelingen en wanneer gebruik je ze? • Combineren stof week 1 en 2.
Week 3 • Continue kansverdelingen • Rekenen met varianties en verwachtings-waarden • Verschillende verdelingen ihb Normale Verdeling • Belang van normale verdeling: centrale limiet stelling • Normaal als benadering voor binomiaal en Poisson • Exponentiële verdeling en verband met de Poisson verdeling
Week 4 • Simultane kansdichtheden • Marginale kansdichtheid • Wat betekent onafhankelijkheid? • Associatie tussen kwantitatieve variabelen (covariantie, correlatie) • Bivariaat normaal • Plotjes van data: normal probability plot, Box-and-Whisker plot, Histogram • Schatters, eigenschappen: (on)zuiverheid, variantie van een schatter. • Verschillende schatters
Week 5 • Betrouwbaarheidsintervallen: wat betekenen ze? • Eenzijdige betrouwbaarheidsgrens: wat betekenen het? • Geldt altijd voor een populatieparameter zoals ,, p. • Wanneer gebruik je welk interval? • Wat gebeurt er met de breedte van het b.i. als • afneemt? • steekproefomvang n toeneemt?
Week 6 • Eenzijdige betrouwbaarheidsgrens berekenen mbv formule tweezijdige. • Steekproefgroottebepaling om nauwkeurig-heid (breedte b.i.) te garanderen • Toetsen: stappenplan. • Wanneer welke toets? • Hypothese opstellen: eenzijdig / tweezijdig • Wat betekent verwerpen / niet-verwerpen H0 • Connectie b.i.-en toetsen
Week 7 • Interpretatie computeroutput kan getentamineerd worden. Begrijp p-waarden. Van tweezijdig naar eenzijdig. • Type I fout: en type II fout . Onderscheidingsvermogen: 1- . Power-curves: Statgraphics uitvoer. • Steekproefgroottebepaling: OC-curves. Variantie bekend of niet? Specificatie is vaak: 1- moet gelijk zijn aan 0.9 (o.i.d.), curves werken juist met langs de Y-as, dus zoek op bij 0.10. • Formules voor ‘d’ (OC-curves) hoef je niet te kennen. • Aanpassingstoets: parameter schatten, verwachte frequenties berekenen, < 3: klas-ses samenvoegen, vrijheidsgraden
Week 8 • Afhankelijkheidstabellen: verband tussen twee variabelen waarvan er minimaal één nominaal (dwz geen logische ordening) is. • Belangrijkste: begrijp hoe je verwachte frequenties kunt berekenen uit de rij- en kolomtotalen. • Verdelingsvrije toetsen: Wilcoxon rangsom toets (ongepaarde data) en Wilcoxon rangtekentoets (gepaard of één steekproef) • Rangsom: som van rangen kleinste steekproef • Rangtekentoets: som van rangen behorend bij positieve (verschil)waarnemingen • Tabellen geven tweezijdige kritieke waarden
Week 9 • Toetsen op correlatie tussen ordinale variabelen • Lineair verband en normale verdelingen: toets mbv steekproefcorrelatiecoëfficiënt • Normale verdeling kan niet worden aangenomen of lineair verband is niet te verwachten (maar verband is wel monotoon): Spearman rangcorrelatie toets. • Controle: maak een plaatje waarbij je de variabelen tegen elkaar uitzet. Hieraan kun je vaak al redelijk zien of een lineair verband redelijk is of niet.
Tentamentips • Maak veel opgaven. Extra opgaven en oude tentamenopgaven zijn van het juiste niveau. • Maak de opgaven mbv het Stat. Comp. Laat het boek links liggen. • Grijp niet te snel naar de uitwerkingen • Zorg ervoor dat je ook de tabellen uit het Stat. Comp. goed begrijpt. • Structureer je aanpak. Geef duidelijk aan welke stochast behoort bij de omschrijving in de opgave. Bijv. X = lengte, Y = gemiddelde hartslag, T = t-toetsingsgrootheid. De waarde van zo’n stochast geef je weer met een kleine letter.
Tentamentips • Formuleer kort en bondig. Geen lange verhalen. • Rekenmachine: schrijf op welke formule je hebt gebruikt. Zo kun je bij verkeerd ‘invoeren’ toch punten krijgen. • Geef geen dubbele antwoorden op het tentamen. • Zeer belangrijk: controleer je eigen ant-woord! Kans altijd tussen 0 en 1, variantie/sd moet altijd positief zijn, etc. Schrijf het er evt. bij wanneer je beseft dat je antwoord niet (kan) kloppen, bijv. door rekenfout.