terveys 2000 koulutus n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Terveys 2000 koulutus PowerPoint Presentation
Download Presentation
Terveys 2000 koulutus

Loading in 2 Seconds...

play fullscreen
1 / 31

Terveys 2000 koulutus - PowerPoint PPT Presentation


  • 107 Views
  • Uploaded on

Terveys 2000 koulutus. KTL 3.6.2003. Sisältö. Tutkimusasetelmat Otanta-asetelma Ositus ja ryvästys Painokertoimet Esimerkit SAS/SUDAAN Stata R Kysymykset ja keskustelu. Tutkimusasetelmat. Poikkileikkaustutkimus Kahden riippumattoman otoksen vertailu

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Terveys 2000 koulutus' - ada


Download Now An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
sis lt
Sisältö
  • Tutkimusasetelmat
  • Otanta-asetelma
    • Ositus ja ryvästys
    • Painokertoimet
  • Esimerkit
    • SAS/SUDAAN
    • Stata
    • R
  • Kysymykset ja keskustelu
tutkimusasetelmat
Tutkimusasetelmat
  • Poikkileikkaustutkimus
  • Kahden riippumattoman otoksen vertailu
  • Mini-Suomi –otoksen toistomittaustutkimus
  • Kohortti- ja upotetut tapaus-verrokkitutkimukset
ositus ja ryv stys
Ositus ja ryvästys
  • Suomi jaettiin 20 ositteeseen
  • Suurimmat kaupungit muodostivat 15 ositetta
  • Lopuista 5 ositteesta (miljoonapiiristä)poimittiin 65 terveyskeskuspiiriä (ryvästä) 234:stä
  • 8028 havaintoyksilöä poimittiin
    • yli 80-vuotiaita kaksinkertaisella todennäköisyydellä
    • havaintojen lukumäärä ositetta kohden vastasi ositteen väkilukua
kaksitasoisen otannan vaikutuksia
Kaksitasoisen otannan vaikutuksia
  • Kustannussäästöjä aineiston keräämisessä
  • Samasta terveyskeskuspiiristä poimittujen henkilöiden välillä riippuvuuksia:
    • Maantieteelliset etäisyydet pieniä
    • Sukulaisuussuhteita enemmän
    • Monet palvelut yhteisiä
  • Riippuvuuksien huomioiminen analyyseissä välttämätöntä
painokertoimien taustaa
Painokertoimien taustaa
  • Yksilöillä erilaiset poimintatodennäköisyydet
    • Yli 80-vuotiailla kaksinkertainen poimintatodennäköisyys
    • Esim. suora keskiarvo havainnoista tuottaa harhaisen arvion väestökeskiarvosta
    • Ratkaisu: painotettu keskiarvo, jossa yli 80-vuotiailla painoiksi asetetaan 1/2
painokertoimet ja kato
Painokertoimet ja kato
  • Yksilöiden osallistumisaktiivisuus vaihtelee
  • Jos osallistuneetja katotapaukset ovat…
    • samanlaisia, erot voidaan korjata melko hyvin (esim. vain iästä ja sukupuolesta johtuva kato)
      • oletus havaittujen ja katotapausten samankaltaisuudesta
    • erilaisia, erojen huomioiminen on vaikeaa (usein esim. terveyteen ja toimintakykyyn liittyvät muuttujat)
      • kadon luonteesta vahvoja oletuksia, joiden testaaminen vaikeaa
painokertoimien taustaa1
Painokertoimien taustaa
  • Painokertoimilla voidaan korjata tunnetuista tekijöistä johtuvan kadon vaikutusta
  • Terveys 2000 –painokertoimissa huomioitu
erilaisia painokertoimia
Erilaisia painokertoimia
  • Osallistuminen voidaan määritellä eri tavoilla
  • Terveys 2000 –osallistuneiden määrät eri painoilla:
    • Unionipaino: osallistunut vähintään yhteen tutkimuspisteeseen (n = 7112)
    • Ravintokyselypaino: Osallistunut ravintokyselyyn(n = 6005)
    • ”Kaikki”-paino: Osallistunut tutkimuspisteeseen tai vastannut karhu- tai puhelinhaastatteluun (n = 7415)
    • Leikkauspaino: osallistunut kaikkiin tutkimuspisteisiin (n = 5482)
v est painot vs analyysipainot
Väestöpainot vs. analyysipainot
  • Analyysipainoja käytetään erilaisten keskiarvojen, prevalenssien ja regressiomallien estimoinnissa
  • Väestöpainoja käytetään vain estimoitaessa erilaisia totaaleja, kuten ominaisuuden X lukumääriä väestössä
painomuuttujan valinta
Painomuuttujan valinta
  • Analyysimuuttujien puuttuvan tiedon profiilin pitäisi vastata painomuuttujan puuttuvia tietoja
  • Leikkauspainojen käyttäminen saattaa karsia merkittävän osan havaintoyksilöistä
  • Unionipainot sopivat useimpiin tilanteisiin
  • Ravintokyselyssä osallistumisprofiili poikkeaa selvästi unionipainojen profiilista
  • ”Kaikki”-painoissa mukana on yksilöitä, joista on vain vähän tietoja
painotuksen ja osituksen vaikutuksia
Painotuksen ja osituksen vaikutuksia
  • Tarkastellaan esimerkkejä, joissa keskiarvoja estimoidaan
    • … painotuksella tai ilman, ja
    • … huomioimalla ositus/ryvästys tai ei
  • Keskiarvoesimerkkien tuloksia voidaan havaita myös monimutkaisemmissa analyyseissä
esimerkkimuuttujat
Esimerkkimuuttujat
  • Ikä
  • Systolinen verenpaine SystBP
  • Painoindeksi BMI
  • Kokonaiskolesteroli
tunnusluvut
Tunnusluvut
  • Keskiarvo, joka kuvaa 30+ -vuotiaiden keskiarvoa
  • Estimoitu keskivirhe (s.e.)
  • DEFT eli ”Design Factor” on suhteellinen ero keskivirheissä (ja luottamusvälin leveydessä), jos jätetään huomioimatta painot sekä ositus- ja ryvästystiedot
  • DEFF ”Design Effect” on DEFT 2
johtop t ksi otanta asetelman huomioimisesta
Johtopäätöksiä otanta-asetelman huomioimisesta
  • Painokertoimien huomioiminen tuottaa oikean piste-estimaatin
  • Rypäiden (erityisesti tk-piirien) sisäinen homogeenisuus ja erot verrattuna toisiin rypäisiin aiheuttavat sisäkorreloituneisuutta, mikä voi muuttaa huomattavasti estimoituja keskivirheitä verrattuna analyysiin yksinkertaisella satunnaisotannalla
lukum rien estimointi
Lukumäärien estimointi
  • Monellako 30+ -vuotiaalla on ominaisuus X?
  • Terveys 2000 –tutkimuksen 30+ -vuotiaiden perusjoukossa on 3,254,681 ihmistä
  • Käytetään väestöpainokertoimia, jotka kuvaavat kuinka montaa kohdeperusjoukon ihmistä kohdehenkilö kuvaa, ja painotettua summaa tutkimusmuuttujasta
lukum r estimointiesimerkki
Lukumääräestimointiesimerkki
  • Kuinka monella 30+ -vuotiaalla systolinen verenpaine on yli 140? Mikä on keskivirhe?
  • Käytetään väestöpainoja ja ositus-ryvästystietoja
esimerkkiaineisto
Esimerkkiaineisto

Selittäjiä:

  • ikä (jatkuvana tai 6-luokkaisena) ikaja ika6
  • sukupuoli sp2
  • siviilisääty aa01
  • painoindeksi (body mass index) BMI
  • kokonaiskolesteroli T114
  • HDL-kolesteroli T115 ja
  • portaiden nouseminen PortaanNousu.
vastemuuttuja
Vastemuuttuja
  • Jatkuva: systolinen verenpaine SystBp2
  • Binäärinen SystBp2_01:
    • arvo on 1, jos yli 140
    • muuten 0
  • Kolmiluokkainen SystBp2_123:
    • arvo on 1, jos alle 120
    • arvo on 2, jos välillä 120, 160
    • muuten 3
mallivakiointi
Mallivakiointi
  • Mikä on muuttujan Y keskiarvo (tai prevalenssi) eri determinanttimuuttujan arvoilla, jos sekoittavan tekijän jakauma olisi sama?
  • Determinanttimuuttuja voi olla esim. sukupuoli
  • Mallivakiointi predictive marginal:
    • determinanttimuuttujan X havaittu arvo muutetaan arvoksi x kaikilla yksilöillä,
    • lasketaan ennustearvo jokaiselle yksilölle ja
    • lasketaan keskiarvo ennusteista
  • Hyöty: vertailukelpoisuus hyvä, koska erilaisilla tekijän X arvoilla x muuttujan Y arvoon vaikuttavien muiden tekijöiden jakauma on sama
mallivakiointi jatkoa
Mallivakiointi (jatkoa)
  • Miksi ei sijoiteta kaavoihin yksinkertaisesti kovariaattien keskiarvoja?
  • Estimoitaessa prevalenssia mallivakioitu tulos voi erota merkittävästi havaitusta prevalenssista
mallivakiointiesimerkki jatkuva vaste
Mallivakiointiesimerkki: jatkuva vaste
  • Vasteena systolinen verenpaine, lineaarinen regressiomalli
  • Selittäjinä BMI, sukupuoli, 6-luokkainen ikä, kokonaiskolesteroli ja siviilisääty
mallivakiointiesimerkki bin rinen vaste
Mallivakiointiesimerkki: binäärinen vaste
  • Vasteena systolinen verenpaine (”1” = yli 140, logit-malli)
  • Selittäjinä BMI, sukupuoli, 6-luokkainen ikä, kokonaiskolesteroli ja siviilisääty
esimerkit
Esimerkit
  • Perustunnusluvut (keskiarvot, taulukoinnit)
  • Lineaarinen regressiomalli
  • Logistinen regressiomalli
  • Moniluokkainen logistinen regressiomalli
    • Järjestysasteikollinen vaste
    • Luokiteltu vaste