1 / 55

Varianskomponentmodeller

Varianskomponentmodeller. Thore Egeland Epidemiologisk senter, RH Seksjon for medisinsk statistikk. Innhold. Innledning: Hensikt, eksempler, begreper Naiv, feilaktig analyse Eksempler SPSS General Linear Model Univariate Varcomp Noen beregningsdetaljer.

wirt
Download Presentation

Varianskomponentmodeller

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Varianskomponentmodeller Thore Egeland Epidemiologisk senter, RHSeksjon for medisinsk statistikk

  2. Innhold • Innledning: Hensikt, eksempler, begreper • Naiv, feilaktig analyse • EksemplerSPSS General Linear Model Univariate Varcomp • Noen beregningsdetaljer. • Forutsetninger.

  3. Hensikt • Modellere avhengighet som skyldes at (noen) data er gjentatt i en eller annen forstand. Vi tenker ikke nødvendigvis på tid. • Håndtere data som ikke er balanserte:missing, dyr dør, etc...

  4. Eksempler: • family: høyden til personer hvorav noen er fra samme familie.Hvor stor del av variasjonen i høyde skyldes familiekomponenten? • rats: Rotter stimuleres ulikt i tre grupper. Vi måler respons mange steder i hjernen.Hvordan innvirker behandling på respons? • anxiety: hver person plasseres i en gruppe avhengig av 'anxiety' og 4 tester utføres.Hvordan innvirker 'anxiety' på ferdigheter?

  5. Begreper • Tilfeldig versus fast effektBalansertNestet • Eksempler: Family, Rats, Anxiety, Pigment • Mål hele tiden:Estimering av variabilitet og p-verdier

  6. 'family' data id family gender height 1 1 female 67 2 1 female 66 . . . . . . . . . . . 18 4 male 69

  7. Family-eksempel • Naiv analyse: Toveis variansanalyse:height=mean+family+gender+family*genderFormelt. Familier k=1,2,3,4 j=1,...,nk ykj=

  8. Hvorfor er analysen naiv, feilaktig? • Avhengighet innen familier neglisjeres. • Family (1,2,3,4) opptrer på samme måte i modellen som behandling (1,2,3,4) ville ha gjort. • Urimelig? Samme analyse kan umulig passe i begge tilfeller.

  9. Faste og tilfeldige effekter • Familier er en tilfeldig (random) effekt.Behandling ville ha vært en fast (fixed) effekt. • Familier er trukket fra en fordeling, derav tilfeldig.Behandling bestemmes, fastlegges. • Repetert over familier; ikke tid.

  10. Varianskomponentmodell • height=konstant + gender + (fast effekt) family + (tilfeldig effekt) family*gender+ (interaksjon) feilledd (tilfeldig effekt) Det er vanlig å bruke norske bokstaver for tilfeldige effekter og ellers greske.

  11. Oppsummering så langt • Faste (fixed) effekter:behandling, gruppe,... • Tilfeldige effekter:family, batch, rat,

  12. Varianskomponentmodell • Variansen består av flere komponenter:var(høyde)=var(family) +var(error) • Medfører:korrelasjon=0 for data fra forskj. familierkorrelasjon=var(family)/var(høyde), for data fra samme familie

  13. Balansert • Balansert forsøksplan:Hver kategori har like mange observasjoner Ubalansert:A R1 2.5 A R2 2.2 B R1 2.9 Balansert:A R1 2.5 A R2 2.2 B R1 2.9 B R2 2.8

  14. Betydningen av balanserte planer • Balanserte planer har best styrke, er lettere å analysere og fortolke. • I våre dager kan imidlertid ubalanserte planer håndteres; imidlertid kan vi forskjellige metoder gi forskjellige svar for små ubalanserte planer.

  15. A A B B R1 R1 R2 R2 R3 R1 R4 R2 Nesting • Behandling Rotte Respons A R1 2.5 A R2 2.2 B R1 2.9 B R2 2.8 • Behandling Rotte Respons A R1 2.5 A R2 2.2 B R3 2.9 B R4 2.8 • Planen over er nestet

  16. Eksempel Mixed, unbalanced, nested... (Moser et al., 1997) trt. groups fixed enriched paired isolated ... ... ... rats random,nested R1 R2 ... ... R20 ... cells, random nested ... C20... C1C2...C19

  17. Eksempel: anxiety.sav • Subject Anxiety Trial 1 Trial 2 Trial 3 Trial 4 1 1 18 14 12 6 2 1 19 12 8 4 11 2 16 14 10 9 12 2 16 12 8 8

  18. 1 2 Anxiety group 6 7 12 1 .... .... subject Trials 1 2 3 4

  19. Modell 1 • Anxiety. Fast effekt.Vi velger, bestemmer • Subject. Tilfeldig effekt, fra en fordeling av individer.Nestet, fra figur. • Trial. Fast effekt

  20. Modell 2 • score=konstant+ anxiety+ subject(anxiety)+ trial+ trial*anxiety+ feil

  21. SPSS • Analyze General Linear Model Univariate (general Factorial i SPSS 8)Dependent variable: scoreFixed factor(s): trial anxietyRandom factor(s): subject • Model > CustomModel: anxiety trial trial anxiety • Nesting må gjøres manuelt: Trykk paste og legg inn paranteser som på nederste linje neste side

  22. SPSS UNIANOVA score BY anxiety trial subject /RANDOM = subject /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /PRINT = DESCRIPTIVE /PLOT = PROFILE( trial*anxiety ) /CRITERIA = ALPHA(.05) /DESIGN = anxiety subject(anxiety) trial anxiety*trial .

  23. Kontroll av antagelser • Noen antagelser tar vi stilling til før data:Modellen medfører at korrelasjoner (mellom målinger ftra samme individ) ikke er negative.

  24. Residualene skal være normalfordelt

  25. Hvor god er modellen?

  26. Homogenitet? Variansen i residualene skal være uavhengig av nivået til de faste komponenter

  27. Sjekk av antagelser i SPPS • Vi lagrer residualer og predikerte verdieri save og plotter etterpå.

  28. Eksempel: pigment

  29. Problemstilling • Variabiliteten i produksjonen av et legemiddel er for stor:gj.snitt=26.8, sd =6 • Hva bidrar mest til variasjonen:batch (produksjonen):sample (stikkprøven):laboratoriet (test,residual):

  30. Figur s 571,572 Batch og Sample er tilfeldige effekter, Hierarkisk (nestet) modell)

  31. Modell • Moisture= konstant+ batch+ (random) sample(batch)+ (random) test (random)

  32. Beregninger • Manuelt.Denne balanserte planen kan håndregnes. • SPPS

  33. Table 17.3 , s574-575

  34. Detaljer I • Utregninger

  35. Detaljer II • Det kan vises:

  36. Konklusjon • Mesteparten av variasjonen kommer fra 'sample' (stikkprøven): 28.5/(0.92+28.5+6.9)=78.5% • 'Man hadde glemt å røre i bøtta før man tok stikkprøven'.

  37. Beregninger i SPSS • Man kan kjøre GLM univariate som før.Da må man imidlertid bearbeide tallene litt før man får varianskompontene. • Vi kan bruke glm varcomp:

  38. 7.128+28.533+0.917=36.6 Innledende figur viste varians 36.8

  39. SPSS syntaks • Syntaksen er muligens kryptisk, imidlertid er alt unntatt parantesen sample(batch) fremkommet ved pek og klikk: VARCOMP moisture BY batch sample /RANDOM = batch sample /METHOD = REML /CRITERIA = ITERATE(50) /CRITERIA = CONVERGE(1.0E-8) /DESIGN = batch sample(batch) /INTERCEPT = INCLUDE .

More Related