Varianskomponentmodeller
This presentation is the property of its rightful owner.
Sponsored Links
1 / 55

Varianskomponentmodeller PowerPoint PPT Presentation


  • 72 Views
  • Uploaded on
  • Presentation posted in: General

Varianskomponentmodeller. Thore Egeland Epidemiologisk senter, RH Seksjon for medisinsk statistikk. Innhold. Innledning: Hensikt, eksempler, begreper Naiv, feilaktig analyse Eksempler SPSS General Linear Model Univariate Varcomp Noen beregningsdetaljer.

Download Presentation

Varianskomponentmodeller

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Varianskomponentmodeller

Varianskomponentmodeller

Thore Egeland

Epidemiologisk senter, RHSeksjon for medisinsk statistikk


Innhold

Innhold

  • Innledning: Hensikt, eksempler, begreper

  • Naiv, feilaktig analyse

  • EksemplerSPSS General Linear Model Univariate Varcomp

  • Noen beregningsdetaljer.

  • Forutsetninger.


Hensikt

Hensikt

  • Modellere avhengighet som skyldes at (noen) data er gjentatt i en eller annen forstand. Vi tenker ikke nødvendigvis på tid.

  • Håndtere data som ikke er balanserte:missing, dyr dør, etc...


Eksempler

Eksempler:

  • family: høyden til personer hvorav noen er fra samme familie.Hvor stor del av variasjonen i høyde skyldes familiekomponenten?

  • rats: Rotter stimuleres ulikt i tre grupper. Vi måler respons mange steder i hjernen.Hvordan innvirker behandling på respons?

  • anxiety: hver person plasseres i en gruppe avhengig av 'anxiety' og 4 tester utføres.Hvordan innvirker 'anxiety' på ferdigheter?


Begreper

Begreper

  • Tilfeldig versus fast effektBalansertNestet

  • Eksempler: Family, Rats, Anxiety, Pigment

  • Mål hele tiden:Estimering av variabilitet og p-verdier


Family data

'family' data

id family gender height

1 1 female 67

2 1 female 66

. . . .

. . . .

. . .

18 4 male 69


Family eksempel

Family-eksempel

  • Naiv analyse: Toveis variansanalyse:height=mean+family+gender+family*genderFormelt. Familier k=1,2,3,4 j=1,...,nk ykj=


Hvorfor er analysen naiv feilaktig

Hvorfor er analysen naiv, feilaktig?

  • Avhengighet innen familier neglisjeres.

  • Family (1,2,3,4) opptrer på samme måte i modellen som behandling (1,2,3,4) ville ha gjort.

  • Urimelig? Samme analyse kan umulig passe i begge tilfeller.


Faste og tilfeldige effekter

Faste og tilfeldige effekter

  • Familier er en tilfeldig (random) effekt.Behandling ville ha vært en fast (fixed) effekt.

  • Familier er trukket fra en fordeling, derav tilfeldig.Behandling bestemmes, fastlegges.

  • Repetert over familier; ikke tid.


Varianskomponentmodell

Varianskomponentmodell

  • height=konstant + gender + (fast effekt) family + (tilfeldig effekt) family*gender+ (interaksjon) feilledd (tilfeldig effekt)

Det er vanlig å bruke norske bokstaver for

tilfeldige effekter og ellers greske.


Oppsummering s langt

Oppsummering så langt

  • Faste (fixed) effekter:behandling, gruppe,...

  • Tilfeldige effekter:family, batch, rat,


Varianskomponentmodell1

Varianskomponentmodell

  • Variansen består av flere komponenter:var(høyde)=var(family) +var(error)

  • Medfører:korrelasjon=0 for data fra forskj. familierkorrelasjon=var(family)/var(høyde), for data fra samme familie


Balansert

Balansert

  • Balansert forsøksplan:Hver kategori har like mange observasjoner

Ubalansert:A R1 2.5 A R2 2.2 B R1 2.9

Balansert:A R1 2.5 A R2 2.2 B R1 2.9 B R2 2.8


Betydningen av balanserte planer

Betydningen av balanserte planer

  • Balanserte planer har best styrke, er lettere å analysere og fortolke.

  • I våre dager kan imidlertid ubalanserte planer håndteres; imidlertid kan vi forskjellige metoder gi forskjellige svar for små ubalanserte planer.


Nesting

A

A

B

B

R1

R1

R2

R2

R3

R1

R4

R2

Nesting

  • Behandling Rotte Respons A R1 2.5 A R2 2.2 B R1 2.9 B R2 2.8

  • Behandling Rotte Respons A R1 2.5 A R2 2.2 B R3 2.9 B R4 2.8

  • Planen over er nestet


Varianskomponentmodeller

Eksempel

Mixed, unbalanced, nested...

(Moser et al., 1997)

trt. groups

fixed

enriched

paired

isolated

...

...

...

rats

random,nested

R1 R2 ...

...

R20

...

cells,

random

nested

...

C20...

C1C2...C19


Eksempel anxiety sav

Eksempel: anxiety.sav

  • Subject Anxiety Trial 1 Trial 2 Trial 3 Trial 4 1 1 18 14 12 6 2 1 19 12 8 4 11 2 16 14 10 9 12 2 16 12 8 8


Varianskomponentmodeller

1

2

Anxiety group

6

7

12

1

....

....

subject

Trials

1 2 3 4


Modell 1

Modell 1

  • Anxiety. Fast effekt.Vi velger, bestemmer

  • Subject. Tilfeldig effekt, fra en fordeling av individer.Nestet, fra figur.

  • Trial. Fast effekt


Modell 2

Modell 2

  • score=konstant+ anxiety+ subject(anxiety)+ trial+ trial*anxiety+ feil


Varianskomponentmodeller

SPSS

  • Analyze General Linear Model Univariate (general Factorial i SPSS 8)Dependent variable: scoreFixed factor(s): trial anxietyRandom factor(s): subject

  • Model > CustomModel: anxiety trial trial anxiety

  • Nesting må gjøres manuelt: Trykk paste og legg inn paranteser som på nederste linje neste side


Varianskomponentmodeller

SPSS

UNIANOVA

score BY anxiety trial subject

/RANDOM = subject

/METHOD = SSTYPE(3)

/INTERCEPT = INCLUDE

/PRINT = DESCRIPTIVE

/PLOT = PROFILE( trial*anxiety )

/CRITERIA = ALPHA(.05)

/DESIGN = anxiety subject(anxiety) trial anxiety*trial .


Kontroll av antagelser

Kontroll av antagelser

  • Noen antagelser tar vi stilling til før data:Modellen medfører at korrelasjoner (mellom målinger ftra samme individ) ikke er negative.


Residualene skal v re normalfordelt

Residualene skal være normalfordelt


Hvor god er modellen

Hvor god er modellen?


Homogenitet

Homogenitet?

Variansen i residualene skal være

uavhengig av nivået til de faste komponenter


Sjekk av antagelser i spps

Sjekk av antagelser i SPPS

  • Vi lagrer residualer og predikerte verdieri save og plotter etterpå.


Eksempel pigment

Eksempel: pigment


Problemstilling

Problemstilling

  • Variabiliteten i produksjonen av et legemiddel er for stor:gj.snitt=26.8, sd =6

  • Hva bidrar mest til variasjonen:batch (produksjonen):sample (stikkprøven):laboratoriet (test,residual):


Varianskomponentmodeller

Figur s 571,572

Batch og Sample er tilfeldige effekter,

Hierarkisk (nestet) modell)


Modell

Modell

  • Moisture= konstant+ batch+ (random) sample(batch)+ (random) test (random)


Beregninger

Beregninger

  • Manuelt.Denne balanserte planen kan håndregnes.

  • SPPS


Varianskomponentmodeller

Table 17.3 , s574-575


Detaljer i

Detaljer I

  • Utregninger


Detaljer ii

Detaljer II

  • Det kan vises:


Konklusjon

Konklusjon

  • Mesteparten av variasjonen kommer fra 'sample' (stikkprøven): 28.5/(0.92+28.5+6.9)=78.5%

  • 'Man hadde glemt å røre i bøtta før man tok stikkprøven'.


Beregninger i spss

Beregninger i SPSS

  • Man kan kjøre GLM univariate som før.Da må man imidlertid bearbeide tallene litt før man får varianskompontene.

  • Vi kan bruke glm varcomp:


Varianskomponentmodeller

7.128+28.533+0.917=36.6

Innledende figur viste varians 36.8


Spss syntaks

SPSS syntaks

  • Syntaksen er muligens kryptisk, imidlertid er alt unntatt parantesen sample(batch) fremkommet ved pek og klikk:

VARCOMP

moisture BY batch sample

/RANDOM = batch sample

/METHOD = REML

/CRITERIA = ITERATE(50)

/CRITERIA = CONVERGE(1.0E-8)

/DESIGN = batch sample(batch)

/INTERCEPT = INCLUDE .


Hypotesepr ving

Hypoteseprøving

  • Uinteressant her, allikevel ...

  • H0: "ingen batch effekt"


Varianskomponentmodeller

Hvorfor baseres testen på F=86.495/57.983=1.492 og

ikke F=86.495/0.917?


Forklaring av testen

Forklaring av testen

  • Testobservator

Denne størrelsen er omtrent 1 hvis nullhypotesen er riktig

og større enn 1 ellers. En stor F verdi gir en liten p-verdi og

tilsier forkastning.


Litteratur

Litteratur

  • Box, Hunter og Hunter. "Statistics for experimenters", Wiley 1978. God&gammel!

  • SPSS Base 9.0. Applications Guide. Ch 10.


  • Login