180 likes | 298 Views
Statistik PM5. Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression og introduktion til kategoriske data. Lineær regression. Model:. Least-squares linie. Output og graf fra SPSS. Residuals.
E N D
Statistik PM5 • Indhold: statistiske metoder til at analysere kategoriske data • Logistisk regression • Loglineære modeller • I dag: repetition af lineær regression og introduktion til kategoriske data.
Lineær regression Model:
Least-squares linie Output og graf fra SPSS
Residuals Residuals: Normal ?
Output og graf fra SPSS: Least-squares linier
Typer af variable • Kvantitativ vs kategorisk • Temperatur, forbrug: kvantitativ • Isolering: kategorisk • Diskret vs kontinuert • Isolering: diskret • Temperatur, forbrug: kontinuert • Antal personer i dette rum ?
Klassifikation af variable NB: kategorisk variabel er diskret pr. definition
Kategorisk afhængig variabel d: dosis insektgift r: død (1)/levende (0) Lineær regression dur ikke !!
2 kategoriske variable Køn og valg af transportmiddel for 496 personer Krydstabellering: Responsvariabel: antal personer i hver af de 4 kategorier.
Emner i kurset • Første del af kursus: analyse af binære afhængige variable (logistisk regression) • Anden del af kursus: analyse af tælledata for krydstabeller (log-lineære modeller)
Bernouilli/binomial fordelingen Eksempel: antal døde ved given dosis er binomialfordelt med n=3
Insekter og gift For hver dose observeres antal døde ud af 10 insekter
Fortolkning i forhold til transport • %døde ~ % personer der tager bil • dosis ~ antal km til arbejde
Resultat med lineær model • NB negativ predikteret frekvens for dosis 1 • Frekvenser ikke normalfordelte • Frekvenser har forskellig varians: • Dvs observationer bør vægtes
Næste gang • Logistisk regression for bernouilli eller binomial fordelte data.