200 likes | 336 Views
Økonometri 1. Inferens i den multiple regressionsmodel 27. februar 2003. Inferens i den multiple regressionsmodel. Emnet for denne og de to næste forelæsninger er statistisk inferens, specielt hypotesetest. Resultater om OLS med et endeligt antal observationer (kap. 4): Normalitetsantagelse.
E N D
Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003 Økonometri 1: Inferens i den multiple regressionsmodel
Inferens i den multiple regressionsmodel • Emnet for denne og de to næste forelæsninger er statistisk inferens, specielt hypotesetest. • Resultater om OLS med et endeligt antal observationer (kap. 4): Normalitetsantagelse. • Mere generelle antagelser: Asymptotiske resultater for OLS: (kap. 5). • Introducere et nyttigt redskab: Monte Carlo eksperimenter (forelæsningsnote ligger på hjemmesiden). Økonometri 1: Inferens i den multiple regressionsmodel
Dagens program • Monte Carlo eksperimenter: Anvendes på Ugeseddel 4 og 5 og fremover. • Ideen med at lave simulationseksperimenter • Opbygning af en simulationsalgoritme • Et eksempel: Den forventede startløn for en økonom • Hypotesetest og konfidensintervaller i den multiple regressionsmodel: Wooldridge kap. 4.1-4.3. • Kendt stof fra Teoretisk Statistik. • Genovervej i lyset af Monte Carlo noten. Økonometri 1: Inferens i den multiple regressionsmodel
Monte Carlo eksperimenter: Ideen • Simulationer af ”datasæt” fra en fuldt specificeret model: Datagenererende proces (DGP) • Eksempel: • Vi kender de "sande parametre" μ og σ² og genererer et sæt af fx N=100 observationer fra modellen: • ”Glemmer” at vi kender μ og σ²: Anvend estimator (”regneregel”) til at skønne over fx μ ud fra det foreliggende sæt af observationer: Fx gennemsnittet: Økonometri 1: Inferens i den multiple regressionsmodel
Monte Carlo eksperimenter: Ideen (fortsat) • Kan vi på en nem måde vurdere, om er en rimelig estimator for μ ? • Lav nye uafhængige trækninger af datasæt genereret af den samme DGP. • Beregn værdien af estimatoren for hvert datasæt: • Lav mange trækninger (”replikationer”). • Se på fordelingen af estimaterne over replikationerne: Beregn fx fordelingens gennemsnit og varians. • Parallelt til ”tankeeksperiment”: Vores konkrete datasæt er blot ét blandt mange potentielle udfald. Økonometri 1: Inferens i den multiple regressionsmodel
Monte Carlo eksperimenter: Ideen (fortsat) • Formål med Monte Carlo eksperimenter: • Efterprøve analytiske resultater: fx at OLS er middelret under MLR.1-4. • Sammenligne forskellige estimatorer eller test, hvor det er besværligt/umuligt analytisk. • Vurdere hvor mange observationer der skal til for at man kan bruge asymptotiske resultater (kap. 5). Økonometri 1: Inferens i den multiple regressionsmodel
Monte Carlo eksperimenter: I praksis ProcIML; antalobs = 100; * antal observationer i datasættet; Y = j(antalobs,1,.); * data-vektoren (startlønnen) ; do i=1 to antalobs; * generer datasæt; e = rannor(1); * fejlleddet genereres; y[i,1] = 27 +1.5* e; * beregn y variabel ; end; quit; Økonometri 1: Inferens i den multiple regressionsmodel
Monte Carlo eksperimenter: I praksis (fortsat) m1[j,1]=sum(y)/antalobs; * estimatet m1 (gennemsnittet); m2[j,1]=1/2*(min(y)+max(y)); * estimatet m2 (gns. min og max); Økonometri 1: Inferens i den multiple regressionsmodel
Monte Carlo eksperimenter: I praksis (fortsat) Trin 3: Gentag trin 1 og 2: M=10.000 replikationer: antalsim = 10000; * antal replikationer i simulationen; m1 = j(antalsim,1,.); * vektorer til at gemme estimaterne i; m2 = j(antalsim,1,.); do j=1 to antalsim; * løkke over simulationer; . <her beregnes estimater for hvert datasæt> . end; Trin 4: Analysér fordelingerne af de to sæt estimater: • Histogram • Gennemsnit, varians, højere momenter Økonometri 1: Inferens i den multiple regressionsmodel
Monte Carlo eksperimenter: Eksempel • Brug algoritmen til at analysere og som estimatorer for middelværdien i fordelingen af startlønninger. • Ex: Telefoninterviews med tilfældigt udvalgte, nyuddannede økonomer, som oplyser (?) deres startløn. • Sæt (begge i 1000 kr.) • SAS-programmet MC.sas udfører M=10.000 replikationer. Se på N=100, N=50 og N=10. • Link til SAS Økonometri 1: Inferens i den multiple regressionsmodel
Monte Carlo eksperimenter: Eksempel (fortsat) Middelværdi og varians af de to estimatorer baseret på M=10.000 simulationer • har lavest varians • Varians aftager medN Økonometri 1: Inferens i den multiple regressionsmodel
Monte Carlo eksperimenter: Afrunding • Husk: • Resultater og konklusioner fra Monte Carlo eksperimenter afhænger potentielt altid af de valgte parametre og fordelinger. • I praktiske anvendelser må man i hvert enkelt tilfælde godtgøre, at den valgte model har relevans for den problemstilling, man ønsker at belyse. PAUSE Økonometri 1: Inferens i den multiple regressionsmodel
Hypotesetest i den multiple regressionsmodel: Endelige stikprøver (kap. 4) • For hypotesetest behøver vi fordelingen af . • Introducere yderligere antagelse: Normalitet. • MLR.6: u er uafhængig af og normalfordelt med middelværdi nul og varians . • Definerer den klassiske lineære model (CLM). • Restriktiv antagelse: • Argument for: u opsamler alle de mange effekter der er udeladt af modellen: Central grænseværdisætning køres i stilling. • Argumenter imod i konkrete problemstillinger: Begrænsede variabler (positive!), andre typer af fordelinger (log-normal, diskrete). Økonometri 1: Inferens i den multiple regressionsmodel
Fordeling af OLS estimatoren: Endelig stikprøve • Linearitet af i u og CLM giver følgende resultat: • Theorem 4.1: Under CLM antagelserne og betinget på gælder at hvor Heraf følger: Økonometri 1: Inferens i den multiple regressionsmodel
Fordeling af OLS estimatoren: Endelig stikprøve (fortsat) • Theorem 4.1 indeholder den ukendte parameter , derfor ikke umiddelbart operationel. • Erstattes af kan man vise at der gælder følgende resultat: • Theorem 4.2: Under CLM antagelserne og betinget på gælder at hvor k+1 er antal regressorer i modellen inkl. konstantled. Økonometri 1: Inferens i den multiple regressionsmodel
Hypotesetest: Endelig stikprøve • Betragt en simpel nulhypotese om en regressionskoefficient: , hvor a er en konstant. • Under nulhypotesen fastlægger vi altså værdien af en parameter i den sande model. • Analogt til at specificere DGP’en for et Monte Carlo eksperiment. • Tænk på nulhypotesen som DGP’en for et tankeeksperiment: Givet denne værdi af kender vi fordelingen af . • Kan derfor bruge afvigelsen mellem estimatet, og den postulerede værdi, a, til at vurdere gyldigheden af nulhypotesen. Økonometri 1: Inferens i den multiple regressionsmodel
Hypotesetest: Endelig stikprøve • t-testet for er givet ved og fordelt som under nulhypotesen. • t-fordelingen går mod N(0,1) når antallet af frihedsgrader vokser. Fin approximation hvis større end 120. • Alternativhypotesen: • Ensidede alternativer:eller • Tosidet alternativ: Økonometri 1: Inferens i den multiple regressionsmodel
Hypotesetest: Endelig stikprøve • Klassisk teststrategi: • Vælg signifikansniveau: Sandsynlighed for at afvise nulhypotesen, givet at den er sand. Typisk vælges 5 %. • Vælg alternativhypotese: Bestemmer den kritiske region, givet signifikansniveauet. • Beregn teststatistik. • Afvis nulhypotesen hvis testet er i den kritiske region. • Afvis ellers ikke. • Alternativ: Beregn p-værdi: Marginale signifikansniveau som ville betyde at nulhypotesen ville blive afvist. Økonometri 1: Inferens i den multiple regressionsmodel
Hypotesetest: Endelig stikprøve • Typer af simple hypoteser: • a=0: Standard signifikanstest. • a=1 eller a=-1: Test af homogenitet eller proportionalitet. • Konfidensinterval: Givet signifikansniveau, , fx 5 %. Så er 100- % konfidensintervallet givet ved: • Konstrueres intervallet således vil det i 100- % af udfaldene rumme den sande værdi. Nulhypoteser om værdier udenfor vil således blive afvist. • Skitsér på tavlen. Økonometri 1: Inferens i den multiple regressionsmodel
Næste gang: • Generelle lineære hypoteser på regressionskoefficienterne under normalitet: W 4.4-4.6 • Uden normalitetsantagelser: Store stikprøver: W 5.1 om konsistens af OLS. Økonometri 1: Inferens i den multiple regressionsmodel