140 likes | 289 Views
Lineární regresní analýza Úvod od problému. Jednoduchá regrese. Model jednoduché lineární regrese Metoda nejmenších čtverců Testy významnosti Použití regresní rovnice pro predikci a odhad. Model jednoduché lineární regrese. Model lineární regrese y = 0 + 1 x + Regresní rovnice
E N D
Jednoduchá regrese • Model jednoduché lineární regrese • Metoda nejmenších čtverců • Testy významnosti • Použití regresní rovnice pro predikci a odhad
Model jednoduché lineární regrese • Model lineární regrese y = 0 + 1x+ • Regresní rovnice E(y) = 0 + 1x • Odhad regresní rovnice y = b0 + b1x ^ Poznámka: b0a b1 jsou odhady parametrů, β0 + β1 b0 a b1 a chceme vypočítat, x a y známe (naše data)
Model jednoduché lineární regrese • Grafická podstata metody nejmenších čtverců (MNČ) • Matematická podstata MNČ Minimalizace součtu Σ(y -b0-b1x)2 i Poznámka: řešení se provádí hledáním minima tj. derivací, získáme soustavu dvou rovnic o dvou neznámých b0a b1 Viz např. http://www.aristoteles.cz/matematika/linearni_algebra/soustavy/cramerovo-pravidlo.php
Mnohonásobná regrese • Model mnohonásobné lineární regrese • Metoda nejmenších čtverců • Mnohonásobný koeficient determinace • Předpoklady modelu • Testy významnosti • Použití regresní rovnice pro predikci a odhad • Kvalitativní nezávislé proměnné • Analýza reziduálních hodnot
Mnohorozměrná statistická analýzaDatová matice X X1 X2 X3 X4 ATD. ANO 204 M 1,2 NE 180 F 4,3 NE 178 F 2,3 NE 187 M 3,8 ANO 192 M 2,6 . . ATD.
Něco málo z vektorové algebry • Vektor • Matice • Násobení vektorů a matic • Transpozice • Inverze • Derivace součinu vektoru a matice
Model mnohonásobné lineární regrese • Model mnohonásobné lineární regrese y = 0 + 1x1 + 2x2 + . . . + pxp+ • Regresní rovnice E(y) = 0 + 1x1 + 2x2 + . . . + pxp • Odhad regresní rovnice y = b0 + b1x1 + b2x2 + . . . + bpxp ^
Metoda nejmenších čtverců • Kritérium nejmenších čtverců • Výpočet hodnot koeficientů Vzorce pro výpočet koeficientů mají podobu maticových rovnic. • Poznámka k interpretaci koeficientů bi jsou odhady změnyyodpovídající jednotkové změně vxi, jestliže ostatní nezávislé proměnné udržujeme konstantní. ^
Mnohonásobný koeficient determinace • Vztah mezi SST, SSM (SSR), SSE SST = SSM + SSE St.v.n-1 p n-p-1 • Mnohonásobný koeficient determinace R 2 = SSM/SST • Upravený mnohonásobný koeficient determinace ^ ^
Předpoklady modelu • Předpoklady o chybové složce • Chybaje náhodná proměnná s nulovou střední hodnotou. • Rozptyl chyb , označujeme2, má být stejný pro všechny hodnoty nezávisle proměnných. • Hodnotyjsou nezávislé. • Chybaje normálně rozložená náhodná proměnná reflektující odchylky mezi zjištěnou hodnotouy a očekávanou hodnotou y E(y)=0 + 1x1 + 2x2 + . . . + pxp
Testy významnosti: t Test • Hypotéza H0: i = 0 Ha: i = 0 • Testová statistika • Pravidlo zamítnutí Zamítá se H0jestližet < -tnebot > t kdetje založena nat rozložení se stupni volnosti n - p - 1.
Použití regresní rovnice pro predikci a odhad • Odhad střední hodnoty závisle proměnnéy a predikce individuálních hodnoty je v mnohonásobné regresy stejné jako v jednoduché regresy. • Dosadíme dané hodnoty prox1, x2, . . . , xpdo regresní rovnice a po výpočtu použijeme hodnotu yjako bodový odhad střední hodnoty y. • Existují vzorce pro výpočet intervalového odhadu střední hodnoty y a predikčního intervalu hodnotyy. • V statistických systémech jsou tyto odhady k dispozici. ^
Kvalitativní nezávislé proměnné • V mnoha situacích pracujeme také s kvalitativními nezávislými proměnnými jako např. pohlaví, temperament, typ školy atd. • Napříkladx2může reprezentovat pohlaví, kdex2 = 0 indikuje muže a x2 = 1 indikuje ženy. • V tomto případě, x2 ise nazýváindikátorová proměnná (dummy variable). • Jestliže má kvalitativní proměnnákúrovní, je zapotřebík - 1 indikátorových proměnných kódovaných jako 0 nebo 1. • Například proměnná s úrovněmi A, B, a C se reprezentuje proměnnými x1 a x2hodnotami (0, 0), (1, 0) nebo (0,1).