1 / 14

Lineární regresní analýza Úvod od problému

Lineární regresní analýza Úvod od problému. Jednoduchá regrese. Model jednoduché lineární regrese Metoda nejmenších čtverců Testy významnosti Použití regresní rovnice pro predikci a odhad. Model jednoduché lineární regrese. Model lineární regrese y =  0 +  1 x +  Regresní rovnice

Download Presentation

Lineární regresní analýza Úvod od problému

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Lineární regresní analýza Úvod od problému

  2. Jednoduchá regrese • Model jednoduché lineární regrese • Metoda nejmenších čtverců • Testy významnosti • Použití regresní rovnice pro predikci a odhad

  3. Model jednoduché lineární regrese • Model lineární regrese y = 0 + 1x+  • Regresní rovnice E(y) = 0 + 1x • Odhad regresní rovnice y = b0 + b1x ^ Poznámka: b0a b1 jsou odhady parametrů, β0 + β1 b0 a b1 a chceme vypočítat, x a y známe (naše data)

  4. Model jednoduché lineární regrese • Grafická podstata metody nejmenších čtverců (MNČ) • Matematická podstata MNČ Minimalizace součtu Σ(y -b0-b1x)2 i Poznámka: řešení se provádí hledáním minima tj. derivací, získáme soustavu dvou rovnic o dvou neznámých b0a b1 Viz např. http://www.aristoteles.cz/matematika/linearni_algebra/soustavy/cramerovo-pravidlo.php

  5. Mnohonásobná regrese • Model mnohonásobné lineární regrese • Metoda nejmenších čtverců • Mnohonásobný koeficient determinace • Předpoklady modelu • Testy významnosti • Použití regresní rovnice pro predikci a odhad • Kvalitativní nezávislé proměnné • Analýza reziduálních hodnot

  6. Mnohorozměrná statistická analýzaDatová matice X X1 X2 X3 X4 ATD. ANO 204 M 1,2 NE 180 F 4,3 NE 178 F 2,3 NE 187 M 3,8 ANO 192 M 2,6 . . ATD.

  7. Něco málo z vektorové algebry • Vektor • Matice • Násobení vektorů a matic • Transpozice • Inverze • Derivace součinu vektoru a matice

  8. Model mnohonásobné lineární regrese • Model mnohonásobné lineární regrese y = 0 + 1x1 + 2x2 + . . . + pxp+  • Regresní rovnice E(y) = 0 + 1x1 + 2x2 + . . . + pxp • Odhad regresní rovnice y = b0 + b1x1 + b2x2 + . . . + bpxp ^

  9. Metoda nejmenších čtverců • Kritérium nejmenších čtverců • Výpočet hodnot koeficientů Vzorce pro výpočet koeficientů mají podobu maticových rovnic. • Poznámka k interpretaci koeficientů bi jsou odhady změnyyodpovídající jednotkové změně vxi, jestliže ostatní nezávislé proměnné udržujeme konstantní. ^

  10. Mnohonásobný koeficient determinace • Vztah mezi SST, SSM (SSR), SSE SST = SSM + SSE St.v.n-1 p n-p-1 • Mnohonásobný koeficient determinace R 2 = SSM/SST • Upravený mnohonásobný koeficient determinace ^ ^

  11. Předpoklady modelu • Předpoklady o chybové složce • Chybaje náhodná proměnná s nulovou střední hodnotou. • Rozptyl chyb , označujeme2, má být stejný pro všechny hodnoty nezávisle proměnných. • Hodnotyjsou nezávislé. • Chybaje normálně rozložená náhodná proměnná reflektující odchylky mezi zjištěnou hodnotouy a očekávanou hodnotou y E(y)=0 + 1x1 + 2x2 + . . . + pxp

  12. Testy významnosti: t Test • Hypotéza H0: i = 0 Ha: i = 0 • Testová statistika • Pravidlo zamítnutí Zamítá se H0jestližet < -tnebot > t kdetje založena nat rozložení se stupni volnosti n - p - 1.

  13. Použití regresní rovnice pro predikci a odhad • Odhad střední hodnoty závisle proměnnéy a predikce individuálních hodnoty je v mnohonásobné regresy stejné jako v jednoduché regresy. • Dosadíme dané hodnoty prox1, x2, . . . , xpdo regresní rovnice a po výpočtu použijeme hodnotu yjako bodový odhad střední hodnoty y. • Existují vzorce pro výpočet intervalového odhadu střední hodnoty y a predikčního intervalu hodnotyy. • V statistických systémech jsou tyto odhady k dispozici. ^

  14. Kvalitativní nezávislé proměnné • V mnoha situacích pracujeme také s kvalitativními nezávislými proměnnými jako např. pohlaví, temperament, typ školy atd. • Napříkladx2může reprezentovat pohlaví, kdex2 = 0 indikuje muže a x2 = 1 indikuje ženy. • V tomto případě, x2 ise nazýváindikátorová proměnná (dummy variable). • Jestliže má kvalitativní proměnnákúrovní, je zapotřebík - 1 indikátorových proměnných kódovaných jako 0 nebo 1. • Například proměnná s úrovněmi A, B, a C se reprezentuje proměnnými x1 a x2hodnotami (0, 0), (1, 0) nebo (0,1).

More Related