230 likes | 475 Views
回帰分析 単回帰. 麻生良文. 単回帰モデル simple regression model. y 従属変数 (dependent variable) 被説明変数 (explained variable) x 独立変数 (independent variable) 説明変数 (explanatory variable) u 誤差項 (error term) 撹乱項 (disturbance term) 他の要因,観察されない変数の影響, y の測定誤差.
E N D
回帰分析単回帰 麻生良文
単回帰モデル simple regression model • y • 従属変数 (dependent variable) • 被説明変数(explained variable) • x • 独立変数 (independent variable) • 説明変数 (explanatory variable) • u • 誤差項 (error term) • 撹乱項 (disturbance term) • 他の要因,観察されない変数の影響,yの測定誤差
左のようなモデルを仮定し,現実に観察されたデータから,パラメータa,bを推計する直線を当てはめる左のようなモデルを仮定し,現実に観察されたデータから,パラメータa,bを推計する直線を当てはめる y 推計されたa,b当てはめられた直線の切片と傾き 傾きxが1単位増加したときyは何単位増加するか x
重回帰モデル multiple regression model • 説明変数が2個以上 他の説明変数を一定に保っておいて,xi だけを1単位増加させたときに y が何単位増えるか 他の要因をコントロールした xi 固有の影響
線型モデル(パラメータに関し) 誤差項の期待値は0 誤差項は互いに独立 誤差項の分散は一定(分散均一性) 誤差項は正規分布に従う BLUEの成立のためにはこの条件は不要 単回帰モデルにおける仮定
最小二乗法 • 残差平方和を最小にするようにパラメータを決定 • a,b: 未知パラメータ a,bの推定値 • e: 残差 1階の条件
最小二乗推定量 BLUE (Best Linear Unbiased Estimator)という性質 誤差項の分散の推定量 n-2の2は説明変数の個数(定数項とx) SER (standard error of the regression)
Eviewsでの回帰分析 メニューからQuick Estimate Equation で下の画面 最小二乗法の指定(他にも推定方法のoptionあり) 被説明変数,説明変数をスペースで区切って並べる。 c は定数項(constant term) 分析に用いるサンプルを指定することもできる
仮説の検定 H0:b=b0 n−2 : 2は説明変数の個数(定数項とx)
当てはまりの良さ • TSS=ESS+RSS • 決定係数 • 0から1の間の値 • 1に近いほど当てはまりが良いことを表す
Eviewsの出力 回帰係数
残差のプロット Eviewsではresidという変数に直前の回帰分析の残差が保存される 残差を検討することで回帰分析の前提(分散均一性)が満たされているかどうかチェックする グラフをみる限り,分散の均一性の前提が満たされていないようである 教育年数の増加とも分散が大きくなっている 残差を後の分析でも使いたい場合は新しい変数にresidを代入して保存する
残差と被説明変数wageの推定値(wagehat)の関係 • 重回帰の場合には,被説明変数の推定値と残差の関係を調べる(単回帰の場合は前のページと同じ結果) • wagehatの求め方 menugenr新しい変数を次のように作成 wagehat= @coefs(1)+@coefs(2)* educ または weaghat = wage - resid
非線形効果のとらえ方 • y = a + b ln(x) • ln(y) = a + bx • ln (y) = a + b ln(x) • y = a + b1* x + b2 * x2 • y = a + b / x • y = a + b1/ x + b2 * x
対数 対数での変化 =もとの変数での比率での変化 対数の性質から次の式が成り立つ lnは自然対数 レジュメでは,lnと書いたり,logと書いたりしますが,全て自然対数だと思ってください
ln(wage)とeducの散布図 こちらのほうが当てはまりが良いようにみえる
ln(wage)=a+b*educでの回帰 Genrというボタンをクリックすると新しい変数を作成する画面が表れる。 そこで 新変数名=計算式 で新しい変数を作成。ここでは次のようにする。 lnwage =log(wage) or lnwage =@log(wage) 回帰分析の結果
残差 分散不均一性は解消されたようにみえる
回帰分析の解釈 • 係数の意味 • 教育年数(educ)が1年増加すると賃金(wage)はどのくらい増加するか • 教育年数(educ)の係数が0であるという仮説は棄却できるか • 対数(賃金)が被説明変数の場合の係数 • educが1単位増加したとき,賃金の対数値が何単位増加するか 賃金が何%増加するか • 賃金に影響を与える変数にはどのような他の要因があるだろうか • 他の変数と賃金の単相関をみる • educを連続変数とすることの意味 • 学歴別 • 当てはまりの良さ • 因果関係(代替的なモデルが考えられる) • 教育年数 賃金 人的資本の蓄積 • 教育年数 その人の能力の証 • 高学歴者は学業に耐えられるだけの能力をもともと備えていた • スクリーニングの機能だけ(人的資本の蓄積ではない)
みせかけの関係 • Wooldridge のchapter2 example 2.12 • meap93.raw • 生徒の成績と高校のlunch programの関係 • lnchprg:perc. of studs. in sch. lunch prog • math10 :perc studs passing MEAP math(数学の学力テスト) • ミシガン州の高校 : 408校,1992-1993年 • 他の条件が一定なら,昼食への補助が生徒の成績にプラスの影響? • 推計結果 math10 = 32.14 - 0.319lnchprg n=408, R2=0.171 誤差項(他の条件)とlnchprgの相関あり lnchprgと相関があり,math10とも高い相関貧困家庭の比率?
練習問題1 • CEOSAL2.RAW salary: CEOの年棒(1000$) ceoten: その会社でのCEO在職期間(年) • salary, ceotenの平均値を求めよ • salary, ceoten, log(salary)のヒストグラムを描け • 在職期間が1年未満の人が何人いるか,最長の在職期間は何年か • salaryとceotenの散布図,log(salary)とceotenの散布図を描け • 次の回帰を行い,結果を報告せよ • log(salary) = a + b* ceoten + u
練習問題2 • WAGE2.RAW wage:月給 IQ: IQ のスコア • wageとIQの平均値,分散,最大,最小を求めよ • wageとIQのヒストグラムを描け • wageとIQ,log(wage)とIQの散布図を描け • wage = a + b * IQ + u の回帰を行い,結果を解釈せよ。 • log(wage) = a + b * IQ +u の回帰を行い,結果を解釈せよ。