420 likes | 782 Views
数理統計学 ( 第五回) 統計的推測とは?. 浜田知久馬. 確率分布. 数理統計学で確率分布を勉強. 確率分布は便利 確率分布がわかれば , 様々な事象を確率的に記述できる.(同時 , 周辺 , 条件付) 確率分布は母数によって定まる. 母数をどう求めればよいのか?. 推定の問題. ある目的で , ある確率変数 Y をn回観測し , 標本 Y =(Y 1 , Y 2 , ・・・ , Y n ) を得る . ・標本 Y の分布はある分布族に属している . 「分布を規定する 母数 は未知である」
E N D
数理統計学(第五回)統計的推測とは? 浜田知久馬 数理統計学第5回
確率分布 数理統計学で確率分布を勉強. 確率分布は便利 確率分布がわかれば,様々な事象を確率的に記述できる.(同時,周辺,条件付) 確率分布は母数によって定まる. 母数をどう求めればよいのか? 数理統計学第5回
推定の問題 • ある目的で,ある確率変数Yをn回観測し, 標本Y=(Y1, Y2,・・・, Yn)を得る. ・標本Yの分布はある分布族に属している. 「分布を規定する母数は未知である」 • 「標本Yの実現値yに基づいて未知母数の真の値がいくらであるか評価,断定する問題を「推定の問題」という. 数理統計学第5回
ダーウィンの植物の丈のデータ(単位インチ)ダーウィンの植物の丈のデータ(単位インチ) ─────────────────────────────── No.自家受精 他家受精 No.自家受精 他家受精 ─────────────────────────────── 117.37523.5 916.518.25 220.37512 101821.625 32021 1118.25 23.25 42022 121821 518.37519.125 1312.75 22.125 618.62521.5 1415.523 718.62522.125 151812 815.25 20.375 ─────────────────────────────── 平均 17.70820.192 標準偏差 2.0243.617 ─────────────────────────────── 数理統計学第5回
母数推定の前提 自家受精群と他家受精群に別々の正規分布をあてはめ n個(n=15)の確率変数Yiが互いに独立に同一の正規分布にしたがう Y1,Y2,Y3,・・・,Yn ~N(μ,σ2) i.i.d.(independent identically distributed) 数理統計学第5回
点推定 • ある未知母数 bの真の値を推定したいという問題を考える. 一つの答え方: • 観測変数 Yの統計量 t(Y) を一つ用意 • 観測値がデータ yとして得られたら,そのデータを代入して得られる関数値 t(y) が 「母数 bの真の値である」 と断定 • このような方式を「(点)推定」estimation と言う, 数理統計学第5回
推定と推定量 • 推定に使う関数 t(Y) を「推定量」 estimator,データを代入して得られる値 t(y) を「推定値」 estimate という. • 推定の問題において,数理統計学が問題にすることは,どんなやり方が良いかである. • どんな推定量が良い推定量? 数理統計学第5回
区間推定 • 別の答え方 • 2つの統計量tL(Y), tU(Y)を用意する. • Yの実現値yを得たら,それを代入して得られる値tL(y)~tU(y)の範囲に真の値があるとする. • このような形式を「区間推定」 intervalestimationという. 数理統計学第5回
良い推定量の規準 • 良さを議論するには規準 criterion が必要 • 一つの視点: 定性的,資格条件を限定しておいて,その中である規準量が最大(あるいは最小)となるものを良いものとする. たとえば? • 定性的条件:不偏性,線形性 • 定量的規準:分散最小性 • 不偏性とは?分散最小性とは? 数理統計学第5回
精度, 偏り,正確さ 不偏で精密偏りあるけど精密 不偏だけど精密でない偏りありかつ 精密でない 数理統計学第5回
点推定の良さの基準 • βの推定量bがあるとする. • 推定量の良さの基準で最も一般的なのは平均二乗誤差(Mean Square Error:MSE) • MSE=E[(b-β)2] = E[(b-β)2]= E[(b-E[b]-β+E[b])2] = E[(b-E[b])2]+ E[(E[b]-β)2] +2(E[b]-β) E[b-E[b]] 数理統計学第5回
MSE MSE=E[(b-E[b])2]+ E[(E[b]-β)2] V[b] bias 推定量の分散 推定量の偏り 両方を同時に最適化できるか? 分散を0 → 常にb=0 V[b]=0 数理統計学第5回
推定での方法論的課題 どんな推定量が良い推定量? 定性的条件,例えば 不偏性=期待値が未知母数に一致 線形性=推定量がYの線形式を 満たすものの中で ある規準量,例えば分散を最小(最良,有効)にするものを良いとする⇒最良線形不偏推定量 数理統計学第5回
最良線形不偏推定量を求める方法はあるか? • 一般的な方法はない. 存在しないことも多い. • 原理的に良い推定量を導きやすい原理は? ・最尤法 ・最小2乗法 ・モーメント法 数理統計学第5回
クラメル・ラオ(Cramer-Rao)の不等式 数理統計学第5回
クラメル・ラオ(Cramer-Rao)の不等式 不偏推定量の分散の下限についての不等式 (不偏推定量の分散はこれより小さくならない) θを不偏推定量とすると V[θ]≧1/I I:フイッシャーの情報量(Fisher information) 等号が成り立つ場合は,不偏推定量の中で 分散が最小(有効)となる. ^ ^ 数理統計学第5回
証明にあたって利用すること ^ • 不偏推定量の定義 E[θ(Y)]=θ • 確率密度関数の和は1 ∫f(y,θ) dy=1 • E[B]=0のとき, E[A・B]=Cov [A,B] ,V[B]= E[B2] {Cov [A,B] = E[A・B]-E[A] E[B]} 4) 5)微分と積分の交換可能性 6) Cov [A,B]≦V[A] V[B] 相関係数の絶対値は1を越えない 数理統計学第5回
クラメル・ラオ(Cramer-Rao)の不等式 不偏であるためにはθが1単位増加すれば期待値も1増加する 数理統計学第5回
クラメル・ラオ(Cramer-Rao)の不等式 積分と微分の交換可能性,傾きの期待値は0 θを動かしても確率密度の和は不変 数理統計学第5回
クラメル・ラオ(Cramer-Rao)の不等式 数理統計学第5回
クラメル・ラオ(Cramer-Rao)の不等式 不偏推定量θの分散が, V[θ]=1/I を満たせば, θは 一様最小分散不偏推定量 (Uniformly Minimum Variance Unbiased estimator, UMVU) である. ^ ^ ^ 数理統計学第5回
2項分布の場合 数理統計学第5回
2項分布の場合 数理統計学第5回
最尤法(Maximum Likelihood method) • 確率(密度)関数を未知母数の関数とみなしたものが,尤度(likelihood) • 確率が最大の母数の値は,観測値Yの関数 これを未知母数の推定量とする. • 最尤法,得られる推定量が最尤推定量 確率が最大になるように推定 (MLE:Maximum Likelihood Estimator) 数理統計学第5回
最小二乗法 • 観測変数Yの値と,モデルから予測される差の2乗和を最小にする母数の値を推定量とする方法 Σ(Yi-β0-β1Xi)2 を最小にするようにβ0とβ1を推定 数理統計学第5回
最小2乗法の模式図 × Y=β0+β1X Y X X × × 0 数理統計学第5回 X
モーメント法 分布のモーメントを,次数の低い方から未知母数の数pだけ求め,それを対応する標本モーメントと等しいとおき,母数の推定量を構成する方法を“モーメント法”(momentmethod)という 分布の期待値=データの平均 E[X]=μ :Σxi/N 分布の2次モーメント=データの2乗和 E[X2]=μ2 +σ2 :Σxi2/N 数理統計学第5回
用語 最尤原理(maximum likelihood principle) 最尤法(maximum likelihood method) 最尤推定量(maximum likelihood estimator) 尤度(likelihood) 対数尤度(log likelihood) Fisherの情報量(Fisher's information) 数理統計学第5回
尤度,最尤推定量,Fisherの情報量 尤度(likelihood) :尤(もっともらし)さの程度 を確率で評価した指標 最尤推定量:尤度が最大になるように母数 を推定する原理 Fisherの情報量:最尤推定量の推定精度を 測る指標 数理統計学第5回
最尤推定の例 コインを10回投げて7回表が出たとする. このような事象が起きる確率は? 確率分布として 2項分布B(n=10,π)を仮定すると p=10Cyπy(1-π)10-y 確率pは母数πの関数である.確率を母数の関数と考えたのが尤度(L:likelihood) 確率関数:πを固定したyの関数 尤度関数: yを固定したπの関数 数理統計学第5回
最らしいπは? π 確率 1 0.1 0.00001 2 0.2 0.00079 3 0.3 0.00900 4 0.4 0.04247 5 0.5 0.11719 6 0.6 0.21499 7 0.7 0.26683 8 0.8 0.20133 9 0.9 0.05740 数理統計学第5回
尤度の計算プログラム data q6; do phi=0.10to0.90by0.02; l=10*9*8/(3*2*1)*phi**7*(1-phi)**3; output;end; procgplot; plot l*phi/href=0.7; symbol1i=spline v=none h=4w=4; run; 数理統計学第5回
πの関数の尤度 数理統計学第5回
最尤推定 尤度(L)を最大にするように母数を求める. 尤度の最大化 ⇒ 対数尤度の最大化 母数空間の全てのπについてLを計算するか? 山の頂上では傾き0 対数尤度をπで微分して導関数を求め, 導関数が0になるπを求める. 数理統計学第5回
西遊記ひたすら西を目指す. 数理統計学第5回
最尤法ひたすら山の頂上を目指す. 数理統計学第5回
山の頂上にいるのは? 数理統計学第5回
最尤推定量の誘導1 数理統計学第5回
最尤推定量の誘導2 数理統計学第5回
コインを100回投げて70回表が出たときの尤度 数理統計学第5回
演習問題 ポアソン分布の推測 ポアソン分布の確率関数p(x)は, p(x)=λx・exp(-λ)/x! となる.λが母数であり,xは確率変数の実現値で0、1、2・・・の値をとるものとする. 1)λ=1のとき,Xが1以上の値をとる確率を計算せよ.ヒント exp(1)=2.718 2)お年玉付年賀状の当たり数がx=5となった.当たり数の分布にポアソン分布を仮定して,このようなデータが得られた場合の尤度と対数尤度を計算せよ. 3)対数尤度を,λで微分せよ.また1次微分関数の値が0になるようにλを求めよ. 数理統計学第5回