320 likes | 766 Views
数理統計学 ( 第四回) 分散の性質と重要な法則. 浜田知久馬. 分散についての性質. V[X+Y] = E[(X+Y - μ x - μ Y ) 2 ] = E[(X - μ x ) 2 +(Y - μ x ) 2 +2 (X - μ Y ) (Y - μ Y ) ] = E[(X - μ x ) 2 ]+ E[(Y - μ Y ) 2 ] +2E[(X - μ x ) (Y - μ Y )] = V[X]+V[Y]+2 ・ Cov[X,Y ] 独立のときは , V[X+Y] = V[X]+V[Y]. 分散についての性質. aは定数
E N D
数理統計学(第四回)分散の性質と重要な法則数理統計学(第四回)分散の性質と重要な法則 浜田知久馬 数理統計学第4回
分散についての性質 V[X+Y]=E[(X+Y-μx-μY)2] =E[(X-μx)2+(Y-μx)2 +2 (X-μY)(Y-μY) ] = E[(X-μx)2]+ E[(Y-μY)2] +2E[(X-μx)(Y-μY)] =V[X]+V[Y]+2・Cov[X,Y] 独立のときは, V[X+Y]=V[X]+V[Y] 数理統計学第4回
分散についての性質 aは定数 V[a+X] = E[(a+X-a-μx)2] =V[X] V[aX]=E[(aX-aμx)2] =E[a(X-μx)2] =a2E[(X-μx)2] =a2 V[X] E[a+X]=a+E[X],E[aX]=a・E[X], 数理統計学第4回
分散についての性質 Z=a1X1+ a2X2+・・・+ apXp V[Z]=ΣΣaiajCov[Xi,Xj] =Σai2 V[Xi]+ΣΣ2aiajCov[Xi, Xj] i < j X1, X2, ・・・ ,Xpが互いに独立の場合 V[Z] =Σai2 V[Xi] =a12V[X1]+a22V[X2]+・・・+ ap2V[Xp] (分散の加法性) 数理統計学第4回
分散についての性質 Z=a1X1+ a2X2 V[Z]= V[a1X1+ a2X2] = E[(a1X1+ a2X2 -a1μ1- a2μ2)2] = E[(a1X1-a1μ1 + a2X2 -a1μ2)2] = E[(a1X1-a1μ1)2 ] + E[(a2X2-a2μ2)2 ] +2E[(a1X1-a1μ1)(a2X2-a2μ2)] = a12V[X1]+a22V[X2] +2a1a2Cov[X1, X2] 数理統計学第4回
分散・共分散行列 3変数の場合 V[X1]Cov[X1, X2]Cov[X1, X3] V= Cov[X2, X1] V[X2] Cov[X2, X3] Cov[X3, X1] Cov[X3, X2] V[X3] 一般にp変数ある場合, 分散・共分散行列はp×pの対称行列になる. 数理統計学第4回
行列表現 aT=[a1,a2,・・・, ap] a:p行のベクトル xT=[X1,X2,・・・,Xp]x:p行のベクトル V:分散・共分散行列(p×p) Z=aTx V[Z]=aT Va Z=a1X1+ a2X2+ a3X3 の場合について V[Z]を書き下せ. 数理統計学第4回
Z=a1X1+ a2X2+ a3X3の分散 Z=a1X1+ a2X2+ a3X3 V[Z]=aT Va =a12V[X1]+ a1a2Cov[X1,X2]+ a1a3Cov[X1,X3] +a2a1Cov[X2,X1]+ a22V[X2]+a2a3Cov[X2,X3] +a3a1Cov[X3,X1]+ a3a2Cov[X3,X2]+ a32V[X3] 数理統計学第4回
共分散の計算 Z1=a1X1+ a2X2+ ・・・+a3X3=aTx Z2=b1X1+b2X2+ ・・・+b3X3=bTx のとき Cov[Z1,Z2]= Cov[aTx,bTx] =ΣaibjCov[Xi,Xj] =aT Vb V[Z1]=Cov[aTx,aTx] =aT Va 数理統計学第4回
共分散の計算 Z1=a1X1+ a2X2+ a3X3 Z1=b1X1+ b2X2+ b3X3 Cov[Z1,Z2]=aT Vb =a1b1V[X1]+ a1b2Cov[X1,X2]+ a1b3Cov[X1,X3] +a2b1Cov[X2,X1]+ a2b2V[X2]+a2b3Cov[X2,X3] +a3b1Cov[X3,X1]+ a3b2Cov[X3,X2]+ a3b3V[X3] 数理統計学第4回
分散の加法性の応用 平均値の分散は? X1, X2, ・・・ ,Xnが互いに独立に分散σ2の 分布にしたがうとき 数理統計学第4回
分散の加法性の応用 E[X]=0,V[X]=32=9 E[Y]=0,V[Y]=42=16 でかつXとYが独立のとき X+Yの期待値と分散は? X-Yの期待値と分散は? 数理統計学第4回
乱数による確認実験 data data; do i=1to1000; x=3*rannor(5963); y=4*rannor(5963); z1=x+y;z2=x-y;output; end; procmeansmean var stdmaxdec=2;run; 数理統計学第4回
要約統計量 変数 平均値 分散 標準偏差 --------------------------------- x 0.05 8.72 2.95 y -0.05 16.07 4.01 z1 0.01 25.95 5.09 z2 0.10 23.65 4.86 ---------------------------------- 数理統計学第4回
演習問題 X1,X2,・・・,X6が確率変数でそれぞれ 独立に正規分布N(μ,σ2)に従っているとき,1)~7)の期待値と分散を示せ. 0) Xi: 解答例 期待値μ,分散σ2 数理統計学第4回
演習問題 数理統計学第4回
中心極限定理Central Limit Theorem 多くの分布が一山分布になるのはなぜだろうか? 例)センター入試,身長,血圧 中心:分布の中心,平均値は 極限:nを大きくすると 正規分布にしたがう. 「和や平均値の分布は山型の分布にしたがう」 数理統計学第4回
平均値の2つの性質とSE 1)平均値の分散(バラツキ)は生データの1/N,標準偏差に直せば1/√Nになる. 2)Nがある程度大きくなれば,平均値の分布は正規分布になる. 数理統計学第4回
乱数実験 A)0,1の一様分布(0~1の間を等しい確率でとる)にしたがう乱数を1万個発生さる. B)一様分布にしたがう乱数を4万個発生させ,4個づつ組にして平均値を計1万個計算する. C)一様分布にしたがう乱数を9万個発生させ,9個づつ組にして1万個の平均値を計算する. 数理統計学第4回
400 度 数 200 0 0.00 0.30 0.60 0.90 Y1 生データのヒストグラム A 数理統計学第4回
1000 度 数 500 0 0.00 0.30 0.60 0.90 Y4 4個の平均のヒストグラム B 数理統計学第4回
1500 度 1000 数 500 0 0.00 0.30 0.60 0.90 Y9 9個の平均のヒストグラム C 数理統計学第4回
実験結果のまとめ 平均値 標準偏差 分散 A)生データ 0.499 0.2890.0838 B)4個の平均 0.4990.144 0.0206 C)9個の平均 0.500 0.095 0.00906 数理統計学第4回
大数の法則(law of large numbers) 平均値はnを大きくすると,真の値に収束する. 平均値→E(X)=μ (n→∞) limP(|平均値-μ|≧ε)=0 n→∞ マルコフの不等式(Markov’sinequality) チェビシェフの不等式(Chebyshev’s inequality) 数理統計学第4回
マルコフの不等式 X≧0:非負の確率変数 c>0:正の定数 P(X ≧c)≦E(X)/c 例)交通事故による死亡が10を越える確率は? Y=0ifX<c cifX ≧ c 常にY≦Xなので→ E(Y)≦E(X) E(Y)=0×P(Y=0)+c×P(Y=c)=c×P(X ≧ c) E(Y)=c×P(X ≧ c) ≦E(X) P(X ≧c)≦E(X)/c 数理統計学第4回
マルコフの不等式 Y=X Y c 0 c X 数理統計学第4回
マルコフの不等式の応用 宝くじで1等2億円が当たる確率は? X:宝くじの賞金金額 P(X ≧ 2億円) E(X)=150円,c= 2億円 P(X ≧ c)≦E(X)/c = 150円/ 2億円=1/133万 正確な確率は1/500万 数理統計学第4回
チェビシェフの不等式 E(X)=μ,V(X)=σ2 P(|X-μ| ≧c)≦σ2/c2 Y=( X-μ)2とおいてマルコフの不等式を適用 P(Y ≧c2)≦E(Y)/c2 = σ2/c2 Y ≧c2 ⇔ |X-μ| ≧c なので P(Y ≧c2) =P(|X-μ| ≧c) 数理統計学第4回
チェビシェフの不等式の意味 σ2=1のとき c チェビシェフの上限 正規分布 110.32 20.25(1/22)0.05 30.11(1/32)0.003 40.06(1/42) <0.0001 数理統計学第4回
日本人身長の例(浜田世代) 男性 平均:170.1SD:5.6 単位(cm) 平均±SD :164.5~175.7 平均±2SD:158.9~181.3 平均±3SD:153.3~186.9 平均±4SD:147.7~192.5 平均±5SD:142.1~198.1 数理統計学第4回
日本人身長の例(浜田世代) 女性 平均:157.3SD:5.0 単位(cm) 平均±SD :152.3~162.3 平均±2SD:147.3~167.3 平均±3SD:142.3~172.3 平均±4SD:137.3~177.3 平均±5SD:132.3~182.3 数理統計学第4回
大数の法則 にチェビシェフの不等式を適用すると n→∞のとき右辺は0に収束するから 数理統計学第4回