440 likes | 565 Views
5.いろいろな確率分布. χ 2乗分布( chi-square distribution ) t - 分布( t distribution ) F 分布( F distribution ) 2 項分布( binominal distribution ) ポアソン分布( Poisson distribution. χ 2 分布 (chi-square). 確率変数X 1 ,X 2 ,・・・・ X n が互いに独立で同一の正規分布 N(μ, σ) に従うとき、統計量 の分布は、自由度 n - 1 の χ 2 分布に従う。
E N D
5.いろいろな確率分布 • χ2乗分布(chi-square distribution) • t- 分布(t distribution) • F分布(F distribution) • 2項分布(binominal distribution) • ポアソン分布(Poisson distribution
χ2 分布 (chi-square) • 確率変数X1,X2,・・・・ Xn が互いに独立で同一の正規分布 N(μ, σ) に従うとき、統計量の分布は、自由度 n- 1 のχ2 分布に従う。 • χ2 分布は母集団の分散の推定・検定に用いる。
t – 分布(t distribution) • 確率変数X1,X2,・・・・ Xn が互いに独立で同一の正規分布 N(μ, σ) に従うとき、とおくとき、統計量の分布は自由度 n – 1 の t 分布に従う。
t 分布は 母集団の平均の推定・検定に用いる。
t – 分布(別の表現) • 確率変数Xが N(0, σ) に従い、確率変数Yが自由度n-1のχ2分布に従うとき、統計量の分布は自由度 n – 1 の t 分布に従う。
F分布(F distribution) • 確率変数X, Yが独立で、各々自由度n1, n2のχ2分布に従うとき、統計量は、自由度(n1, n2)のF分布に従う。 • F分布は2つの母集団の分散比の推定・検定のときに利用される。
2項分布(binominal distribution) • 確率pで存在する当たりくじから、復元抽出でn個とりだしたとき、x個当たる確率。B(n,p)X=0, 1, 2, …….,nf(x)=nCx px (1-p) n-x • E(X)=np, V(X)=np(1-p) • B(n,p) は、n∞で、N(np, np(1-p)) となる。
ポアソン分布 (Poisson):rare probability • 2項分布において、npを一定値λに固定して、n→∞ としたものが ポアソン分布めったに起こらない事象が起こる確率分布λ=1だと、 P(X=x) = 0.36788/x!例:馬に蹴られて死ぬ人数、交通事故死亡者数
6.統計的推定(statistical estimation) 母集団 Population 母数 Parameterθ 例:平均μ 標本 Sample 推定値 Estimateθ* 例:Xbar ランダム抽出 • 不偏推定値(unbiased estimate)E(f(X1,X2,…….,Xn))=θとなるf(X1, X2,…..Xn) を不偏推定量という。 推定
不偏推定値(unbiased estimate) *母平均(mean) μの不偏推定値(unbiased estimate) *母分散σ2の不偏推定値(μ既知) *母分散σ2の不偏推定値(μ未知)
区間推定母分散(σ2)が未知で平均を推定 標準誤差(standard error)
もし、データ数が21だったら、自由度は20。両側で5%危険率で推定するとする。もし、データ数が21だったら、自由度は20。両側で5%危険率で推定するとする。 t(α)=2.086 標準誤差(SE)を計算して、 誤差範囲は、 t(α)・SE
自由度10、95%信頼区間なら X +- 2.228 S.E. • 自由度60、95%信頼区間なら X +- 2.000 S.E.無限大なら 1.96 S.E.
7.統計的検定(statistical testing)7.1 考え方(method) • 帰無仮説H0 検定統計量 棄却(裏に対立仮説)nil hypothesis statistical variable reject ランダムである。 = 確率は小さい∴ ランダムではない! 有意水準 5%、1%の 危険率
7.2 母平均の検定 • 正規母集団 N(μ,σ) とする。母分散が既知(σ2)、平均μ0(既知) • 帰無仮説H0:母集団の平均μはμ0である。対立仮説H1:母集団の平均μはμ0でない。 (本当は対立仮説を示したい) • 検定統計量
7.2 母平均の検定 • 正規母集団 N(μ,σ) とする。母分散が未知、平均μ0(既知) • 帰無仮説H0:母集団の平均μはμ0である。対立仮説H1:母集団の平均μはμ0でない。 (本当は対立仮説を示したい) • 検定統計量
7.3 平均の差の検定 • 2つの正規母集団とする。N(μ1,σ1), N(μ2,σ2)μ1とμ2が違うことを示したい。 • σ1,σ2既知 • σ1,σ2未知だが等しい。
7.4 母相関係数の検定 - t 分布 ー無相関が帰無仮説大きさNの標本の相関係数が r のとき
QBOの西風シアの5年と東風シアの5年の1月の帯状平均オゾン混合比の差(実線)。QBOの西風シアの5年と東風シアの5年の1月の帯状平均オゾン混合比の差(実線)。 単位はppmv。 有意性で差が有意な領域を影で示す。 影が90, 95, 99%で有意な差。t検定
図2 1月の50 hPaにおけるオゾン混合比。等値線の単位はppmv。 (a)QBOの西風シアの5年平均。 (b)QBOの東風シアの5年平均。 (c)差(西風-東風)。 影は有意性を表し図1と同じ。
7.5 ノンパラメトリック検定non-parametric test • 母集団の分布の型に関する情報を仮定せずに検定する手法。これまで述べた検定は母集団が正規分布をすると仮定したが、その仮定を行わない。 • それぞれの検定の名前がある。Wilcoxen’s rank sum test
ウィルコクスン検定Wilcoxen’s rank sum test • 2つの分布型は同じだが、位置がずれている。これを検定する順位和検定。 2つのグループの標本を1つにまとめて、Xij の小さいほうから順位を付けたときの順位を rij とする。
帰無仮説:2つのグループの分布の中央値は同じである。帰無仮説:2つのグループの分布の中央値は同じである。 (グループG1の順位の総和) • 検定量Wは (N1,N2)が小さいときは、ウィルコクスン検定の数表で決める。 大きいときは、Wは以下の正規分布に近似されることを使う。
ウィルコクスン検定(中央値の差)Wilcoxen’s test • アンサリー・ブラッドレィ検定(分布の広がり)Ansari-Bradley test • ラページ検定(上記を同時に検定)Lepage test • モンテカルロ法(いろいろ場合によって統計量を考える。サンプルを乱数で発生させ、確率を求める。コンピュータ向き)
8.重回帰分析(Multiple Regression Analysis) • P個の説明変数 x1, x2,….,xpから目的変数y を予測する。y = f( x1, x2, … , xp) + e • 線形重回帰モデルY = a0 + a1x1 + a2X2 + ….. + apxp + e
データ X35 変数番号 データ番号
データのn組(n>=p+1)から最小2乗法により係数の最良不偏推定値を求める。ai : y の xiに関する偏回帰係数。以下の仮定をおく • eαの期待値はゼロ:E[eα]=0: 不偏性 • eαと eα’ は互いに独立:E[eαeα’]=0: 独立性 • eαの分散はすべて等しい:E[eα2]=σ2: 等分散性 • Eαは N(0, σ2) に従う。: 正規性予測誤差の平方和を最小にするように、係数を求める。係数に関する連立方程式を正規方程式という。
8.3 分散分析 -回帰の有意性 全変動(分散)=残差変動 + 回帰による変動
重回帰の分散分析表 F は a1=a2=….=0 の帰無仮説のもとで、自由度(p, n-p-1) の F 分布となる。(全体として回帰式が意味があるかどうかの検定となる)
R2を寄与率または決定係数という回帰で全分散が説明できる割合。R2を寄与率または決定係数という回帰で全分散が説明できる割合。 F検定が R2の有意性検定と一致。 • 重回帰の注意点 • ai の値そのもので寄与は決まらない。 • Xiと Xjに相関があるとき、注意。単回帰と符号さえ変わる。