380 likes | 764 Views
数理統計学 ( 第一回) 確率変数とは?. 浜田知久馬. 世の中は不確定なことが多い. 決まりきったことばかりとは限らない . 予想される値は決まっていてもばらつく . このようなとき,確率変数によって,物事を確率的に記述できると便利なことが多い. 確率変数 X. 条件 1 ) X が取り得る値はある範囲(標本空間: sample space )に定まっている. 条件 2 ) X はある時点が過ぎると値が定まる「実現値 」 が,それまでは値が不確定である. 条件 3 ) X の取り得る値についての確率分布は定まっている.. サイコロの目の例.
E N D
数理統計学(第一回)確率変数とは? 浜田知久馬 数理統計学第1回
世の中は不確定なことが多い 決まりきったことばかりとは限らない. 予想される値は決まっていてもばらつく. このようなとき,確率変数によって,物事を確率的に記述できると便利なことが多い. 数理統計学第1回
確率変数X 条件1)Xが取り得る値はある範囲(標本空間:sample space)に定まっている. 条件2)Xはある時点が過ぎると値が定まる「実現値」が,それまでは値が不確定である. 条件3)Xの取り得る値についての確率分布は定まっている. 数理統計学第1回
サイコロの目の例 条件1)1,2,3,4,5,6 条件2)サイコロを投げると目は定まる 条件3)Pr{X=i}=1/6 i=1,2,3,4,5,6 サイコロが壷の中で投げられていたら いかさまだったら 数理統計学第1回
隣の人の明日の登校時間 条件1)0時~24時 条件2)明日来てみればわかる. 条件3)8時50分位を中心にして,ある バラツキを持った分布にしたがう. 明日自分が休んでしまったら. 総武線が遅れてしまったら. 数理統計学第1回
演習 1)自分の身近なもので確率変数を3つあげること. 2)条件1),条件2),条件3)を上げること. 3)条件1),条件2),条件3)を動かす要因を考えること. 数理統計学第1回
天気予報より きょう4/22 (月) の 天気4/23 時間帯 6時-12時12時-18時18時-24時0時-6時 降水確率30%20% 10% 10% 予想気温 (℃)18 / - 23 / 13 週間予報4/24 (水) 4/25 (木) 4/26 (金) 4/27 (土) 4/28 (日) 降水確率 30% 50% 50% 40% 20% 予想気温 (℃) 23/14 20/15 16/12 19/10 21/12 数理統計学第1回
0.02 密 度 0.01 0 0 12 24 36 48 60 72 84 96 x x 20 40 60 80 x 統計工学Ⅱの得点 数理統計学第1回
モーメント N 88.0000 重みの合計 88.0000 平均値 42.6477 合計 3753.0000 標準偏差 22.9863 分散 528.3687 歪度 0.2988 尖度 -1.2634 無修正平方和 206025.000 修正平方和 45968.0795 変動係数 53.8980 標準誤差 2.4503 パーセント点 100% 最大値 90.0000 99.0% 90.0000 75% Q3 60.0000 97.5% 80.0000 50% 中央値 33.5000 95.0% 80.0000 25% Q1 23.5000 90.0% 80.0000 0% 最小値 4.0000 10.0% 15.0000 範囲 86.0000 5.0% 13.0000 Q3-Q1 36.5000 2.5% 10.0000 最頻値 60.0000 1.0% 4.0000 統計工学ⅠとⅡの平均得点 数理統計学第1回
確率変数と実現値 確率変数:ある時点までは,確率分布によって記述される. 実現値:ある時点を過ぎて定まった値のことを実現値または観測値と呼ぶ 確率変数は大文字で,実現値は小文字で表現するのが一般的である. X→x 数理統計学第1回
確率変数の分布の記述法 1)確率(密度)関数 2)(累積)分布関数 3)%点 4)期待値,分散 5)モーメント 6)母関数 数理統計学第1回
確率分布の記述 確率分布とは,標本空間における確率という名の量の分布である. 確率の和は1である 離散分布:確率関数 Σp(x)=1 連続分布:確率密度関数 ∫f(x)dx=1 p(x)≧0,f(x)≧0 身長は離散分布か,連続分布か? お金は離散分布か,連続分布か? 数理統計学第1回
サイコロの目の確率分布 確率 1/6 123456 数理統計学第1回
連続分布の確率 9:00ちょうどに大学に来る確率はいくらか? 9:00と9:10に来る可能性はどちらが大きいか? 9:00から9:10に来る確率は? 8:59:30から9:00:30に来る確率は? 確率密度(1/時間)は定義できる. ある区間(a,b)に入る確率:∫abf(x)dx 数理統計学第1回
正規分布の確率密度関数 , 数理統計学第1回
標準正規分布の確率密度関数 数理統計学第1回
Carl Friedrich Gauss 1777-1855 ガウスについては下記に詳しい http://www-groups.dcs.st-and.ac.uk/~history/Mathematicians/Gauss.html 数理統計学第1回
分布関数 確率分布の別の記述方法 F(x):x以下になる確率(0~1) 離散型の分布: 例) サイコロで3以下になる確率 連続型の分布: 例) 9:00までに来る確率 数理統計学第1回
サイコロの目の例 6/6 5/6 4/6 3/6 2/6 1/6 0/6 12345 6 数理統計学第1回
正規分布の例 数理統計学第1回
分布関数と確率関数 離散型の分布 p(x)=F(x)-F(x-) 連続型の分布 f(x)=dF(x)/dx * x-の意味はxの-の側から単調に 増加して収束することを意味する. 数理統計学第1回
H13年度17歳の体格 もしある確率変数の分布が定まれば,様々な 情報を得ることができる. 身長 平均 SD 体重 平均 SD 男子 170.9 5.76 62.8 10.47 女子 158.0 5.32 53.2 8.11 仮に正規分布に従っているとすれば,ある範囲に入る確率,ある値を超える確率を分布関数,確率密度関数から求められる. 数理統計学第1回
演習 コインを4枚投げたときの,表が出る回数の 確率関数と分布関数を記述せよ. 数理統計学第1回
表の回数の分布 二項分布(n,p) p(x)=nCxpx(1-p)n-x 表表表表 表表表裏 表表裏表 表裏表表 裏表表表 表表裏裏 表裏表裏裏表表裏 表裏裏表 裏表裏表 裏裏表表 裏裏裏表 裏裏表裏裏表裏裏 表裏裏裏 裏裏裏裏 確率=(1/2)× (1/2) ×(1/2) ×(1/2)=1/16 数理統計学第1回
SASのプログラム例 data data;phi=0.50;n=4; do y=0to4; p=pdf('binomial',y,phi,n); F=cdf('binomial',y,phi,n); output;end; procgplot;plot p*y/vzero; symbol1i=needle; procgplot;plot f*y/vzero; symbol1i=steplj; 数理統計学第1回
確率関数 数理統計学第1回
分布関数 数理統計学第1回
EXCELのBINOMDIST関数 2項分布の確率関数 or 分布関数 BINOMDIST(成功数, 試行回数, 成功率, 関数形式) 成功数試行回数 に含まれる成功の回数を指定 試行回数 独立試行の回数を指定 成功率1 回の試行が成功する確率を指定 関数形式0:確率関数 1:分布関数 例BINOMDIST(1,4,0.5,0)=0.25 BINOMDIST(1,4,0.5,1)=0.3125 数理統計学第1回
EXCELによる計算 数理統計学第1回
%点:percentile 分布関数:確率密度関数の積分 →簡単な関数では表せない 数表 x→F(x)F(x)=α →x 下側100α%点:F(x)=αとなるxの値 上側100α%点:F(x)=1-αとなるxの値 両側100α%点:F(x)=1-α/2となるxの値 50%点:メジアン 25,75%点:四分位点 数理統計学第1回
NORMDIST関数 正規分布の確率密度関数 or 分布関数 NORMDIST(x, 平均, 標準偏差, 関数形式) x関数に代入する数値を指定 平均 分布の算術平均 を指定 標準偏差 分布の標準偏差を指定 関数形式0:確率密度関数 1:分布関数 例NORMDIST(-1,0,1,0)=0.241971 NORMDIST(-1,0,1,1)=0.158655 数理統計学第1回
NORMINV関数 標準正規累積分布関数の%点の値を返す。 書式 NORMINV(確率, 平均, 標準偏差) 確率 正規分布における確率を指定 平均 分布の算術平均 (相加平均) を指定 標準偏差 分布の標準偏差値を指定 例 NORMINV(0.95,0,1)=1.644853 数理統計学第1回
正規分布の数表の作成 数理統計学第1回
SASの乱数関数 NORMAL(seed) RANNOR(seed) 正規分布 RANBIN(seed,n,p)2 項分布 RANCAU(seed) Cauchy 分布 RANEXP(seed) 指数分布 RANGAM(seed,alpha) ガンマ分布 RANPOI(seed,lambda) ポアソン分布 RANTBL(seed,p1,..pi,..pn) 指定した重み RANTRI(seed,h) 三角分布 RANUNI(seed) UNIFORM(seed) 一様乱数 数理統計学第1回
分布関数の%点 BETAINV(p,a,b) ベータ分布 CINV(p,df<,nc>) カイ 2 乗分布 FINV(p,ndf,ddf<,nc>) F 分布 GAMINV(p,a) ガンマ分布 PROBIT(p) 標準正規分布 TINV(p,df<,nc>) t 分布 数理統計学第1回
確率(密度)関数 POISSON((lambda,n) ポアソン分布 PROBBETA(x,a,b) ベータ分布 PROBBNML(p,n,m) 2 項分布 PROBCHI(x,df<,nc>) カイ 2 乗分布 PROBF(x,ndf,ddf<,nc>) F 分布 PROBGAM(x,a) ガンマ分布 PROBHYPR(nn,k,x<,or>) 超幾何分布 PROBNEGB(p,n,m) 負の 2 項分布 PROBNORM(x) 正規分布 PROBT(x,df<,nc>) スチューデントの t 分布 数理統計学第1回
演習1 指数分布(連続分布) 機械(コンピュータ等)の故障するまでの時間は指数分布にしたがうことが知られている. 指数分布では分布関数は F(x)=1 - exp(-λx) となる. λ=1として,指数分布の分布関数と確率 密度関数を図示せよ. ヒント exp(-1)=0.3679,exp(-2)=0.1353 exp(-3)=0.0498,exp(-4)=0.0183 数理統計学第1回
演習2 ポアソン分布(離散分布) 稀な事象(交通事故等)の生起数はポアソン分布にしたがうことが知られている. ポアソン分布では確率関数は p(x)= λxexp(-λ)/x! x=0,1,2,・・・ となる. λ=2として,ポアソン分布の分布関数と 確率関数を図示せよ. ヒント exp(-2)=0.1353 数理統計学第1回