570 likes | 624 Views
放射線の計算や測定における統計誤差. 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布( 1H ) 最小二乗法( 1H ). 1.1 分散と標準偏差 ある量 x を n 回だけ繰り返し測定・計算し、 i 番目の x の値を x i とする。 平均 は. cm, cGy. (単位の例). 分散 s 2 : 1 個 1 個の x のばらつきの程度を表す 。 個々 の x の値の 平均 からの差の 2 乗の 平均. cm 2, cGy 2. 標準偏差 s :分散の平方根。 x と同じ次元であるので、 x のばらつきを表すのに多用される 。.
E N D
放射線の計算や測定における統計誤差 • 「平均の誤差」とその応用(1H) • 2項分布、ポアソン分布、ガウス分布(1H) • 最小二乗法(1H)
1.1 分散と標準偏差 ある量xをn回だけ繰り返し測定・計算し、i番目のxの値をxiとする。 平均は cm, cGy (単位の例) 分散s2:1個1個のxのばらつきの程度を表す。 個々のxの値の平均からの差の2乗の平均 cm2, cGy2 標準偏差s:分散の平方根。 xと同じ次元であるので、xのばらつきを表すのに多用される。 cm, cGy
平均と分散の練習問題 • 5本の人参があり、その長さが6, 7, 8, 9, 10 cmであったとする。 • 人参の長さの平均はいくらか? • 8 cm • 人参の長さの分散はいくらか? • 2 • 人参の長さの標準偏差はいくらか? • 1.41 cm
合計の誤差と平均の誤差の直感的な説明 • 100 cpmを1分間測定 100±10 • N=100 x 1 min =100, σ=1001/2=10 • 100 cpmを1分測定、4回繰り返し 400±20 • N=100 cpm x 1 min x 4 =400, • σ=4001/2 = 20 • この”20”は10 x 41/2でも計算ができる。 n個のxiの合計の誤差syは、xiの誤差の倍である。 • 上記を4 で除して1分当たりに戻す 100±5 • この”5”は、10/41/2でも計算できる。 n個のxiの平均の誤差は、xiの誤差のである。
合計の誤差と平均の誤差の練習問題 • 5本の人参があり、その長さが6, 7, 8, 9, 10 cmであったとする。 • 人参の長さの合計はいくらか? • 40 cm • 人参の長さの合計の標準偏差はいくらか? • 3.16 cm • 人参の長さの平均はいくらか? • 8 cm • 人参の長さの平均の標準偏差 はいくらか? • 0.63 cm
1.2 合計(y)の誤差 yの分散は、xiの偏差Δxiを用いて次式で計算される。(誤差の伝搬) ここで、偏微分の式を書く都合上、yの分散sy2をΔy2と書いた。 yの標準偏差syはyの分散sy2の平方根である。 n個のxiの合計の誤差syは、xiの誤差の倍である。
1.3 xiの平均xavの誤差 xavの分散は、xiの偏差Δxiを用いて次式で計算される。(誤差の伝搬) ここで、偏微分の式を書く都合上、xavの分散sxav2をΔxav2と書いた。 xavの標準偏差sxavはxavの分散sxav2の平方根である。 n個のxiの平均の誤差は、xiの誤差のである。
中心極限定理 • 分布がどのようなものであっても、平均μ、分散σ2をもつ母集団からとられた大きさnの標本の平均値xavの分布は、nが大きくなるとき正規分布N(μ、σ2/n)に近づく。 宮川公男、「基本統計学」 • モンテカルロ法の数学的裏付け
図3 xの標準偏差 図4 合計yの誤差sy
分散s2の数値計算 • ExcelのRAND()関数:(0,1)の乱数を発生 • 10個の乱数の平均と分散s2を計算。 • 100組を計算し、s2の平均を調べる。 • 乱数の数n=9 ~ n=1に変えて繰り返す。
s2のエクセルでの計算結果 確かに、nに依存してs2が変化した!
サンプル数nに依存しない分散s2 • 平均の期待値μ(=0.5)との差の2乗和の平均 • エクセルでの数値計算 • 10個の乱数の分散s2を計算。 • 100組を計算し、s2の平均を調べる。 • n=9 ~ n=1に変えて繰り返す。 s2 ↓
s2のエクセルでの計算結果 確かに、s2はnに依存しない。 μは通常、未知数なので、s2は分散の計算に使用できない →困った!
とりあえず、s2の期待値は? s2の期待値は? E(s2)=E(s2) x (n-1)/n
サンプル数nに依存しない分散(2) s2の1/nを1/(n-1)に変更した次式で、サンプル数nに依存しない分散を求める。 これを、標本分散あるいは分散の不偏推定値と呼ぶ教科書もある。 図1 分散の値の比較
+ μに対する分散 xavに対する分散 xavの分散 = データ数に依存しない分散の証明 平均の期待値μに対する分散の式を変形する 期待値に書き直す。(右辺第3項は0)
1章「平均の誤差」のまとめ データ数に依存しない分散(*) 分散の定義 平均の分散 N±N1/2の誤差と等価(*) *平均の誤差から導出
t分布 • 中心極限定理の変数を書き換える。 • の分布は、nが大きくなるとき標準正規分布N(0,1)に近づく。 • σが既知ならば、zを用いてμの区間を推定可能 • σが未知ならば、その推定値 を用いる
t分布の形状 出典 宮川公男, 基本統計学
t分布の性質 • t分布の形は0を中心として左右対称。従ってその平均は0 • 標準正規分布と似ているものの、t分布の方が頂点が低く、裾野を長く引く。(n→∞で標準正規分布に一致する。) • zの変動要因は分子のの標本変動のみ。 • tの変動には、分母のの変動も寄与するため。 • t分布の形はnのみに依存し、母集団の未知のパラメータには依存しない。→t分布の数表が作成されている。
コーヒーブレイク スチューデントのt分布 • オックスフォード大で化学と数学を学び、1899年にギネスビール社のダブリン醸造所に就職。統計学の知識を醸造と農業(オオムギの改良)の両方に応用しつつ実地の研究を重ねた。 • 1906年から1907年にかけて研究し1908年に論文を出したが、指導教員はこれを重視せず。この論文は醸造技術者が関心を寄せる小標本の問題(サンプル数はあまり多くできないがなるべく正確な答を得たい)に応えるものだった。一方、当時の生物測定学者はそれよりもできるだけ多くの測定を行って正確な答を求めることを重視。 • ギネスでは企業秘密の問題で社員が論文を出すことを禁止。ゴセットは Student というペンネームで論文を発表。もっとも有名な業績はスチューデントのt分布と呼ばれる。 • 1908年の「平均値の誤差の確率分布(The probable error of a mean)」 をはじめ、ほとんどの論文がピアソンの主宰する Biometrika誌に発表された。(出典:Wikipedia) 1876年6月13日生まれ 1937年10月16日没
修正χ2分布 • 次のの推定のために用いられる。 • は修正カイ二乗分布(adjusted chi-square distribution)と呼ばれる分布である。 • は平均的にはに等しいので、 C2の平均は1 - nが大きくなるにつれ、が正確 にと一致するようになるので C2の分布が狭くなる。
χ2分布 • の分布:自由度がn-1の分布 • 分布の利用 • 分散の信頼区間推定 • 分散の検定 • 適合度の検定 • 分割表の検定
付録B.1 「平均値の誤差」の表記について ・初等統計学:平均の標準誤差 ・放射線計測の理論と演習:平均値の標準誤差 ・放射線計測ハンドブック:記述なし ・放射線計測(プライス):記述なし ・総務省統計局HP:標本誤差 ・Wikipedia : 標準誤差 ・カレイダグラフ:標準誤差 「標本平均の標準誤差」の表記の省略の組み合わせ表
「平均値の誤差」と同じ意味でありそうな言語の検索結果「平均値の誤差」と同じ意味でありそうな言語の検索結果
2章 2項分布、ポアソン分布、ガウス分布 • 分布の概要 • 合計、平均、分散 • 相互の関連
実験による2項分布の生成 • 2つの状態を同じ確率で生じる物を10個用意せよ。 • 例えば、一円硬貨を10枚用意し、その片方の面に、マーク(例えば除去可能なシール)をつけよ。 • このうちの何枚かを取り出して並べ、マーク付きの面が上向きである場合pを数える。(下向きをqと書く) • 1枚の場合は、pが1の場合と0の場合がある。 • 2枚の場合は、pp, pq, qp, qqの4通りがあり、pが2,1,0である組み合わせが、それぞれ1,2,1である。 • 3枚の場合は、ppp, ppq, pqp, pqq, qpp, qpq, qqp, qqqの8通りがあり、pが3,2,1,0である組み合わせが、それぞれ1,3,3,1である。 • これを8枚まで、できれば10枚まで調べよ。
実験による2項分布の生成(2) • 複数枚のサンプルを机の上に10回投げて、マーク付きの面がでる枚数を調べる。 • 1枚の場合から始めて、10枚まで調べよ。 • 前のページで調べた並べた場合の分布と比較を行え。 • 並べる方法は総当たりで確率を求めている。投げる方法はサンプリングを行っている。 • 並べる方法で現れるどの組み合わせも、等しい確率でサンプリングで現れるはずであるので、両者は統計変動の範囲内で一致するはずである。
p=0.5, n=1 から 10として(17)式の f(x)を求め、実験的に作成した 2項分布の分布と比較せよ。
2項分布で当たり率を下げていくと ポアソン分布に漸近する。 図8 2項分布とポアソン分布の比較
図9 2項分布とポアソン分布のガウス分布による近似
第3章 最小二乗法 最小2乗法の概念:d12+d22+d32の最小値を求める。(図10)