360 likes | 491 Views
Sensitivity Method for Observational Comparison. 逸見 昌之 (総合研究大学院大学) 江口 真透 (統計数理研究所, 総合研究大学院大学). 群比較モデル. N 人の対象者が2群に割りつけられているとき、 各群で観測される結果変量を比較する y : 結果変量 z : 観測の状態( z =1,2) 通常の統計的推測では、割りつけはランダムに 行われている(割りつけ方の影響は無視できる) ことを前提とする . Copas-Li モデル. 現実のモデルは、.
E N D
Sensitivity Method for Observational Comparison 逸見 昌之 (総合研究大学院大学) 江口 真透 (統計数理研究所, 総合研究大学院大学)
群比較モデル N人の対象者が2群に割りつけられているとき、 各群で観測される結果変量を比較する y:結果変量 z:観測の状態(z =1,2) 通常の統計的推測では、割りつけはランダムに 行われている(割りつけ方の影響は無視できる) ことを前提とする
尤度解析 全尤度関数は ここで
2標本比較 モデル
感度解析の例(UK National Hearing Survey) 職場で騒音を被ることが聴力に障害を引き起こす かどうかを調べる 全対象者数 (男性) 処理群(高レベルの騒音に曝露) 対照群(年齢、職場は同じ) 各群において、 までの周波数の純音で聴き 取れるところまでの音量を測定 (そして、適当な正規化変換をする)
処理群での標本平均 対照群での標本平均 合併標本標準偏差 t-統計量 (自由度 )
しかし、2つの群はランダム化されていない 結論は容易に決められなくなる。
Copas-Eguchiモデル 割りつけがランダムに行われていないときの 状況をモデル化 観測の状態 結果変量 Z Y ランダム効果 T
対象者の割りつけ方が無視できる(ランダムに行対象者の割りつけ方が無視できる(ランダムに行 われている) 無視できないときのモデル
を 番目の群における処理の効果(treatment を 番目の群における処理の効果(treatment effect)を表すパラメータとして と仮定すると 但し
(ランダム化デザイン) ・・・これが の意味 以後、 は既知のパラメトリックな分布族と し、 は(統計的推測には)用いない (割りつけが無視できないときのモデルを導出する ために用いた) 以後、簡単のため はスカラーとする
選択バイアスの局所近似 各群への割りつけが無視できないときに、それを 無視して得られる最尤推定量と、 の実際の 同時分布が のチューブ近傍に属するとして得 られる最尤推定量の差をみる の実際の同時分布 の最尤推定量
としたときの の最尤推定量を とするととしたときの の最尤推定量を とすると 但し は に関するFisher情報量 は飽和モデルとして ( 全標本数、 群 での観測標本数)
個の群にわたる標準化2乗バイアスの和 但し は と の従属性の(ある種の)大きさを量る ことにより、各群への割りつけがどのくらい選択 的かを表す
反事実結果変数によるモデル化 番目の群に割りつけられたとしたときの 結果変数 ( はどれか1つしか観測されない) 観測の状態(どの群に割りつけられるかを表す) のとき、 ( は結果変数) 対象者の割りつけ方が無視できる
無視できないときのモデル より ※ が に依存していることに注意
選択バイアスの局所近似 2個の群にわたる標準化2乗バイアスの和
2標本問題 に関する標準化2乗バイアス モデル(1)では モデル(2)では
仮説検定への応用 仮説 検定統計量 ( と仮定して) (実際には) モデル(1)では モデル(2)では
で統計的に有意のとき (但し、 は標準正規分布の両側 点) を となるような とすると が小 選択バイアスがわずかであっても ( の方では)有意でなくなる 可能性あり が大 実質的な大きさの選択バイアス がないと結論は覆らない
感度解析の例(UK National Hearing Survey) 職場で騒音を被ることが聴力に障害を引き起こす かどうかを調べる 全対象者数 (男性) 処理群(高レベルの騒音に曝露) 対照群(年齢、職場は同じ) 各群において、 までの周波数の純音で聴き 取れるところまでの音量を測定 (そして、適当な正規化変換をする)
処理群での標本平均 対照群での標本平均 合併標本標準偏差 統計量 高度に有意 (自由度 ) しかし、2つの群はランダム化されていない (両側 点)に対し、モデル(1)では 検出できないくらいわずかな で結論が逆転する 可能性があるので注意が必要
が各群で異なることを許容するモデル(2)では 但し, (つまり対照群の方では割りつけは ランダム)と考える
の値の小ささの目安 モデル(1)の場合 仮に完全データ が得られたと して、 の検定を行ってみる の同時分布 標準化スコア検定統計量
(局所漸近的)検出力が1/2となるような は このとき ( 前出の例の場合) これより小さい は実際にも無視され やすいと考える モデル(2)の場合は、仮に完全データ が得られたとして、 の検定を考える
補足 Copas-LiモデルとCopas-Eguchiモデルの関係 (2群比較の場合) Copas-Liモデル (但し は標準正規分布の密度関数) Copas-Eguchiモデル(モデル(1))
Copas-LiモデルはCopas-Eguchiモデルの特別な 場合に相当する: (但し、Copas-Liモデルでは は特定 されているのに対し、Copas-Eguchiモデルでは サンプルから推定する)
Copas-Liモデル 対象者の割りつけ方が無視できないときのモデル として、 だけで決まる バイアスも だけで決まる 前出の例の場合 Coaps-Eguchiモデル だけでは決まらず、割りつけ方が無視できない 状況を表すモデルとして、よりバラエティーがある バイアスは で決まる量によって 不等式で評価される 前出の例の場合
Copas-LiモデルはCopas-Eguchiモデルによる バイアス評価式(4)で等号が成立する場合になっ ている (但し、Copas-Eguchiモデルでは を として推定するので、2群の標本数が等し いときに等号成立)
参考文献 Copas,J.B. and Li,H.G.(1997) Inference for non-random samples(with discussion). J.R.Statist.Soc.B,59,55-95 Copas,J. and S.Eguchi(2001) Local sensitivity approximations for selectivity bias. J.R.Statist.Soc.B,63,871-895