240 likes | 567 Views
周辺モデルの推測 ~固定効果編(改)~. B 3 兼清 道雄. 黄本 (2 nd ) の p55~63 ( §6.2 )です. 本日の流れ1. おさらい:固定効果の推定量(標準誤差) 近似ワルド検定 標準誤差←過小推定 α を推定することによるバラツキを考えていないから 近似t検定+近似 F 検定 分母自由度の問題 経時データでは特に問題ではない 前立腺癌データで応用例 モデルの簡略化 病気( or not 病気)と診断される5年前のPSAについて. 本日の流れ2. ロバストな推測 共分散構造の誤特定にロバストなサンドウィッチ推定量 その使用と問題点
E N D
周辺モデルの推測~固定効果編(改)~ B3 兼清 道雄
黄本(2nd)のp55~63(§6.2)です 本日の流れ1 • おさらい:固定効果の推定量(標準誤差) • 近似ワルド検定 • 標準誤差←過小推定 • αを推定することによるバラツキを考えていないから • 近似t検定+近似F検定 • 分母自由度の問題 • 経時データでは特に問題ではない • 前立腺癌データで応用例 • モデルの簡略化 • 病気(or not病気)と診断される5年前のPSAについて
本日の流れ2 • ロバストな推測 • 共分散構造の誤特定にロバストなサンドウィッチ推定量その使用と問題点 • 尤度比検定 • ML尤度関数による • ×REML • Welham and Thompson(1997)→REMLでも比較できる
固定効果の推定量 • あ • (6.1) • Wi=Vi(α)の逆行列 • 分散成分αのML推定量やREML推定量を代入 • (5.1)の周辺モデルの下、αを既知とした場合、多変量正規分布に従う • 平均はβ、共分散行列はvar(β^) 周辺モデル
Var(β^) • 上式(6.2)、下式(6.3) • αを代入したものがVar(β^)の推定量となる
β^が多変量正規分布に従う? • 例えば、β=μのとき、 • Yが正規分布に従うのであれば、上記も正規分布に従う
Wald検定 • a • は標準正規分布に近似的に従う • 信頼区間算出可能 • 近似ワルド検定(Z検定)可能 ベクトルβの1要素の推定値
H0:Lβ=0 vs. HA:Lβ≠0 • 漸近的に自由度rank(L)のχ二乗分布に従う • Lβ^~N( Lβ,var(Lβ^) ), var(Lβ^)=Lvar(β^)L’ var(Lβ^)-1/2 L(β^-β) が多変量標準正規分布に従うよって{var(Lβ^)-1/2 L(β^-β) }{var(Lβ^)-1/2 L(β^-β) }’がχ二乗分布に従う
標準誤差、過小推定 • Wald検定等はvar(β^)の推定量に基づくが・・ • var(β^)の推定量はαを推定することによるバラツキを考慮していない • 推定値は真値を過小評価している • 解決法として近似t検定、近似F検定
近似t検定 • が近似t分布に従う
近似F検定 • H0:Lβ=0 vs. HA:Lβ≠0を検定するのに・・・ • あ帰無仮説において、F近似値は、分子の自由度rank(L)、分母の自由度*のF分布に従う • *はデータから推定しなければならない!! • t分布についても同じです
*の推定について • 1stの付録に記載、SAS(1999)で詳細な議論 • SASでは4つの推定方法 • 経時データの分析においては・・・ • 違った被験者から独立な情報→自由度十分大 • どれを使ってもp値はほとんど変わらない Kenward and Roger(1997) 調整ワルド統計量(調整された共分散推定量に基づく) 小標本の分布、Satterthwaite方法によるF分布によってよく近似される
前立腺癌データで応用例 • モデルの簡略化 (飽和モデルは下記参照) • 病気(or not病気)と診断される5年前のPSAについて
日本語訳の本 モデルの簡略化(青本p84に詳細有) • ケチなモデル(parsimonious model)を目指して • 高次交互作用から始める • 非有意なものを外す • 有意差のないものをくっつける • そうすると • β6=0, β7=0, β11=0, β12=0, β13=0, β14=β15 Lβ=0とかける
Lβ=0を検定すると • ワルド統計量=3.3865(df=6)、F値=0.5664(df=6,46.7) • p値はそれぞれ0.7587と0.7561 • 重要な項はモデルから外されていない
病気が診断される5年前におけるBPH患者と癌患者の区別病気が診断される5年前におけるBPH患者と癌患者の区別 • この区別はPSAだけではなくPSAの増加率に基づくだろう • BPH患者と局地性(L/R)癌患者のPSAの差、および、PSA増加率の差を検定 • (6.9)および(6.10)の式より表6.2の結果が得られる ● 0.221(0.146) 有意ではない ● -0.951(0.166) 高度に有意 • よって増加率を見る方がよい (反復測定すべき) (ワルド検定)
図解(p60 fig6.1) 5年の傾きの差、高度に有意 5年の切片の差、有意差無 L/R BPH 0 5
ロバストな推測 • (6.3)に基づく分析 • モデルの共分散構造の誤特定にロバストではない • サンドウィッチ推定量(←robust or empirical) • (6.2)においてvar(Yi)を(yi-Xiβ^) (yi-Xiβ^)’に置き換え • 平均構造が正確に特定されていれば一致性をもつ (6.2) (6.3)
共分散構造を正しく特定している場合 • (6.2)と(6.3)が等価である • 神様のみが知る値 • Wi=Vi-1は、私達が決めた値(モデルによる) • 正しく特定⇒Var(Yi)=Viとなる • (6.2)からキャンセル*2くらいで(6.3)に (6.2) (6.3)
平均構造にのみ関心があるのなら • 共分散構造のモデリングに労力を費やすべきではない • 極端に言えば、最小二乗回帰法を使って共分散構造を表し、サンドウィッチ推定量を用いればよい • 測定値間のどのような関係も無視 • 実際は共分散構造にも興味がある
ランダムなばらつきの解釈 • ex.)変量傾きの存在について興味有り • 有効性(efficiency)が得られる • 共分散構造を特定化すれば • 欠測値を含むデータの場合 • サンドウィッチ推定量の使用は欠測メカニズムに対する厳しい仮定のもとでのみ妥当 • §15.8、§16.5
尤度比検定 • H0:β∈Θβ,0(Θβ,0はΘβの部分空間) • あ • -2lnλNは帰無仮説のもとで漸近的に自由度**のχ二乗分布に従う • **は対立仮説で推定する固定効果数から帰無仮説で推定する固定効果数を引いたもの sub space
尤度比検定 • REMLは使えない • 平均構造が違う⇒誤差対比が違う⇒比較できない • (だから)負の値を取ることも・・・(表6.3) • ただし、Welham and Thompson(1997) • プロファイル尤度に基づく2つの尤度比タイプ検定代替案 • two alternative LR-type tests, based on profile likelihoods • REMLで推定する方法でも比較可能
文献を紹介(not 参考文献) • SAS Institute Inc. (1999) SAS/STAT User’s guide, Version7.Cary, NC: SAS Institute Inc. • Kenward, M.G. and Roger, J.H.(1997) Small sample inference for fixed effects from restricted maximum likelihood. Biometrics, 53, 983-997. • Welham, S.J. and Thompson, R.(1997) Likelihood ratio tests for fixed model terms using residual maximum likelihood. Journal of the Royal Statistical Society, Series B, 59, 701-714. • Fai, A.H. and Cornelius, R.L. (1996) Approximate F-test of multiple degree of freedom hypotheses in generalized least squares analsyses of unbalanced split-plot experiments. Journal of Statistical Computing and Simulation, 54, 363-378. • モーメント近似を用いた一般的な線型仮説に対する近似F検定に関する詳細