360 likes | 954 Views
自由度の近似計算. B3 兼清 道雄. 話すこと. 近似t統計量や、近似F統計量で検定する場合の自由度の算出は少々やっかいなのです どこがどうやっかいなの? (SASでは)どう対処してるの?. t分布に近似、F分布に近似. 近似t統計量 近似F統計量. H0: h ’ β =0. H0: L ’ β =0. 自由度 * の~分布に従う (t分布、F分布). * はどう決まる? h ’ β ^の標準誤差(^2)を推定する情報量で決まる ←これを推定するのに使う 情報量
E N D
自由度の近似計算 B3 兼清 道雄
話すこと • 近似t統計量や、近似F統計量で検定する場合の自由度の算出は少々やっかいなのです • どこがどうやっかいなの? • (SASでは)どう対処してるの?
t分布に近似、F分布に近似 • 近似t統計量 • 近似F統計量 H0:h’β=0 H0:L’β=0
自由度*の~分布に従う(t分布、F分布) • *はどう決まる? • h’β^の標準誤差(^2)を推定する情報量で決まる • ←これを推定するのに使う 情報量 • どう計算できる?? • hとかLによるのです • 例がないとわかりづらい・・・
例にもってくるデータ • いつもの行動計量学のデータ(数値は各自で…) • 被験者間要因A(2水準) • 被験者内要因B(4水準) • 被験者5*2=10人 • 分割法!
データの構造式えとせとら • あ • β’=(μ,a1,a2,b1,b2,b3,b4,(ab)11,(ab)12,‥‥ ,(ab)23,(ab)24)
例えば、H0:μ・1-μ・2=0 • 要因Bの第1水準と第2水準に差があるか? • パラメータで表現 • h1’βで表すことが可能 • h1’=(0, 0, 0, 1, -1, 0.5, -0.5, 0, 0, 0.5, -0.5, 0, 0) • β’=(μ,a1,a2,b1,b2,b3,b4,(ab)11,(ab)12,‥,(ab)23,(ab)24)
それで • バランスデータより • を推定するための情報量が自由度 • 計算すると • つまり を推定するための情報量が自由度 • この場合、期待平均平方のアプローチ(分散分析表)で自由度は簡単に算出される(自由度=24)
よって H0: μ・1-μ・2= h1’β=0 • 「要因Bの第1水準と第2水準に差があるか」の検定において、(帰無仮説のもとで、)上記t値は自由度24のt分布に近似的に従う
何が問題?? • 単一の分散のみの関数になるとは限らない • 複数の分散成分の関数になることが多い • ex.)H0=μ・1 =h2’β=0の場合 • アンバランスデータの場合はそれが非線型の関数になったりもする(青本p244参照) • ??? • 近似法を用いて自由度を計算しましょう
自由度の近似計算法 by SAS • SASには4つの方法 • Residual法 • Betwithin法 • Containment法 • サタースウェイトの方法 • MODELステートメントでオプションとして指定 • MODEL y=a b a*b/ s ddfm=residual;
Residual法(ddfm=residual) • 全観測数から固定効果に対する計画行列のランクを引いた数(N-rank(X))を用いる方法 • 残差自由度(the residual degrees of freedom)をそのまま使う方法 • 行動計量の例では、40-8より「32」を近似自由度とする • 一般に最適な自由度を過大評価する
Betwithin法(ddfm=betwithin) • 残差自由度を被験者間の自由度と被験者内の自由度に分ける方法 • REPEATEDステートメントのみの時のデフォルト • 例では、32=8(間:between) + 24(内:within) • residual法では32より過大評価している • 自由度分解公式(n-s)t =(被験者間の自由度)+(被験者内の自由度) =((n(被験者数)-1)-(s(被験者間の水準数)-1)) +((n-1)-(s-1))(t (被験者内の水準数) -1)
3要因以上の場合、自由度分解公式etc.はどうなるの3要因以上の場合、自由度分解公式etc.はどうなるの 例えば・・・ (括弧内は水準数を表す) • 被験者間要因A(2)、B(2)交互作用有り、被験者内要因C(3)の場合 • s=2*2=4、t=3として分解公式へ • 被験者間要因A(2)、被験者内要因B(2)、C(3)交互作用無しの場合 • s=2、t=2+3=5として分解公式へ 3要因以上の場合については鋭意調査中
Containment法(ddfm=contain) • 関心のある固定効果(ex. a)と変量効果(ex. sub)との交互作用である変量効果(ex. sub(a))に対する自由度を計算し、その中で最も小さい値を分母の自由度とする方法 • 関心ある固定効果を含む変量効果がない場合、自由度はN-rank(X|Z)を用いる • バランスデータ分割法の自由度が上記になるから • 変量効果を含むモデル(RANDOMステートメント)のデフォルト
例えば・・・(行動計量の例) • PROC MIXED;MODEL y = a b a*b;RANDOM sub(a); の場合(デフォルトでcontain法) • bやa*bを含む変量効果無し⇒N-rank(X|Z)=40-16=24 • aを含む変量効果有り(sub(a))⇒sub(a)の項が寄与する自由度⇒rank(X|Z)-rank(X)=8
Containment法(ddfm=contain)は・・ • プログラムの指定上の規則に基づく • 自由度⇒モデルのパラメータの設定方法に依存 ⇒プログラミングの際の変数名に依存
サタースウェイトの方法(ddfm=satterth) • サタースウェイトの近似法を用いる方法 • 自由度がプログラミングの際の変数名ではなく(固定、変量の計画)行列自体に依存 • containment法とは対照
1次元(t分布)の場合の自由度の決定 • 二次形式の概念を利用して、次の関数がχ2(ν)分布で近似できるとする
続き • S2hの分散とχ2(ν)の分散を組み合わせる • さらに近似が必要
続き • Giesbrecht and Burns(1985)が分散の近似示す • 変量効果の計画行列を分割+誤差分の単位行列結合 • それらをテイラー展開することで
簡略法もある つまり が • 二次形式 が平均平方の線型結合で表される場合は以下のように自由度を算出することが可能 • Satterthwaite(1964)とNeter(1996)
結論要約(付録Aにおける) • サンプル数が大きい(n>100) • アンバランスの程度が小さい場合 • 4つの手法による分母の自由度はいずれも大きくなり、それに基づく推定、検定結果は本質的に変わらない • 欠測値が多くアンバランスな経時データ複数の分散成分を考慮する必要があるデータ • サタースウェイトの方法を用いるべきである
疑問1 • バランスが凡そ取れている実験データなどでは、どの方法を使うべきか? • デフォルトで良い(オプションで指定しなくてもよい)
疑問2 • 単純主効果の検定、及び多重比較の自由度はどのようになっているのか? • その交互作用の検定に使われた自由度を使う • ただし、サタースウェイトの場合は線型結合による仮説によって計算される • 行動計量の例における単純主効果の検定の自由度residual=32, betwithin=contain=24,satterth(被験者内)=24, satterth(被験者間)=19.1 • F値は皆同じ
疑問3(回答無し) • 被験者間要因の単純主効果の検定を行うと、サタースウェイトの方法を用いると近似自由度は19.1 • 今回の用いた行動計量のデータでは • 分割法の場合、被験者間要因の単純主効果の検定を行うときは、誤差をプールする • 自由度は24+8=32となる • どちらがどのような理由で正しいのか? • サタースウェイトはあっているのか?
「疑問3」に対して • 結論:サタースウェイトの方法が正しい • 誤差がプール出来る前提(この例の場合)⇒MSs(a)=MSs*b(a)つまり =⇒この場合プールしたもので検定する • 今回、上記等式の右辺と左辺が等しいとは言えない • σ2s(a)≒σ2s*b(a)より • よって、そのままプールしてはいけない
自由度を決めてしまう方法 • LSMEANS a*b / SLICE=a SLICE=b df=32; • こうするとLSMEANSステートメントで行われる検定の自由度が全て32になる • PROC GLMと同じ結果が出る(行動計量本と同じ結果が出る) c.f.) MODELステートメントでも指定も可能MODEL a b a*b /ddf=3,.,4.7; • aは自由度3で、a*bは自由度4.7で、bは指定無し
疑問4(自由度はあまり関係ない) • 単純主効果の多重比較をすると全組み合わせが出力される • “LSMEANS a*b/ ADJUST=tukey;”とかやると、今回の例においては、8C2 =28の組み合わせが出て、それをtukey法で調整したp値が出てくる • これはダメ • どうやれば、正しい結果が得られるか?
疑問4、続き • データを分割した上で、分散分析+多重比較 • 面倒くさい(笑) • 検出力低下(各水準に等分散性を仮定した場合) • Bonferroniの方法の考え方より、出力された全組み合わせの中から必要なものだけ取り出し、その数だけp値を倍にする • 前述の方法よりは数段楽♪ • (帰無仮説の)数が多いと検出力低下が顕著
疑問4、続き続き • うまくやればtukey法が使えるのではないだろうか? • どううまくやればいいかわからない • GLMの時と似たような感じでHSDを算出 • 分散成分の推定値なんやらも使って平均平方を表す? • GLMでいいじゃん・・・・ • PROC MIXEDにおけるtukey法ってどのようになっているんだろう? • これが分かればなんとかなりそう
「疑問4、続き続き」に対して • 平均平方を用いるのはそのσ2を表したい為であって、σ2がはなから推定されているのであれば、それを使ってHSDを算出すればいい
疑問5 • アンバランスデータの場合の正当性は? • たぶんあると・・・ • 今まで、アンバランスデータの場合にどのように分析されてきたかわからない • テクニカルブックにはあるけど・・・
「疑問5」に対して • 尤度理論的には正しい • ただし、アンバランスの場合には、F値(t値)がどのような分布に従うかがわからない • つまり検定結果が正しいかどうかは怪しい • いずれはブートストラップなどで分布を作って検定することが可能であろう
文献 • Giesbrecht,F.J. and Burns,J.C. (1985) Two-stage analysis based on a mixed model: Large-sample asymptotic theory and small-sample simulation results. Biometrics, 41, 477-486 • Satterthwaite,F.E. (1946) An approximate distribution of estimates of variance components. Biometrics Bulletin, 2, 110-114. • Netler,J., Kutner,M.H., Nachtsheim, C.J., and Wasserman,W. (1996) Applied Linear Statistical Models. Regression, Analysis of Variance and Experimental Designs. Third Edition, Richard D. Irwin, Inc., Homewood, IL.(pp971-975に簡略法の初歩的議論)