570 likes | 1.33k Views
統計入門 第四回. 分散分析のつづき. 今回の内容. 今回は、前回の分散分析を復習しながら、説明してない部分をお話します。 もちろん、前回よりも込み入ったお話となります。 皆さん、眠いでしょうががんばっていきましょう. トピック. 分散分析の考え方のおさらい 対応がある分散分析 球面性の仮定 分散分析の前提条件 交互作用についての補足説明 分散分析の応用 実際分析するにあたって. 対応のない分散分析. おさらいと、その他いろいろ. 分散分析とは?.
E N D
統計入門 第四回 分散分析のつづき
今回の内容 • 今回は、前回の分散分析を復習しながら、説明してない部分をお話します。 • もちろん、前回よりも込み入ったお話となります。 • 皆さん、眠いでしょうががんばっていきましょう
トピック • 分散分析の考え方のおさらい • 対応がある分散分析 • 球面性の仮定 • 分散分析の前提条件 • 交互作用についての補足説明 • 分散分析の応用 • 実際分析するにあたって
対応のない分散分析 おさらいと、その他いろいろ
分散分析とは? • 分散分析は、「従属変数の変動成分を、要因変動と誤差変動とに分割し、要因変動に効果があるかどうかを検定する分析」です。 • もう少し踏み込んでいうなら、「要因変動が誤差変動よりも十分に大きいかどうかを検定する」ともいえます。
もう少し具体的に・・・ • 分散分析は、皆さん知っているように、従属変数が量的変数(間隔・比率)、独立変数が質的変数(名義・順序)です • 独立変数の水準による違いが、従属変数の変化とどのくらい対応しているかを調べる分析ともいえます。
各セルごとのデータ数について • 実験手続きの都合などにより、セル間のデータ数が異なるときは、やはりいろいろ調整をしています。 • 欠損としてかなりのデータが損失されてしまった場合には最小二乗法などを使用して欠損を補うことがあります • 調査や、大してセルの人数に偏りがない場合には、非加重平均法が用いられることが多いそうです
非加重平均法 • その名のとおり、重み付けしない平均を使用して分析する方法です • つまり、各セルの平均値を基に、周辺平均を算出して、それぞれを検定する方法です • ですので、各セルのデータ数を無視ってやってます
それって、ありなの? • データ数の違いがあまり大きくなければ、記述統計値と非加重平均値との間に差は出てきません • 逆に言うと、差が大きい場合にはかなりのズレが生じるので注意してください • このあたりに関しては、タイプ別の平方和について調べてみてください • せめて、χ二乗検定で出ない程度にしてください(絶対基準ではありません、あくまで主観的なものですが・・・)
非加重平均での注意 • この分析法では、記述統計での平均値ではなく非加重平均値に対して検定を行っています(下位検定も同じく) • ですので、論文などで主効果を記述する際には、非加重平均値を使用してください • SPSSでは、推定周辺平均がこれに対応します
対応のある分散分析 一般的だけど、ほんとは難しい
「対応がある」って? • それぞれのサンプルが、ある要因の各水準でのデータを提供しているデザインです • 被験者内デザインは、基本的に対応があるデザインに組み込まれます • 先週この辺は説明したので、重なる部分は省略します
対応がある分散分析 • 対応がある分散分析では、以下のような考え方となります • つまり、対応がない分散分析での誤差成分を、個人間変動と残差とに分類します • したがって、対応なしデザインよりも、より検定力が増すといえます
要因×個人間の交互作用は? • 要因変動と個人間変動との交互作用は考えなくてもいいのでしょうか? • 実際のところ、この交互作用は誤差として処理されています • 誤差とこの交互作用との分離が難しいためで、しかも、そこを積極的に取り出すことに意味が少ないためです • ・・・ていうか、対応のあるANOVAでの誤差は、計算上この交互作用変動で、F比の検定での誤差項は検定する効果によって変化します
混合デザインでは? • 多要因分散分析では、しばしば被験者間要因と被験者内要因とが混ざったときがあります • このときには、今まで言ってきたことを統合して、やっていきます • つまり、あんまり大きな違いはない、ということです
反復測定の分散分析での注意 • 反復測定の分散分析(まあ、被験者内と思ってください)を実施するときには、その反復測定値の級内相関が重要となってきます • それに関連して、それぞれの水準での球面性の仮定(球状性の仮定)が問題となります • 次のセクションでは、その辺のお話をしたいと思います
球面性の仮定 Repeated ANOVAの前提条件
反復測定の前提条件 • t検定のときに触れましたが、反復測定値の相関が正で有意であることが必要となります • これが満たされないと、検定値が非常に小さく見積もられるという問題が起こります • 分散分析ではさらに、球面性の仮定を議論することとなります
球面性の仮定って? • 繰り返し要因の各水準間でデータの分散・共分散が等質であることの仮定です • この仮定が脅かされると、ANOVAの結果がゆがんでしまいます • ですので、F-valueの自由度を調整する必要が出てきます
何で「球面性」って言うの? • 各水準間の分散・共分散が等質であるとき、それぞれの水準における分布は多変量正規分布となり、それらの確率分布の同値をつなげると、球状となるからです・・・ • ・・・要するに、平均からそれぞれ距離が等しいということです、はい • ・・・これでもむり、だよねぇ。詳しい話は、線形代数のお話になります。
・・・んで、どう見るの? • SPSSで反復測定ANOVAをしたときには、「球面性の仮定」という結果が出てきます • これが有意なときは、球面性の仮定が棄却されるということになります • ですので、ここが有意だったら修正した自由度での結果を見てください
自由度の調整法 • Greenhause & Geisserのε • 最もよく使用されています • Huynh & Feldtのε • サンプルが少ないときに使用します • どちらも、2つの自由度にεを掛けて低く(厳しく)しています • 論文などでの表記はこうなります: F(4, 88) = 2.92, p = .04, ε= .80
球面性に関する問題点 • 実は、このようにただ調整すればいいということではないそうです(千野, 1993, 1994) • 反復測定のブロック要因が2つ以上ある場合、大局的球面性と局所的球面性の違いという問題が発生することや、多変量における処理などがあります • ただ、この辺は非常に難しい問題なので、現在のところは先ほど紹介した方法でいいと思います
分散分析の前提条件 けっこう、忘れられがちです
分散分析の前提条件 • これまで、分散分析についていろいろ説明してきました • ここで、分散分析の前提条件についてまとめてみます • そして、それらの対策もあわせて述べていきます
前提条件 其の壱 • 無作為な標本抽出 • サンプルをとる上で、恣意的になってはいけないということです • これができていないと、実験的に統制したと思ってもできていない場合があり、一般化ができない場合があります • これは実験計画法の基本となりますので、頭の片隅にしっかりと入れておいてください
前提条件 其の壱の対策 • もし、どうしても無作為化ができないのであれば、結果を限定的に評価することとなります。 • たとえば、本当は成人一般を母集団としていたのだが、結局大学生にしかデータが取れず、その変数が大学生と社会人でパターンが変わりそうなときには、「大学生」における結果として限定する、という方法があります。 • あくまで、一般化の可能性を考察に示す程度に収めることが重要です
前提条件 其の弐 • 母集団の分布の正規性 • 想定している母集団の分布が、正規分布しているかどうかです • もし正規分布をしていなければ、統計的推定の前提が脅かされるためです • つまり、はじめっから分布が偏っていることが想定されるときには、これが満たせていないということになります
前提条件 其の弐の対策 • 例えば、DV被害といったようにどうしても母集団の分布が下に偏ってしまうことがあきらかです • このようなときには… • 心理学的測定法に照らし合わせて変数の変換を施しす→分布の正規化をしてから分析 • 正規分布以外で当てはまる分布があるなら、その分布を基にした統計手法を採用 • ノンパラメトリックに落として分析
前提条件 其の参 • 分散の等質性(+共分散の等質性) • 各水準ごとに、分散が等質であるかどうかが問題となってきます • 実は、分散分析でもt検定と同様にこの前提が必要となります • さらに、対応があるときには、共分散の等質性も求められます • さらに、球面性の仮定もね
前提条件 其の参の対策 • 変数の変換によって、これがクリアされるときもあります • それが使えないときには、対応がないときにはウェルチの近似法、対応があるときにはHotellingのT2(多変量解析)を使用できます • 全部にいえるのですが、順序・名義尺度に落として、ノンパラ検定を使用するというのも、ひとつの手です
まとめると・・・ • 無作為標本抽出 • 母集団の分布の正規性 • 分散の等質性 以上を、クリアしましょう
交互作用の補足 いろんな形がありますよ
交互作用の定義 • 2つ以上の要因の効果が組み合わさった効果、です • 別の表現では、ある要因の水準によって、他の要因の効果が異なってくることともいえます • これを言い換えると、平行であるか否か、ということになります
交互作用の下位検定 • 一次(2要因)の交互作用の下位検定 • 片方の要因のそれぞれの水準で、もう一方の要因が効果を持っているかどうかを、それぞれ検定した後に、多重比較を実施 • この効果を、単純主効果といい、普通の主効果とは区別しています • これらの下位検定は、要因計画(被験者内があるかどうか)によって、用いる誤差が換わるのでご注意を
交互作用の下位検定 • 二次(3要因)の交互作用 • 単純交互作用の検定ある要因での、それぞれの水準において、残りの2つの要因の交互作用が有意であるかどうかを検定します • 単純・単純主効果の検定(原則として)単純交互作用が有意である場合、さらに水準を絞って主効果を検定します • 本来は、このような手続きをとりますが、しばしば無視されます・・・ • 問題は、その研究の仮説に大きく依存してしまうところなんですねぇ
分散分析の応用 いろんな種類のANOVAを紹介します
いろんなANOVA • 分散分析は、いろいろな分析へと拡張されています。 • ここでは、それらの応用的な分析について紹介します。 • もしそれぞれの分析について詳しく知りたいときには、後日説明していきたいと思います。できたら…
応用的な分散分析 • 共分散分析(Analysis of Covariance;ANCOVA) • 多変量分散分析(Multiple Analysis of Variance;MANOVA) • 多変量共分散分析(Multiple Analysis of Covariance;MANCOVA)
共分散分析(ANCOVA) • 共変量(covariate)をモデルに組み込むことで、統計的に統制するANOVA • デザイン例:学習法を独立変数、テスト成績を従属変数とし、共変量として年齢を投入 • メリット: • 概念的・解析的にも結果に対する説明力が増す • 実験法で統制できない変数でも統制可 • デメリット: • 分析での制約や、前提条件が厳しい(←重要
多変量分散分析 • 複数の従属変数に対して、要因が全体にどのくらい効果を持つかを検討する分析 • デザイン例:自尊心が、抑うつ・不安に及ぼす影響 • メリット • 分析の繰り返しによる多重性を解消 • 従属変数間の相関を統制して検討可能 • デメリット • 下位検定がしんどい • 解釈が難しいことが多く、大体いい結果が出にくい(主観)
多変量共分散分析 • MANOVAとANCOVAを組み合わせた分析 • デザイン例:理想とのズレが抑うつ・不安に及ぼす影響について、自尊心を統制 • メリット: • …いっぺんに分析できること • 要因の効果について、かなり厳密になる • デメリット: • もちろん、下位検定が正直しんどい • 解釈が、大変
分散分析と回帰分析の関係 • 実は、一変量分散分析と回帰分析は、結局同一モデルとなります • つまり、一変量分散分析は回帰分析の特殊なモデルともいえるのです • そこで、この辺を統合した分析として、一般線形モデルが位置づけられます • ・・・なんだか、わけがわからなくなってしまいますね。 • 要するに、GLMはそのくらい広い分析というわけです、はい。
実際に分析するにあたって 私の数年間培ってきたテクニック集です(大そうなものではないです)
先生、有意になりませんが何か? • 学生:先生・・・ • 先生:ん、なんだね? • 学生:分析結果ですが、p = .11で有意じゃないんです・・・(泣 • 先生:そうか・・・もう一度、いろいろ洗ってみなさい。見落としがあるかもしれんぞ! • 学生:は、はい!
ケース0.外れ値の除去 • 分布を確認し、明らかに外れている値を除去する • 外れ値だと評価する基準としては、これまでにいくつか提案されています • 多変量分布での外れ値は、てこ比を利用して除去する方法があります • 何らかの明確な基準を持ち、決して恣意的にならないようしてください!
ケース1.データの変換 • 従属変数、独立変数共に分布が偏っているとき、結果がゆがんでしまいます • ということで、もともとのデータを見て、分布を確認します • そこで左に寄っていたなら、以前紹介した内容で対策をとってみてください • データの変換 • 分析手法の変更 など…
ケース2.独立変数をいじる • 中央値折半で独立変数をつくってた場合などに使えます • 理論的に問題がないのなら、2水準での分析→3水準の分析に切り替える • あるいは、重回帰分析で交互作用効果を検討してみる
ケース3.欠損値の処理 • 今のところ、欠損のあるサンプルは分析で除外してましたという人へ • サンプル数が少ないときには、この操作は非常にもったいないので、欠損値を補填して埋めましょう • 平均値を用いる方法や、最小二乗法・最尤法による推定、再因子分析による復元などなどいろいろあります
ケース4.重回帰を利用 • 独立変数を尺度で取ってた場合に、利用できます • 重回帰に、主効果と交互作用を投入して検討する方法です • ただ、下位検定がANOVAと比較して非常にややこしいですが、手続きは確定されています • 重回帰での交互作用項の検討は、当方のWebサイトに解説していますのでご参照くださいhttp://kz-md.net/stat/stat.html