250 likes | 386 Views
N TT に基づく応用モデルの検討 - 一対比較モデルと多次元モデルを中心に -. 宇佐美慧 ( 東京大学大学院教育学研究科・日本学術振興会 ). アウトライン. 序論 ・NTTにおける検討課題 一対比較モデル ・一対比較について ・定式化 ・分析例 多次元モデル ・多次元的な表現について ・問題点と確証的な文脈での多次元モデル ・定式化 ・分析例 考察 ・提案モデルの特性 ・既存のモデルとの比較検討 ・今後の課題. 序論.
E N D
NTTに基づく応用モデルの検討 -一対比較モデルと多次元モデルを中心に- 宇佐美慧 (東京大学大学院教育学研究科・日本学術振興会)
アウトライン • 序論 ・NTTにおける検討課題 • 一対比較モデル ・一対比較について ・定式化 ・分析例 • 多次元モデル ・多次元的な表現について ・問題点と確証的な文脈での多次元モデル ・定式化 ・分析例 • 考察 ・提案モデルの特性 ・既存のモデルとの比較検討 ・今後の課題
序論 • ニューラルテスト理論(MTT; Shojima, 2007, 2008)は,自己組織化マップのメカニズムを応用した,テストデータを分析する為の潜在ランク理論。 • NTTモデルにおいては,各項目の各カテゴリに対する選択確率を表す項目参照プロファイル(Item Category Reference Profiles : ICRP) が潜在ランクごとに推定され,同時に回答者は離散的な潜在ランク上に配置される. • 宇佐美(2009a)における指摘 ・方法論的な観点…潜在ランク,分析モデルの構築・改良などおよびICRPの推定精度,項目サンプリングを超えた潜在ランクの推定値の一貫性 ・教育心理(教育社会?)学的観点…実用に際し潜在ランクに基づく評価が学習者に与える影響に関する,方法論的な議論とは異なる側面. の2点からの検討の必要性.
更には→ • 方法論的問題において,NTTそのものに関する,内的な意味の理論的構築だけでなく、ほかの統計モデルとの比較検討といった外的な視点も重要. 本発表の目的 • 上記の方法論的な観点からの問題に焦点を当て,NTTに基づく応用モデルの検討を,特に多次元モデルと一対比較モデルを中心に行う. • さらにこれらのモデルに関して外的な視点も交えた理論的考察を試みる.
NTTと一対比較モデル • 一対比較データとは ・対提示された刺激の比較判断の結果から得られるデータ(Thurstone, 1927). ・一般に作業が簡便であり,評定尺度法に比べてより精緻で,刺激の差異に対して豊富な情報量が得られる(e.g.,Maydeu-Olivares & Bockenholt, 2005 ; 宇佐美, 2009b). B A >
目指す結果の例 A車とC車の購買意欲に関する一対比較 C車の選択確率 高級車志向 A B C 高級志向 9 1 2 3 4 5 6 7 8 10
定式化 • 刺激 と における個人 の比較判断データ および全体のデータ をH×Kの行列で表わす。 ただし であり,比較対の総数を表す. ・各個人は一次元上に順序的に配列されている 個の潜在ランクの中で,ある最適化基準を最もよく満たすランクに割り振られる.
アルゴリズム • STEP1 分析前の準備 (1) Vの初期値の設定.たとえば (2) 潜在ランクの事前分布の設定. • STEP2 Uの行成分のソート • STEP3 最適な潜在ランクwの割り当て • STEP4Vの要素を更新 • STEP5 STEP3-4を全てのhに対して反復 • STEP6 STEP2-5をT回反復
分析例 • 乱数を用いて発生させた一対比較データに対して提案したアルゴリズムを用いて、被験者を離散的な潜在ランクに割り振る。 • 被験者は300人で刺激数は10(A~J)、そして潜在ランク数を10とした。 • 項目参照プロファイルをもとに、一対比較データにおける潜在ランクの特徴を検討する。
B>A F>E A B C D E F G H I J 1 2 3 4 5 6 7 8 9 10 *潜在ランクの位置を意味する、人の背の高さは度数を意味する。 ・刺激の位置が高い(右側に位置する)ほど全体的にVの要素の値は小さくなる。
J>I J>E J>A A B C D E F G H I J 1 2 3 5 6 7 8 9 10 4 *潜在ランクの位置を意味する、人の背の高さは度数を意味する。 ・JとIは右端に位置している刺激であるため、Vの要素は小さい。 ・刺激間の距離が離れるほどICRPは鋭い立ち上がりを示す。
提案手法に関する考察 • 一対比較データにおいて、ノンパラメトリックな方法に基づいて、個人と刺激を一次元尺度上に布置することができる。 • 真の潜在尺度値をほぼ等分割した形で潜在ランクが形成されている。 • 真の潜在尺度値との相関は0.9492であり高い。 • (一般のNTTモデルにおいても同様に)刺激の布置そのものでなく確率を直接推定しているために、刺激や個人の布置は事後的に評価することになる。
NTTと多次元モデル • ここでは,対比較ではなく,一般の学力テストデータのように,個人と1つの刺激(項目)の潜在特性値の関数で反応が規定される場合を考える. • このようなデータを分析することが当初のNTTの目的(e.g., Shojima, 2007). • 多次元的な潜在ランクを想定する場合の検討はなされていない.→(次元間で補償的に確率が決定されるような)多次元モデルの検討を行う.
目指す結果の例(当初) 各次元が寄与する項目の正答確率 文章能力 言語能力 文章能力 9 1 2 3 4 5 6 7 8 10 言語能力 9 1 2 3 4 5 6 7 8 10
問題点 • 異なる次元間の識別性の問題 • 提案したアルゴリズムでは、かなり良い初期値でないと収束が難しい。 ?? -0.1 0.1
確証的な文脈での多次元NTT • 確証的因子分析に見られるように、先見的に次元を構成する項目群がわかっている場合。 • 因子負荷を0に固定するように、NTTにおいては要素の値をすべて0に固定する。 • この場合、識別性の問題は生じず、アルゴリズムも良く機能する。
定式化 • 前の一対比較データの場合に沿って,アルゴリズムが構築できる. • はサイズ であり, 、 と表わされる. …項目数 は第 次元における潜在ランク数. ・反応確率は各次元に所属する潜在ランクに対応する要素の和で決定される.
アルゴリズム • STEP1 分析前の準備 ・Vの初期値の設定.(次元を構成しない項目群の要素は0にする). ・潜在ランクの事前分布の設定. • STEP2 Uの行成分のソート. • STEP3 最適なランクの抽出. あるhに対して,最適化基準である以下の距離関数dを最小にする,ランクの組み 合わせを求める. • STEP4 各l次元において,Vの要素を更新. 0に固定した要素を除いて次元を構成する項目群を除いて対比較の場合と同様に更新. 次に, を満たすように更新する. • STEP5 STEP3-4を全てのhに対して反復 • STEP6 STEP2-5をT回反復.
分析例 • 乱数を用いて発生させた多次元データに対して提案したアルゴリズムを用いて、被験者を多次元上の離散的な潜在ランクに割り振る。 • 被験者は500人で刺激数は10、各次元における潜在ランク数を5とした。 • 項目参照プロファイルをもとに、多次元データにおける潜在ランクの特徴を検討する。
提案手法に関する考察 • 多次元データにおいて、ノンパラメトリックな方法に基づいて、個人を多次元尺度上に布置することができる。 • では、探索的な場合のアルゴリズムはどのように構築するか。(要素の識別性の問題をどのように回避するか。) • また、仮にアルゴリズムができたとしても、各次元内のVの要素はその次元の選択確率への寄与であり、従来のような選択確率そのものではない。 →Vの意味付けなどの検討すべき点が残るか。 • Vに関する図式的な表現もやや難しい。
まとめ:NTTモデルの特徴 • 反復計算および要素の更新において、ノンパラメトリックな方法に基づき、潜在クラスの要素と所属ランクが推定される. • 今回検討したモデルはノンパラメトリックな方法のもとでの,SOMのアルゴリズムを利用した潜在クラスモデルとして位置づけられる.→従来の方法論(例えば混合分布モデルやノンパラメトリックIRT)との類似点を示唆. • 推定アルゴリズム(e.g., 更新幅や順序制約)の構築や結果の解釈(e.g., 多次元モデルにおける、Vの正答率への寄与)についての独自性も示唆. • とりわけ,ベイズ基準を用いた場合、事前分布の設定により潜在ランクの度数分布の調整が可能である. • 多次元、多値への拡張も容易。
今後の課題 • 教育心理(教育社会?)学的観点 ・離散的な潜在ランクに基づく評価が学習者に与える心理的影響。 ・潜在ランクの意味付けおよびフィードバックにまつわる問題。 • 方法論的な観点 ・分析モデルの構築・改良。 ・多次元モデルにおける次元数の推定。 ・個人の所属ランクの推定の一貫性を高める意図と、外的基準との相関分析の際の過小評価の問題との対応(いわばNTTはどのような文脈・データに対して用いていくべきなのか)。