E N D
平成14年2月8日卒業研究報告相関行列に基づく非計量多次元尺度法 に関する研究 原 康暢 畜産経営管理講座 (統計研究室)
1.はじめに 類似度データ 背後の構造を視覚化 非類似度データ MDS:多次元尺度構成法 • MDSの特徴 似ているものは近く 似てないものは遠く
MDSの種類 計量MDS データが間隔尺度・比尺度の場合 トーガソンの方法 非計量MDS データが順位尺度の場合 クラスカルの方法
研究目的 適用可能 非類似度 非計量MDS 類似度 研究目的 クラスカルの方法 ・適用 ・分析 変量間 類似度 相関行列で定義 有効性?
2.クラスカルの方法 単調回帰法 空間上の距離 単調変換 と単調関係 = 対象i,j間の類似度 (データの値)とn次元空間上の距 離 の順位を適合させる。 類似度単調減少関数非類似度単調増加関数 空間上の距離と単調変換の値の誤差を とする (a)
ストレス(Stress)すべての誤差 の二乗和 データと、空間上の距離の適合度 (1) この値が最も小さくなるような 単調関数と対象の布置を求める。
3.モンテカルロシミュレーション実験 変量1・2・3 第1ブロック 変量4・5 第2ブロック となるよう相関係数を定め 変量6・7・8 第3ブロック 乱数を用いそれぞれを 変量9~13 第4ブロック 1000組発生させる。 変量14~20 第5ブロック 変量間の相関行列を算出 相関行列を入力データとし、 クラスカルの方法へ適用
視覚的に見やす いことを前提 Stressの値 高いが無視 実験結果 2次元選択 (Stress;0.183) 相関行列で定義された類似度 有効な分析可能! 5個のブロックを形成 クラスカルの方法適用 相関行列を正確に反映
4.実際のデータへの適用 中学生166人の12教科の評点 12教科の相関行列を算出
入力データとしクラスカルの方法 へ適用・分析
分析結果 • 2次元選択 (Stress;0.0113) • 3次元を選択し、計算 をやり直す。 他のすべての教科と 相関の低い体育 2次元最終布置退化
3次元選択(Stress;0.023) シェパード・ダイアグラム 単調関数と科目の組を比較 3次元選択(Stress;0.023) シェパード・ダイアグラム 単調関数と科目の組を比較 相関係数は類似度 単調関数は右下がり = ・ (図5)シェパード・ダイアグラム データ と散布図中の距離 の当てはまりの良さを示す。
次元3 感性 3次元選択した場合の最終布置 ・ 生徒の持つ体力 ・ 手先の器用さ ・感性の強さ に左右される。 次元2 器用 次元1 体力 (図6)最終布置 3次元選択 中学生 成績 解釈 中学2年生の12教科の成績の評点
5.おわりに 結論 • 応用分野 相関行列により定義されたの変量間の類似度を、クラスカルの方法へ適用する分析方法は、データの特性を知るうえでたいへん有効であることがわかった。 経営 管理 経営 診断 心理学 生物学 MDSと相関ルールの関連性
スーパーの経営管理 コスメ お菓子 タバコ お茶 弁当 つまみ パン 酒 牛乳 雑誌 パンツ MDS による(仮想的)商品配置図