250 likes | 400 Views
第 Ⅱ 部 社会構造概念の彫琢. 第 8 章 統計的社会ネットワークモデル. 2008/10/06( 月 ) Social Network Seminar M1 浦田淳司. 8.1 統計モデルと社会ネットワーク分析 ‐ 妥協か進歩か 8.2 トライアッド・センサスと推移性の測定 ‐ 三者関係の統計分析 8.3 社会ネットワークのマルコフ連鎖過程モデル ‐ 社会関係の離散確率モデル 8.4 モデル族 ‐ 結合関係の諸傾向をパラメーター化し、推定する 8.5 モデルの展開と 統計的社会ネットワーク・モデリングの定着. 内容.
E N D
第Ⅱ部 社会構造概念の彫琢 第8章 統計的社会ネットワークモデル 2008/10/06(月) Social Network Seminar M1 浦田淳司
8.1 統計モデルと社会ネットワーク分析 ‐妥協か進歩か 8.2 トライアッド・センサスと推移性の測定 ‐三者関係の統計分析 8.3 社会ネットワークのマルコフ連鎖過程モデル ‐社会関係の離散確率モデル 8.4 モデル族 ‐結合関係の諸傾向をパラメーター化し、推定する 8.5 モデルの展開と 統計的社会ネットワーク・モデリングの定着 内容
妥協か、進歩か。 統計モデルと社会ネットワーク分析
統計的・・・ 統計的なモデル: データ間の独立性を仮定 社会ネットワークモデル: 社会単位間の結合従属性を仮定 ⇒マルコフモデルや独立性の議論の進展により、実用化 残る問題点 ・専門の統計技法に偏り、社会ネットワーク分析本来の自由な数学的モデル化が制限 ・社会構造というよりも、結合対の属性や属性間の有意な関係を分析しているに過ぎない なおも、統計的社会ネットワークモデルは 社会ネットワーク分析にとって独自の進歩なのか、 あるいは統計的方法への妥協に過ぎないのか といった問いが残る
対の相互化モデル (Katz and Powell 1955) ダイアッド間の結合の測定のためのモデル(相互対について検討) ネットワークメンバーN人、各人の選択数d ◆個人の間に偶然相互対が形成される確率 ◆ネットワークの中で期待される相互対の総数 ◆条件付き確率 とパラメータ 選択しない部分
三者関係の統計分析 トライアッド・センサスと推移性の測定
トライアッド・センサス ・ダイアッド:アクターiとjの二者関係 ・トライアッド:アクターi,j,kの三者関係 →相互対の数m、非対象対の数a、無結合数nを並べて名前をつける 布置というベクトルで集計 102 個人の小集団のモデル化には適するが、 組織全体の分析には対応していない トライアッドのタイプ別出現頻度をベクトルT上で整理 ↓ 固有の重みをかけて、ダイアッドの数を計算
社会関係の離散確率モデル 社会ネットワークの マルコフ連鎖過程モデル
離散過程のモデル化 ●ランダム・ダイグラフ アクターij間の結合のあるなしをランダムに決定→ネットワークを生成 ●マルコフ連鎖 前提:時間軸t導入 時点tの二項結合関係Xij(t)={xij(t)} (0 or 1) 時間間隔(t,t+dt)における、 遷移確率はすべて事前の状態{X(s):s<t}に依存し、 これに限定を加えないと手に負えない ●モデル化のための仮定 仮定1X(t)はマルコフ連鎖である Pab(t,t+dt)=P{Xij(t+dt)=b|X(t)=a} 仮定2 ひとつの結合の変化しか同時には与えられない
相互性モデル 仮定1,2より同時遷移率は と示される。マルコフ連鎖X(t)における微小遷移率であり、時間tのときの特性に依存。 ●相互性モデル ij間の結合の生成・切断は、 jからiへの相互結合の有無に関係しているとする パラメータ推定は煩雑で、 連続時間確率過程において、マルコフ過程が仮定されているが、 非常に厳しい仮定といえ、より現実的なモデルへの置き換えが必要 ダイアッドの状態:Dij(t)={Xij(t),Xji(t)} には、(0,0) (1,0) (0,1) (1,1) の4つがありうる。 相互性モデルで 測定されるべきは であり、うち2つがわかれば、 パラメータが推定できる
結合関係の諸傾向をパラメータ化し、推定する結合関係の諸傾向をパラメータ化し、推定する P1モデル族
p1モデルとは n×nの二項行列Xにおいて、相互対数、ノードjの入次数を で表し、平均や分散と比較すると、 相互対と結合の受信は偶然以上に頻繁に起こっていること がわかる。 (社会的諸関係の相互化傾向、差別的受信傾向) このような偏向した相互対、受信対が存在するMとX+jを コントロールするパラメータをもった分布族が要請され、 ログリニアモデルを応用し、p1モデルが考案された 特徴 ・偏向パラメータを指数族として表現 ・マルコフ性などの仮定を導入せず →きわめて柔軟なモデル化
p1モデルとは n×nの隣接行列A上の確率関数p1(x)は 相互性 全結合 出次数 入次数 正規化のための定数 特徴:ダイアッドDijは独立的である→推移性や派閥化は表現できない 相互化傾向、差別的受信のみ表現 各種対の確率は Xの確率分布は となる と表現され、
p1モデルとは 指数形を強調して書き換えると、 ただし また、この二つのパラメータに対して、(全てのi<jに関して) という制約がある
パラメータ解釈 • ρ,{αi},{βi}を0と仮定する • 隣接行列Aにおける分布は独立同等分布(iid)になり、 • となる。これは、Xij=1に対するそうでない場合の比率、準密度を表しているので、 • このパラメータθを密度パラメータという。 • (2)θ,{βi}を0と仮定する • 上と同様に、各行においてiidで、 • αiはXの出次数を統制し、 αiが大きく正であると結合の送信の増加になるので、 • このパラメータαiを生産性パラメータをいう。 • (3)θ, {αi}を0と仮定する • 上と同様に、各行においてiidで、 • βiはXの入次数を統制し、 βiが大きく正であると結合の受信の増加になるので、 • このパラメータβiを牽引性パラメータをいう。
p1モデルの意義とその拡張 p1モデルは「社会単位の独立性の仮定」をとりはずし、ダイアッドの独立性を仮定。 否定意見:確率が0.5をも下回っているのに、隣接行列を予測しようというのはおかしい。 個人と関係の構造を対の積み重ねへと分解してしまっている (ぶつぎりにされたダイアッドの統計分析) 肯定意見(Fienberg and Wesserman 1981b) 3因子交互作用のないログリニアモデルを、4元分割表に適合させればよい。 と配列。 p1は という関係にある。
p1モデルの拡張 p1の最尤推定法は、以下の対数尤度関数を最大化することである。 対数尤度比LLRは モデルの拡張 ・結合(k,l)を二項関係から有値関係に発展させること。 (Xij=k,Xji=l として、そこに強度を表現) ・カテゴリーを考慮するには、4つの変数のうち、どれか2つの相互作用(周辺度数)を モデルにふくめればよい。
P*モデルの展開と 統計的社会ネットワーク・モデリングの定着
p*モデルとは マルコフ・ランダム・グラフと呼ばれるグラフに依拠した指数族のモデルであり、 ダイアッド間の独立性を前提としない統計的なモデル化(Frank and Strauss, 1986) Xを単独、二項、有向関係に対するソシオマトリクスとし、下のように表記できる。 観測データxに関する全ての関数z1(x),z2(x),・・・,zr(x) とする。 (※結合数、相互対数、アクターのある属性値、などなんでも) また、θをパラメータとすると、下のように表記できる 確率は0から1の間でなくてはならないので、対数変換して、
p*モデルのパラメータ もっとも単純な形 正規化定数を求めることが困難 ⇒ロジットモデルの適応
ロジットp*・モデル p*モデルは、 個別の結合に対する確率でなく、結合の全コレクションについてのもの。 なので、ネットワークの他のすべての結合に条件づけられた確率が使われる。 他のネットワークすべてを含み、正規化定数に依存していない また、これは パラメータを属性に依存させ、なおかつ構造をみることが可能
マルコフ・グラフ ダイアッド間の従属性を仮定するマルコフ・グラフの導入 その推定法としての準尤度推定法の考案 ⇒p*モデルのモデル化 従属グラフ:条件的に従属したすべての対を結合するような線からなるグラフ 12 2 23 24 1 13 14 3 4 34 G:マルコフグラフ D:従属グラフ ・Dのクリークは、Gではトライアングルかスター →クリークを問題にする時は、トライアッドかスターのみ考えればよい モデル化の仮定を単純化してくれる
準尤推定?? 従属構造をモデル化しているので、 尤度計算において、手に負えない正規化のため パラメータの推定において最尤推定が不可能 ⇒条件的確率のロジットωijを統計的に独立的であると仮定した準尤推定を用いる 準尤度関数最大化することは、ロジスティック回帰モデルを ロジット{ ωij }にフィットさせることと同値であるので ネットワークデータと関連するアクターの属性をとって、 反応変数に関するパラメータのベクトルと 説明変数に関するパラメータの行列を作成すれば、 最大準尤度推計値と概算的な誤差値を得るために、 ロジスティック回帰の一般計算パッケージを利用できる 具体事例は Anderson, Wasserman and Crouch(1999)の小学生の友人関係モデル ジェンダーに注目。ただ詳しくわからないので、いつか論文ゼミで・・・
p*モデルのゆくえ この分野のモデルの発展はほぼ完成 ↓ 実用的な段階にきている。が、応用研究はイリノイ大学の一部のみ 理由1:社会ネットワーク分析の主流とは関係なく、純統計学的な知識が必要 理由2:複数の統計ソフトを使いこなさなければならない しかし、統計学社会ネットワーク分析が新しい可能性を示しているのは間違いない (筆者談)