170 likes | 613 Views
ベイジアンネットワーク概説. 第 4 章 ベイジアンネットワークの確率推論 4.1 ベイジアンネットワークによる確率推論 4.2 確率推論のアルゴリズム 4.2.1 列挙法・変数除去法 4.2.2 確率伝搬法 岩崎唯史. 4. ベイジアンネットワークの確率推論. ■ ベイジアンネットワーク 不確実性を含む対象を、確率変数の集合とその間の条件付き確率として表現 ■ 確率推論 一部の変数を観測したときに、その他の変数の確率分布を計算すること. ■ 各変数が離散的な値をとる場合の条件付き確率分布(ノンパラメトリックな表現)
E N D
ベイジアンネットワーク概説 第4章 ベイジアンネットワークの確率推論 4.1 ベイジアンネットワークによる確率推論 4.2 確率推論のアルゴリズム 4.2.1 列挙法・変数除去法 4.2.2 確率伝搬法 岩崎唯史
4. ベイジアンネットワークの確率推論 ■ ベイジアンネットワーク 不確実性を含む対象を、確率変数の集合とその間の条件付き確率として表現 ■ 確率推論 一部の変数を観測したときに、その他の変数の確率分布を計算すること
■ 各変数が離散的な値をとる場合の条件付き確率分布(ノンパラメトリックな表現) 表4.1 条件付き確率表(CPT) 4.1 ベイジアンネットワークによる確率推論 (1) → 親ノードが取り得る状態 →子ノードが取 り得る状態 Xi:i番目の変数(取り得る値はk通りの離散状態) y:親ノード群の値の取り得るパターン( j通り)
■ モデルの近似精度は、条件付き確率表の離散化の細かさに依存 ■ 親ノードを固定し、子ノードについて値を見る ⇒ 親ノードがpa(Xi)であるときの子ノードXiに関する条件付確率 ■ 条件付き確率表+グラフ構造+観測情報 ⇒ 予測対象の変数が取り得る状態の確率を計算(1.4節) 4.1 ベイジアンネットワークによる確率推論 (2)
4.2 確率推論のアルゴリズム ■ 確率推論 観測された変数の情報(e)が与えられたときの求めたい変数(X)の事後確率分布P(X|e)を求める P(X|e)からXの期待値や事後確率最大の値(MAP値)、仮説の信頼度を評価 ■ 確率推論のアルゴリズム ベイジアンネットワークモデルと観測情報を与 えたとき、観測されていない変数に関する確 率分布を計算する手順
(1) p(X1) X1 (2) X2=e X3 X4 (3) p(X4|e) 4.2.1 列挙法・変数除去法 (1) ■ ベイジアンネットワークによる確率的推論 親ノードも観測値もないノードに事前確率分布を与える 観測された変数Xeの値eをノードにセット P(Xe=e)=1 P(Xe≠e)=0 (3) 知りたい対象の変数Xの事後確率分布P(X|e)を計算する
p(X1) X1 p(X2|X1) X2 知りたい変数 p(X3|X2) X3 図4.1 あり得る全ての状態で平均化(周辺化) 計算量はO(23) 4.2.1 列挙法・変数除去法 (2) ■ 列挙法 計算例:図4.1(Xi={0,1}) (4.1)
4.2.1 列挙法・変数除去法 (3) 計算量はO(mn) (4.2) 一般化 m状態変数 Xi={1,2,・・・,m}がn個(i=1,2,・・・,n) 全変数について計算すると計算量はO(nmn) ⇒ 列挙法はネットワークの構造の性質を利用していないので計算時間がかかり、非効率的
4.2.1 列挙法・変数除去法 (4) ■ 変数除去法 親を持たない最上位の変数X1は他の変数の影響を受けないので、総和計算の外側に出す (4.3) 計算量はO(23-1)
4.2.1 列挙法・変数除去法 (5) ■ m状態変数がn個の場合(式(4.2))、全変数について計算する際の計算量はO(nmn-1) ー変数除去法ー ネットワーク構造の性質と変数間の独立性を利用し、他の変数によらない部分の総和計算を再帰計算の内側から外に出し、計算効率を上げる ※ 局所的な計算結果を保存し、総和計算時に 再利用することでさらに効率を上げる ⇒ 確率伝搬法
X1 上流の観測 情報:e+ X2 π(X2) 知りたい変数 X3 λ(X2) 下流の観測 情報:e- 図4.1 ■ 確率伝搬法(belief propagation) 観測された情報から確率伝搬(変数間の局所計算)によって各変数の確率分布を更新 ・ 観測情報:e=(e+,e‐) ・ 計算したい事後確率:P(X2|e) X2とe‐にベイズの定理 4.2.2 確率伝搬法 (1) (4.4) ≡λ(X2) ≡π(X2)
Xupper π(Xupper) X1 π(X1) X2 π(X2) ■ 上流の観測情報e+からのX2への寄与 (4.5) 4.2.2 確率伝搬法 (2) X1についての周辺化 条件付き確率表より ≡π(X1) (1) 観測値が与えられいる (2) 観測値がなく、最上流のノード (3) 観測値がなく、上流に親ノードをもつ (1)or(2)まで再帰
X2 X3 λ(X2) Xlower λ(X3) λ(Xlower) ■ 下流の観測情報e‐からのX2への寄与 4.2.2 確率伝搬法 (3) e-はX2によらない X3についての周辺化 (4.6) ≡λ(X3) 条件付き確率表より (1) 観測値が与えられいる (2) 観測値がなく、最下流のノード (3) 観測値がなく、下流に子ノードをもつ (1)or(2)まで再帰
■ 任意のノード(Xi)の事後確率 (式(4.4)の一般化) 4.2.2 確率伝搬法 (4)
U1 Ui ・・・ πUX(u) To X λXU(u) From X X π(x) λ(x) λYX(x) To X πXY(x) From X Y1 Yj ・・・ ■ 親ノードi個、子ノードj個の場合 4.2.2 確率伝搬法 (5) 図4.2 確率伝搬アルゴリズム
■ 単純結合ネットワーク(グラフにループなし)の場合、計算量はグラフの辺の数に比例 ■ アルゴリズム(全ての状態を列挙しない) (1) P(Xi|e)、 π(Xi)、λ(Xi)の値を設定 (2) CPTと(1)の各値から新しいP(Xi|e)、 π(Xi)、 λ(Xi) を再計算 *確率が収束するまで(2)を繰り返す ■ 複結合ネットワーク(グラフにループあり)の場合、確率が収束する保障なし 4.2.2 確率伝搬法 (6)