1 / 18

論理生命学第 7 回: 潜在変数モデルと EM アルゴリズム

論理生命学第 7 回: 潜在変数モデルと EM アルゴリズム. 渡辺一帆. 内容. 潜在変数モデルとは 例)混合正規分布      隠れマルコフモデル EM ( Expectation Maximization )法 潜在変数モデルの最尤推定のためのアルゴリズム. 講義資料: http://hawaii.naist.jp/~wkazuho/index-j.html. 混合正規分布(1). Gaussian Mixture Model ( GMM ). コンポーネント:. M 次元正規分布. 混合比 :. は確率ベクトル. パラメータ :.

nibal
Download Presentation

論理生命学第 7 回: 潜在変数モデルと EM アルゴリズム

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 論理生命学第7回:潜在変数モデルとEMアルゴリズム論理生命学第7回:潜在変数モデルとEMアルゴリズム 渡辺一帆

  2. 内容 潜在変数モデルとは 例)混合正規分布      隠れマルコフモデル EM(ExpectationMaximization)法 潜在変数モデルの最尤推定のためのアルゴリズム 講義資料:http://hawaii.naist.jp/~wkazuho/index-j.html

  3. 混合正規分布(1) Gaussian Mixture Model (GMM) コンポーネント: M次元正規分布 . . . . . . . . . . . . 混合比: . . . . . . . . . . . . . . . . は確率ベクトル パラメータ: 応用)クラスタリング, 密度推定

  4. 混合正規分布(2) 潜在変数(隠れ変数、不観測変数) どれか一つの要素のみが 1. 周辺化

  5. 隠れマルコフモデル(1) Hidden Markov Model (HMM) データ系列 1 2 3 :状態遷移確率 状態iから状態jへ遷移する確率 応用)文字列、時系列のモデリング :出力確率 状態iにおいてmを出力する確率

  6. 隠れマルコフモデル(2) 1 2 3 簡単のため             (状態1からスタート) HMMの尤度 周辺化

  7. 演習 混合二項分布(           は既知) について (1)潜在変数を                  として を表せ (2)ベイズの定理 により        を表せ

  8. 最尤推定 学習データ: 潜在変数:  混合分布の場合:各   は独立と仮定 尤度関数: 最尤推定量: 潜在変数モデルでは EM(Expectation Maximization)法:     潜在変数モデルの最尤推定のための(効率的な)アルゴリズム

  9. EMアルゴリズム • Q関数 とする (密度関数ではない) EMアルゴリズム 1.    に適当な初期値を与える 2.Eステップ:        を計算 3.Mステップ:        を最大にする   を   とする •   の対数尤度を計算し、収束しているか判定する •   収束していなければ、      として2.に戻る

  10. 準備:カルバック情報量 • 2つの確率分布   と    の間の擬距離 xが離散のとき xが連続のとき •            等号は         のときのみ  ∵ として より (等号成立はt=1) ☆注意 データx上の確率分布間以外にも潜在変数y上やパラメータw上の確率分布間の距離を測る場合もあります

  11. EMアルゴリズム(2) • EM法で尤度が増加する理由 (言いたいこと          ) (∵ベイズの定理) 両辺を       で期待値をとると

  12. EMアルゴリズム(3) • EM法で尤度が増加する理由(続き) 潜在変数の分布に関するカルバック情報量 (∵カルバック情報量は非負) ととれば、 (尤度が必ず増加)

  13. 混合正規分布の場合 完全尤度: 各データは独立 潜在変数の事後分布 (*)

  14. 混合正規分布の場合 Q関数 とすると コンポーネントkからのデータ数 コンポーネントkからのデータの平均 +(wに依存しない項) EM法: (*)と(†)を繰り返す (†)

  15. 応用例)混合正規分布 (アルゴリズム) □:data(     ) *  Eステップ 初期化 * * * * Mステップ 終了 * * * 繰り返す *

  16. まとめ 潜在変数モデルの実例    混合正規分布    隠れマルコフモデル 潜在変数モデルの最尤推定法のためのEMアルゴリズム

  17. 演習(つづき) 混合二項分布(           は既知) について (1)潜在変数を                  として を表せ (2)ベイズの定理 により        を表せ (3)n個のデータ         が与えられたときの Q関数       を計算せよ(    を用いて表せ) (4)EM法による尤度最大化のためのアルゴリズムを導け

  18. ヒント • Qの最大化 +(wに依存しない項) はカルバック情報量なので非負 (等号成立は       のとき) (等号成立は       のとき)

More Related