隠れマルコフモデルによる時系列気象画像からの知識発見

隠れマルコフモデルによる時系列気象画像からの知識発見隠れマルコフモデルによる時系列気象画像からの知識発見高知大学理学部数理情報科学科本田研究室　B003G013N　勝吉進一

春、秋 冬夏背景近年、時間で変動するような画像が大量にデータベースへ蓄積されるようになってきた１週間の時系列気象画像時間空間変動パターン知識の抽出現象の理解，予測

目的 • 時系列画像データベースから時間空間変動パターンを抽出する手法を確立 • 自己組織化マップ（SOM)による画像系列を記号系列に変換 • 隠れマルコフモデルによるモデル化気象画像に対して適用し、その有用性を調べる

HMM：隠れマルコフモデル • 確率的な状態遷移と確率的な記号出力を備えた計算機の数学的モデル：オートマトンの一種 Time flies like an arrow. 「光陰矢の如し」「時蝿は矢を好む」名詞,動詞,前置詞,冠詞,名詞名詞,名詞,動詞,冠詞,名詞品詞：状態，単語：出力記号品詞という状態が隠れている・・・【隠れ】

画像系列→記号 季節など→状態隠れマルコフモデル（推定問題）（１）Q＝｛q１,･･･,qN｝：状態の有限集合（２）∑＝｛o1,･･･,oM}：出力記号の有限集合（３） A ＝{aij }　：状態遷移確率分布（４）B＝{bi(ot)}　　：記号出力確率分布（５）π＝｛πi｝　　：初期状態確率分布 • ５項組M=(Q,∑,A,B,π）推定問題出力記号系列Oから、P(O|M)を最大にするようなモデルMを求める問題 [バウム・ウェルチアルゴリズム,EMアルゴリズム]

実験条件 使用する画像データ・1997年～2000年の1月１日～１２月３１日の画像・気象衛星ひまわりによる日本上空の赤外画像（雲画像）・高知大,菊地研究室でアーカイブ・計１３３５枚（欠損あり）・画像の記号系列の変換　　　クラスタ化・・・二段階ブロック化自己組織化マップ　　　　　（KATAOKA１９９７）

クラスタリング結果 　０　　　１　　　２　　　３　　　４　　　５　６　　　７　　　８　　　９　　　10　　11 　12　　13　　　14　　15　　　16　　17 　18　　19　　　20　　21　　　22　　23 　24　　25　　　26　　27　　　28　　29 　30　　31　　　32　　33　　　34　　35　０，１，１，２，４，・・・・

クラスタの時系列展開

実験・隠れマルコフモデルによるモデル化・バウム・ウェルチアルゴリズム，EMアルゴリズムによってパラメータ推定・入力記号系列：クラスタの記号系列を28日ごとにセグメント化[95個] ・状態数は２～８の変動パラメータとする。モデルのパラメータの推定（状態遷移確率,記号出力確率,初期状態確率）

BIC（ベイズの情報量基準）による状態数選択 BICが小 →もっともらしいモデル BIC＝ ‐2（最大対数尤度）＋dklogn （ｄｋ：モデルの自由度 n:出力記号数）

実験結果１ 真冬春、秋、梅雨春、秋夏、秋盛夏

状態系列の復元 手法：ビタビ・アルゴリズム

まとめ、今後の課題 考察・　自己組織化マップによるクラスタリングと、隠れマルコフモデルによって時間空間変動パターンに関する知識を抽出することができた。・ BIC（ベイスの情報基準）より、状態数が５，６のときがモデルに適していることが分かった。課題　・本研究のシステムを使い、他のもっと複雑な時系列画像においても適用して有用性を確認する。

情報量基準

実験結果

システム概要 SOM クラスタリング画像学習 AIC,BIC EMアルゴリズムバウム･ウェルチアルゴリズム知識発見データ HMM パラメータ推定

モデルのパラメータ推定には、バウム・ウェルチアルゴリズム、EMアルゴリズムをモデルのパラメータ推定には、バウム・ウェルチアルゴリズム、EMアルゴリズムを使用隠れマルコフモデル時系列気象画像のクラスタID 記号系列ABCを出力する状態遷移系列は？ S1－S3－S2, S2－S1－S2, S2－S3－S2の３種類。それぞれの確率は、 0.8×0.2×0.5×1.0×0.4×0.5＝0.016 0.2×0.5×0.1×0.8×0.5×0.5＝0.002 0.2×0.5×0.5×1.0×0.4×0.5＝0.01 よって隠れマルコフモデルがABCを出力する確率は三つの合計0.028となる０．４状態数２～８までにおいての最適なモデル記号ABCを出力する確率状態遷移系列を求めたい！！ S2 0.2 ０．５０．3 最適な状態遷移系列ビタビ・アルゴリズム０．１０．５０．４ S1 0.8 S３ 0.0 ０．５０．３

１　　２　　３　　４　　５ ６　　７　・・・・・・・・・・・・・画像データの説明ヒストグラムを用いた二段階SOM Step1:時系列気象画像をｍ×ｎに　　　　分割する Step2:分割された画像を自己組織化　　　　マップによって学習させる Step3:学習データのクラスタIDの　　　　ヒストグラムをつくる Step4:ヒストグラムを再び自己組織化　　マップにかけ学習する Step5：学習データが集合し、クラスタ　　　　に分けられる SOM 時系列気象画像 SOM

実験・隠れマルコフモデルによるモデル化 EMアルゴリズムによってモデルのパラメータ推定 ☆学習データとなる記号系列が必要である。今回本研究では、時系列気象画像のクラスタIDを97年から00年まで 1月1日～12月31日の順に並べ、記号系列とし、それぞれの年度は独立させる学習データとし、さらに２週間（14日）と４週間（２８日）に分け、２週間に対しては後半の一週間を次の系列の初めの一週間となるようにする。(例：“13243433453213”→“34532133245671”) 同じように４週間に対しては後半の二週間を次の系列の初めの二週間となるように反復させ、それぞれの１４日、２８日を独立させた記号系列を学習データとした。この学習データにより、モデルのパラメータを推定した

AIC,BIC • AIC（赤池の情報量基準） BIC（ベイスの情報量基準）　：情報量基準によるモデルの妥当性検証 AIC＝‐2（最大対数尤度）＋２dk* BIC＝ ‐2（最大対数尤度）＋dk* *dk：フリーパラメータ＝O(O‐１）＋O(N-1)+O-1 O:状態数　N：記号数　n：モデルにかかわる出力記号の数状態遷移確率のフリ―パラメータ記号出力確率のフリーパラメータ初期状態確率のフリーパラメータ

・隠れマルコフモデルにおいての最適な状態遷移系列を求めるアルゴリズム・隠れマルコフモデルにおいての最適な状態遷移系列を求めるアルゴリズム状態遷移系列の復元（ビタビ・アルゴリズム）ビタビ・アルゴリズム S1→S2=0.5 S1→S3=0.5 S2→S1=0.1 S2→S2=0.4 S2→S3=0.5 初期状態 A B C 0.8 S１ S1 S1 最大の確率が得られた地点から太い矢印を逆向きにたどると S2→S3→S1 従って最適な状態遷移系列は S１→S3→S２となる 0.2 0.8 [0.16] [0.008] 0.2 S2 S2 S2 0.5 0.0 0.5 [0.1] [0.0] [0.016] S3 S3 S3 0.0 0.0 1.0 0.0 [0.0] [0.08]

0.25 0.0 実験結果１(学習データが２８日の状態5のモデル） 0.85 0.94 0.9 状態6[0.17] 状態５[0.14] 状態１[0.2]（春,秋） 0.09 0.02 0.02 状態３[0.19] 0.01 状態４[0.24] 状態２[0.7]（盛夏） 0.01 0.03 0.95 0.91 0.87

謝辞　本卒業研究に際して, 　数理情報科学科菊地時夫助教授には時系列気象画像データの提供を頂きました。ここで心からの感謝を申し上げたいと思います。ありがとうございました。

隠れマルコフモデルによる 時系列気象画像からの知識発見