ベイジアンネットワークを遺伝的操作に利用した実数値遺伝的アルゴリズム

第14回自律分散システム・シンポジウム（2002年1月25日）第14回自律分散システム・シンポジウム（2002年1月25日）ベイジアンネットワークを遺伝的操作に利用した実数値遺伝的アルゴリズム同志社大学工学部／同志社大学大学院 ○吉田純一，廣安知之，三木光範

発表の概要 遺伝的アルゴリズムの問題点確率モデル遺伝的アルゴリズムガウシアン最適化アルゴリズム（GOA） GOAの連続関数最適化問題への適用まとめ

遺伝的アルゴリズム 評　価選　択交　叉突然変異生物の進化の過程を工学的に応用した最適化手法遺伝的オペレータ　交叉・突然変異・選択幅広い工学的最適化問題に適用可能

GAにおける交叉の役割 親個体の遺伝子を組み替え新しい個体を生成個体間の情報交換積み木仮説（Holland 1975）複数の個体がビルディングブロックを探索．交叉によってこれが組み合わされる評　価選　択交　叉突然変異 GAによる解探索の主役と考えられてきた

GAにおける交叉の問題点 発見されたビルディングブロックを母集団全体に広め，多様性を失わせる．親個体のもつビルディングブロックを破壊することが多い.（Wu 1997）適合度に小さな変化または大きな改悪を生む事が多い．（Nordin 1995）新しいアプローチ　　分布推定アルゴリズム　　確率モデル遺伝的アルゴリズム

分布推定アルゴリズム（EDAs）の概要 分布推定アルゴリズム（Muhlenbein1996） Estimation of distribution algorithms:EDAs （１）良好な個体を母集団　　から選択分布の推定（２）分布を推定し　　確率モデルを構築母集団確率モデル（３）新しい個体を生成し　　母集団内の個体と置き換え母集団内の良好な個体群の分布にもとづいて確率的に新しい個体を生成する

GAとEDAの比較 GA EDA 評　価評　価選　択選　択分布推定・交　叉モデル構築突然変異個体生成 EDA：交叉・突然変異を「分布推定」と「モデルに従った個体の生成」に置き換えたもの確率モデルGA（Probabilistic Model Building GAs）

確率モデルGAの分類（Pelikan1999） f (x1, x2) 0 1 0 1 0 1 ビットストリング型実数値ベクトル型 x1 x2 依存関係を考慮しない（No Interactions） 2変数間の依存関係を考慮する（Pairwize Interactions） 3変数以上の依存関係を考慮する（Multivariable Interactions）設計変数のコード化手法による分類設計変数間の依存関係の考慮の程度による分類

GOA ガウシアン最適化アルゴリズム Gaussian Optimization Algorithm:GOA 2変数間の依存関係を考慮した実数値確率モデルGA 確率モデルGAの分類

提案手法の特徴 • 実数値ベクトルの染色体 • 確率モデルGA • 分布の推定にガウス分布 • 確率モデルにガウシアンネットワーク • ガウシアンネットワークの構造はQ-Learningで学習ガウシアン最適化アルゴリズム Gaussian Optimization Algorithm:GOA

GOAの概要 Q学習（１）良好な個体を母集団　　から選択分布の推定（２）分布を推定母集団ガウシアンネット（6）母集団内の個体と置き換え（４）新しい個体を生成（3）モデルを決定（5）良好な個体を生成した　　ネットワークを学習

分布の推定 サンプル個体群母集団からサンプル個体を選択サンプル率s トーナメント選択サンプル個体群の統計量を求める各設計変数の平均値，標準偏差サンプル個体群はガウス分布すると仮定変数間の相関係数ρ 変数ごとの関わりを考慮する

個体の生成 xa の値をもとに xbの値を決定各変数を独立に決定する場合変数ごとに正規乱数を発生 2変数の依存関係を考慮する場合（GOA） xa と xb の間に依存関係があるとき xb 2変量正規分布を利用平均値，標準偏差，相関係数 xa

個体の生成（２） xa xb xn xa とxb の間に依存関係があるとき xa の値をもとに xbの値を決定 n変数を扱うときには xc xa xb 依存関係を有向グラフで表現各変数の値はガウス分布すると仮定ガウシアンネットワーク（ベイジアンネットワークの一種）ガウシアンネットのグラフ構造をどのように決定するか？

Q-Learning GOAでは依存関係はQ-Learningで学習強化学習エージェント教師なし学習行動行動選択の手がかり：報酬報酬状態観測エージェントは試行錯誤を通じて適切な制御規則を獲得環　境 Q-Learning ある状態でとりうる行動に評価値：Q値評価値に応じて行動を選択

Q学習によるネットワークの学習 2 2 3 3 2 3 1 1 1 3 2 個体を生成 1 3 0 2 3 1 2 1 個体を評価 3 1 2 良好な個体を生成したネットワークには報酬 3変数の場合ネットワークを決定 ε-greedy選択（ε=0.5）ノード：変数，パス：行動

ネットワークの学習 探索が進むと・・・ 2 3 枝ごとにQ値に偏りが生じる 1 3 2 太い枝は選択されやすい 1 3 太い枝のネットワークは良好な個体を生成する可能性が高い 0 2 3 1 2 1 3 Q値を観測することで対象問題の依存関係がわかる？ 1 2

GOAのまとめ Q学習（１）良好な個体を母集団　　から選択分布の推定（２）分布を推定母集団ガウシアンネット（6）母集団内の個体と置き換え（４）新しい個体を生成（3）モデルを決定（5）良好な個体を生成した　　ネットワークに報酬

数値実験 ガウシアンネットの有効性実数値GAとの性能比較ネットワークの学習

対象問題 変数間に依存関係なし変数間に依存関係あり FGriewank

実験１：ガウシアンネットの有効性 xc xa xb xn ガウシアンネットワークは変数間の依存関係を表現設計変数間に依存関係のある問題において効率的な探索が期待される GOAとガウシアンネットワークを用いないGOAを比較しガウシアンネットの有効性を確認する

実験1：ガウシアンネットの有効性 分布の推定分布の推定母集団母集団ガウシアンネット GOAとネットワークなしGOA パラメータ母集団サイズ：サンプル率：突然変異率： 200 0.1 0.1 学習率：割引率： 0.3 0.3 ※20試行の平均値で比較

ガウシアンネットの有効性（１） 設計変数間に依存関係のない問題では差はない

ガウシアンネットの有効性（２） 設計変数間に依存関係のある問題では有効

実験2：実数値GAとの性能比較 比較に用いた実数値GA 母集団サイズ：世代交代モデル：交叉法： 200 MGG（sato1997） BLX-α （eshelman1993）, UNDX （ono1997） ※20試行の平均値で比較

実数値GAとの性能比較（１） GOAは実数値GAよりも高速に良好な解を得る

実数値GAとの性能比較（２） 10D Ridge 10D Griewank GOAは実数値GAよりも高速に良好な解を得る

実験3：ネットワークの学習 探索が進むと・・・ 2 3 枝ごとにQ値に偏りが生じる 1 3 2 太い枝からなるネットワーク →良好な個体を生成した　ネットワーク 1 3 0 2 3 1 Q値を観測することで対象問題の依存関係がわかる？ 2 1 3 1 2 対象問題 Rastrigin, Ridge（4変数）ノード：変数，パス：行動

ネットワークの学習（１） 4D Rastrigin関数設計変数間に依存関係がない相関係数は小さいネットワークを用いなくても性能は変わらない Q値に偏りがない学習が進む前に最適解を得る

ネットワークの学習（２） 4D Ridge関数設計変数間に依存関係があるネットワークを用いた方が性能がよい Q値に偏りがある何らかの学習がなされている問題の性質を把握は今後の課題

まとめ 新しい実数値確率モデルGAとしてガウシアン最適化アルゴリズムを提案した．設計変数間に依存関係のある問題においてガウシアンネットワークによる個体分布の推定は有効． GOAは実数値GAよりも少ない計算回数で良好な解を得ることができる． GOAは設計変数間に依存関係のある問題においてその性質を学習することができる（解析は今後の課題）．

補足資料

GOAの流れ図 学　習選　択分布推定モデル構築個体生成評　価

Rastrigin GOAは実数値GAよりも高速に良好な解を得る

全試行の履歴 多峰性関数においては局所解で停滞することもある

GOAの問題点 サンプル個体群=母集団内の優良個体 X0 X１ X２ X３ X0 X１ X２ X３ 0， 0, 4, 0 0， 0, 5, 0 0， 0, 3, 0 0， 0, 0.4, 0 0， 0, 1, 0 0， 0, 5, 0 0， 0, 3, 0 0， 0,0.3, 0 個体１個体2 個体３平均値 GAでは，選択によってエリートの数が増える GOAでは数は増えず，統計量のみが変化する探索終盤での局所解からの脱出は困難？ GOAではビルディングブロックの交換はできない

GOAの問題点 ビルディングブロックの交換ができない 0, 0, 0, 0, 0 0, 0, 0, 1, 0 0, 0, 0, 0, 1 0, 0, 0, 0.5, 0.5

ベイジアンネットワーク ここで　　　　　はxbの親ノード群不確定性を含む事象を表現するために有向グラフを用いる確率モデル確率変数の間の定性的な依存関係をグラフ構造で表す xa xb このとき xb は xa に依存する． xa は xb の親ノード．確率変数間の定量的な依存関係を条件付き確率で表す

条件付き確率の例

ガウシアンネットワーク 離散変数をベイジアンネットワークで扱う場合条件付確率はすべての状態における条件付確率を並べた表（CPT）によって表す． a = 1 のとき b = 0 である確率は 10% a = 2 のとき b = 0 である確率は 10% 　　　　　　　　　・・・連続変数をベイジアンネットワークで扱う場合各変数の条件付確率を特定の連続関数に従うと仮定このときガウス分布すると仮定するものガウシアンネットワーク

Q-Learning ：状態：行動：報酬 Q-Learningの例 A A A S1 S2 S3 S4 B B B Q値 S1 S2 S3 S4 A B

ネットワークの学習：Rosenbrock 4D Rosenbrock関数設計変数間に依存関係がある相関係数が大きい

相関係数の影響 ρ=0.0 ρ=0.2 ρ=0.4

GOAの世代交代モデル GOAでは任意の世代交代モデルが利用できる本研究で用いた世代交代モデル P（t）サンプル個体群の選択 S（t）子個体の生成 O（t） P（t）+O（t）世代交代 P（t+1）

交叉の問題点（1点交叉の例） 1 1 2 2 :3 交叉点はランダムに決定 →良好なスキーマが組み合わされ　るか否かは確率的要素に依存 :2 :5 - 改良よりも改悪の方が多い（wu 97） :0 うまく組み合わされても一方は淘汰される　→ 多様性の減少につながる :3 :2 部分解

実数値遺伝的アルゴリズム 実数値をそのまま遺伝子型とする連続関数最適化問題において，ビットストリングを用いるGAより有効である（Davis 91）

実数値GAにおける交叉法 BLX-α UNDX （Eshelman 1993）（Ono 1997） • 3つの親個体により定義される正規分布領域 • 2つの親個体の各成分距離をα倍拡張した領域 • 領域内に2つの親の中点を対称に子個体を生成 • 領域内に子個体はランダムに生成 • 設計変数間に依存関係のある問題に弱い • 設計変数間に依存関係のある問題に強い

確率モデルGA研究の動向 ビットストリング型の手法に関する研究が先行実数値ベクトル型の手法で変数間の依存関係を考慮したものは少ないガウシアン最適化アルゴリズム Gaussian Optimization Algorithm: GOA 2変数間の依存関係を考慮した実数値確率モデルGA

■ ■公聴会用資料■ ■

ベイジアンネットワークを遺伝的操作に利用した 実数値遺伝的アルゴリズム