1 / 24

先端研究論文紹介ゼミ

先端研究論文紹介ゼミ. 2010/11/12 B4  福光 宣文. 「 A model for learning to segment temporal sequences, utilizing a mixture of RNN experts together with adaptive variance 」 RNN と適 応変化 エキスパート の混合を利用した 、セグメント時系列の学習モデル. 目次. Abstract Introduction Model Numerical simulation Discussion Conclusion. Abstract.

necia
Download Presentation

先端研究論文紹介ゼミ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 先端研究論文紹介ゼミ 2010/11/12 B4 福光 宣文 「A model for learning to segment temporal sequences, utilizing a mixture of RNN experts together with adaptive variance」 RNNと適応変化エキスパートの混合を利用した、セグメント時系列の学習モデル

  2. 目次 • Abstract • Introduction • Model • Numerical simulation • Discussion • Conclusion

  3. Abstract • 再帰型ニューラルネットワークのエキスパートモデルの混合による新しい学習方法の提案 (モデルは動的にエキスパートを切り替えることで希望の系列を発生させる) • 尤度関数を変更するメカニズムによりマルコフ連鎖の切り替えを学ぶ

  4. Introduction 1 1890年半ば以来行われてきた多くの研究にもかかわず、複雑な長期の配列パターンでのスケーリングは不可能と考えられてきた。 • 長期の場合誤差逆伝搬法による有効な誤差信号を伝搬できないため

  5. Introduction 2 新しい学習システムの提案 RNNとエキスパートモジュールの混合型モデル • シーケンスが多くのモジュールを増やすことで安定性の低下なしで再使用できるブロックに分割されることを許可 • 勾配降下アルゴリズムに基づく最大尤推定法の使用

  6. Introduction3 シミュレーションの流れ • モジュールへのブロックの配分のための結合荷重がモジュールごとの相違パラメータを適応的に変化していることを示す。 • 確立的に複数のパターンを結合することで作られるデータから一組のプリミティブを抽出するための学習により問題に対する適応力を示す。 • 一般化能力に基づいて従来法と比較する • 実ロボットでのモーターの遷移をゲート制御ネットワークと組み合わせて適応する。

  7. Model1 ここで定義されるモデルは、再帰型ニューラルネットワーク(RNN)とエキスパートモデルの混合 以下はその更新式

  8. Model2 • Nはモジュールの数、eは0<e<1をみたす時定数 • XnとYnは、入力と出力ベクトル • Uni 、Cni,、Yniはそれぞれiにおける文脈ノードの内部ポテンシャル、文脈ノードの値、出力値 • 行列Wと、ベクトルvはモジュールパラメータです。

  9. Model3learning method • 学習方法はRNNとエキスパートの混合の確立分布に基づいて定められる • (6)式:既知事実において定義される出力の確立密度関数 • (7)式:平均平方エラーを最小にする

  10. Model4 • (10)式:ベクトルnがN次元ブラウン運動によって決定されることをあらわす • (11)、(12)式:勾配降下法によりトレーニングを行う 提案法と従来法の違い 正規分布の最適化された変化を使用 (15)式:モジュールiの学習速度はσiによる

  11. Model5

  12. Numerical simulation13-1Learning 提案法と従来法の比較 9本のリサジュカーブの変化しているマルコフ連鎖によって発生する二次元シーケンスを学習する

  13. Numerical simulation2結果1(誤差) • 開ループ(a)と閉ループ(b)の2つのパターンで実験を行った • いずれの場合も提案法(最適化)のほうが従来型(定数)よりもいい結果が得られたことがわかる

  14. Numerical simulation3 • Fig. 4. The number of elements in Q for each learning step. Fig. 3. The parameter under adaptive optimization. • Σの最適化による値の収束 • Qの値の推移 • 誤差が大きいときは増加し誤差が小さくなるにつれ収束する

  15. Numerical simulation4

  16. Numerical simulation5結果2(出力データ)

  17. Numerical simulation63-2Generalization 10万回の学習ステップ後の誤差と|Q|の値 (Qは系列Yを発生させるために使用するモジュールの数)

  18. Numerical simulation73-3Practical application 提案方法の実用的な学習 人型ロボットによる実験 立方体が置かれた作業台の前にロボットをセット。 ロボットがいくつかの動作から希望の動作の組み合わせを自主的に発生させる。 タスク (1)、(2)物体を上下に移動 (3)、(4)物体を左右に移動 (5)、(6)物体を前後に移動  計6つ

  19. Numerical simulation6 ロボットの各振る舞いはホームポジションから開始しホームポジションで終了する トレーニングデータは上図のように3種の振る舞いからなる

  20. Numerical simulation7 Fig. 10. Mean square error for closed-loop dynamics for learning of humanoid robot tasks. (a) Learning for expert modules. (b) Learning for a gating network to generate gn in computation of closed-loop dynamics.

  21. Numerical simulation8

  22. Discussion • 観測可能なデータにおいて、提案された学習方法は非決定論的なスイッチングを用いデータを分割させることができることを示した。 • マルコフ連鎖によって動的に機能を変えるシステムを示した。

  23. Conclusion • この研究においてRNNとエキスパートの混成の学習システムを提案した。 • 提案されたシステムによる連続した流れのトレーニングモデルを基関数に分割できることを示した。(従来法では不可) • 一般化能力も従来法よりも優れていることを証明した。 • 実ロボットにおける実験により、その動作を確認した。 以上から提案法が現実的な 問題の適応できているが証明された

  24. ご清聴ありがとうございました。

More Related