要論Ｂ　講義日程

要論Ｂ　講義日程 １２/１８１． Overview，ニユーラルネット　　（福水）２．グラフィカルモデル（土谷）１２/１９３．主成分分析（南）４．独立成分分析（南）１２/２０５．射影追跡法、層別逆回帰分析（栗木）６．混合分布（江口）１２/２１７．サポートベクター，ロジスティック（江口）８．Ｂｏｏｓｔｉｎｇ　（福水）

ニユーラルネット グラフィカルモデル主成分分析独立成分分析層別逆回帰分析混合分布Ｂｏｏｓｔｉｎｇサポートベクター

７．サポートベクターマシンと ロジスティック回帰世の中、多くの問題は分類の問題に帰着できる。そして永遠の未解決問題でもある。もしこの問題が解決されるなら、投資家は決して損をしないだろうし天気予報官は、確率予測をしなくてもよくなり、世の中に失恋も、倒産もなくなるかもしれない….

確率モデルとして，分布が混合されることのクリアな説明を試みる．確率モデルとして，分布が混合されることのクリアな説明を試みる． ○ 潜在変量＝グループ・ラベルの理解 ○ 最尤推定値を求める EM アルゴリズムの紹介 ○ 例題として，神経回路の量子解析のシナプス可塑性分類の問題を考えるとき，確率モデルを考える必要性を強調する．確率モデルは混合分布モデルのある類推から導入する． ○ ベイズルールの最適性を示す． ○ パラメトリックモデル，特に線形モデルを仮定して，プラグインルールの説明をする．このフレイムワークの下で　ロジスティック判別は自然に導入されることを示す． ○ トレーニング・ロス，汎化誤差の説明をする． ○ サポートベクター・マシンの説明 ○ VC次元の説明 ○ カーネル法の説明混合分布サポートベクター

分類方法のための解析　（判別分析） 参考文献 [1] Krazanowski, W. J. & Marriott, F.H.C. Multivariate Analysis, (1995) Arnorld, New York [2] Bishop, C. M. Neural Networks for Pattern Recognition. (1996). Oxford University Press. [3] McLachlan, G. J. Discriminant Analysis and Statistical Pattern recognition. (1992). Wiley, New York. [4] Haykin, S. NEURAL NETWORKS (1999). PRENTICE HALL 統計多変量解析の観点から　ISBN 0340593253 ニューラルネットの教科書 ISBN 0198538642 統計の専門書，空間判別，ニューラルネットISBN0471615315 最近の機械学習，ニューラルネットの紹介 ISBN 0132733501

[5] Harry Hochstadt, INTEGRAL EQUATIONS, Wiley, New York. [6] Jerome Friendman, Trevor Hastie, Robert Tibshirani, Additive logistic regression: A statistical view of boosting, (2000) Annals of Statistics. [7] Alex J. Smola, Bernhard Schölkopf, A Tutorial on Support Vector Regression (1998) NeuroCOLT. [8] Steve Gunn, Supprt Vector Machines for Classification and Regression, (1998) ISIS Technical Report. [9] C. J.C. Burges, A tutorial on Support Vector Machine for Pattern Recognition, Kluwer Academic Publishers. カーネルの数学書ホットな話題チュウトリアル

を決める。 入力のパタンから出力分類の問題トレーニングデータによってを定める。文字認識　（郵便番号の自動読み取り）応用例 ● ● 　　　音声認識　（電話チケット自動予約）　　　画像認識　（交通量計測・予測） ● ☆ クレジットスコアリングメディカルスクリーニング ☆ 鑑定問題 ☆ 天気予測 ☆

分類の方法 トレーニングデータ i 番目の出力 i 番目の入力

方法　：かってな x が与えられた時， 関数 g(x)を使って次のようにのように y を予測する． d = 2 目的　：トレーニングデータを使って良い判別関数ｇ(x) の構成．

直感的な学習:関数 g(x) が次の条件を満たしなさい：上の条件を満たす関数 g(x) は無尽蔵に存在する．そこで，関数 g(x) を線形に限ろう：上の条件を満たす線形関数ｇ(x) の存在は絞られるが完全ではなく，存在しないケースがある．

線形なモデルの意味 回帰の問題を復習しよう：確率モデルを建てようここでは，誤差を表す．

最小２乗法　＝　min SS 最尤法　＝　max Likelihood 誤差分布がガウス分布ならば，　最小２乗法　=　　最尤法

直感的な学習:関数ｇ(x) が次の条件を満たしなさい：？確率的設定を考えようとする。入力 x と出力 y の同時分布を判別関数 g によるルールの誤判別確率をロスにした時の汎化誤差は！ min 経験誤差は min

直感的な学習 AIC, CV,…. トレーニングデータ，テストデータ

事前分布 から事後分布への変化の同時分布２つの条件付け：ベイズの定理の中から１つ選ぶルールをからクラスベイズルール：入力で定める。

ベイズルールによる判別空間 の誤判別確率の良さについて見てみよう一般に、判別ルールが与えられたとき誤判別の確率はで与えられる。

２次元正規分布

条件付き分布

4 2 -6 -4 -2 2 4 6 -2 -4

以上の考察の結論 入力と出力の同時確率の分布がわかっているならベイズルールが最適である。問題点がわかっている状況はほとんどのケースありえない。そこで, 次にパラメトリックケース：分布は未知だけど、分布形 ( パラメトリック形 ) はわかっているを考えよう

仮定：指数型 （ここで　y＝±１）するとここで

が指数型ならば ベイズルールによる判別関数はと成る．を学習すれば良い．結論はトレーニングデータから

トレーニングデータ に対して条件付尤度はと書けるこれを使ってをロジスティック判別関数と呼ぶ。

学習率 を求めるアルゴリズム勾配法反復重み付け最小二乗法などがある

フィッシャーの線形判別関数 の仮定ではベイズルールと書かれるを計算するとよりが計算される。これをフィッシャーの線形判別関数と呼ぶ

入力データベクトルが，グループ内で 多変量正規分布して，グループ間では平均のみ異なると仮定するフィッシャー線形判別入力データベクトルが，指数型分布して，グループ間ではパラメータが異なると仮定するロジステック判別サポートベクターマシンマージン最大化

超平面の幾何 ここでをの超平面と呼ぶの法線ベクトルはである。 ●

法線の直交補空間をと表すこの時と書ける

さてを取ろう。この時、と書ける。ここでこれよりなので

このように 点からへの距離はとなるこれからは、直交補空間を原点からだけ平行移動したものといえる

サポートベクターマシン 超局面の w は超局面と 1:1 でない．このときこの等号を満たす　　　をサポートベクターと呼ぼう．

サポートベクターを含む２平面 との間の距離はとなる。とおくと、の最大化はの最小化と同値なのでサポートベクターマシンは次の形で定義される。 Subject to

双対問題 主問題のラグランジュ関数は

クーンタッカー条件より サポートベクターマシンによる判別関数は

パタンが線形分離可能でないとき、 スラック変数は、１を越える時上の図に対応する。主問題双対問題

カーネル法 入力ベクトル x から特徴ベクトルへの写像をとするとの線形な判別関数サポートベクターマシンによる学習はを解いて実行される

サポートベクターマシンは， を作る．これから，内積カーネルをと定めれば

の具体的な形は必要でなく 特徴ベクトル内積カーネルさえ与えれば実行できる例題例えば，d = 2 の場合

例題　XOR 問題 トレーニングデータ入力　x 出力　y 内積カーネル (－1, －1) + 1 (－1, + 1) －1 ( + 1, －1) －1 ( + 1, + 1) + 1

この性質はカーネルサポートベクターマシンだけの良さなのだろうか？この性質はカーネルサポートベクターマシンだけの良さなのだろうか？

命題 y ( +1, +1, + 1, + 1,－1, －1) (－1,－1, + 1, －1 + 1, －1 )(－1,－1, + 1, －1－1, + 1) ( +1, +1, + 1, + 1 + 1, + 1) 例題　XOR 問題の問題ではサポートベクターは２次カーネルを使えば良い性質が示された．しかし，この良さは、ロジスティックもアダブーストも同様に持っている性質である。

フィッシャー線形判別 ロジステック判別ベイズルールのパラメトリック版サポートベクターマシンマージン最大化確率的考察ではない VC 次元の考察．．．．

グラフィカルモデル ニユーラルネット主成分分析独立成分分析層別逆回帰分析混合分布ラベルミッシングサポートベクターＢｏｏｓｔｉｎｇ

第７幕終わり．．．

混合分布モデル 成分分布混合比混合分布ダミー（潜在）変数 Z の導入 4 2 1 3

要論Ｂ 講義日程