410 likes | 531 Views
第1 0 回 パターン認識. 画像認識の概念. 物体認識(object recognition): 画像中に映っている 認識対象の種別、位置、姿勢を同定 すること 分類(classification): パターン認識 予め与えられた カテゴリーのどれに該当するかを同定 すること ~ 文字認識、音声認識. パターン認識 ・ 記号 (文字,音声,・)が対象 ・ 個人性 が変形要因 ・検出と認識は 独立化 可能. 3D物体認識 ・ 人工物,自然物 が対象 ・ 視点変化 による形状変化が変形要因 ・検出と認識は 不可分.
E N D
第10回 パターン認識
画像認識の概念 • 物体認識(object recognition): 画像中に映っている認識対象の種別、位置、姿勢を同定すること • 分類(classification):パターン認識 予め与えられたカテゴリーのどれに該当するかを同定すること ~ 文字認識、音声認識
パターン認識 ・記号(文字,音声,・)が対象 ・個人性が変形要因 ・検出と認識は独立化可能 3D物体認識 ・人工物,自然物が対象 ・視点変化による形状変化が変形要因 ・検出と認識は不可分 パターン認識 v.s. 3D物体認識
パターン認識における特徴抽出 ←幾何学的 ←統計的
f1 f2 ・ ・ ・ fR f1 f2 = = fR パターンのベクトル表現 =f
d θ メジャー:距離か、角度か? • 距離で測ると濃度の違いは大きい • 角度で測ると濃度の違いは小さい • 角度で測る(Ss =cos2θ:単純類似度)
同じパターンとは? • 濃度が違うパターンは違うと見るのか? • 濃度が違っても同じと見たい(濃度=ノルム)
白黒の反転は同じか? • 濃度の変化を無視するなら、白黒の反転も同じとみるべき
パターンの分布 • 超楕円錐形 • 反対側もある(白黒反転)
同じパターンとは? • 背景が違うパターンは違うと見るのか? • 背景が違っても同じと見たい(背景=DC成分)
正準化とその意義 • オール灰色パターンの直交補空間に射影 • オール灰色は意味がない=0であって欲しい オール灰色 ボケ ボケ 0に 近づく 正準化 正準化 不変 ボケ ボケ
部分空間法 • 分布を部分空間で近似 • 部分空間の中を同じと見なす
f φ2 θ φ1 部分空間法.vs. 単純類似度 • 分布を部分空間で近似vs 代表元(単純類似度) • cos2θ= { ( f, φ1 )2+( f, φ2 )2 } / || f ||2 φ1 φ2:正規直交基底ベクトル ← 各クラスに属する パターンの 自己相関行列R の固有ベクトル CLAFIC法(渡辺慧,1969):KL展開により部分空間を作成
部分空間法 未知入力パターン・ベクトルpと辞書パターン・部分空間Qの成す角度θ1を類似度として識別を行う N: N次元の辞書部分空間Qを 張る基底ベクトルの数 (p,qi) : 入力ベクトルpと辞書部分空間 Qの第i基底ベクトルqiとの内績
Karhunen-Loeveの展開(KL)法: 共分散行列を対角化する行列で変換することにより無相関化 • Principal Component Analysis(主成分分析)と同値 • K. Karhunen (1946) • M. Loeve (1948) • H. Hotelling (1933) • パターン認識での再発見 • 飯島 泰蔵 (1963) 「視覚パターンの基礎方程式」 • 渡辺 慧 (1965) 「醜いアヒルの子の定理」 • E.Oja(1983) Subspace Method(部分空間法)
fα 複合類似度法 • 複合類似度法の導出:部分空間法の変形 ~類似度計算過程において,固有値による重み付加 • { ( f, φ1 )2+λ2/λ1( f, φ2 )2 } / || f ||2 • カテゴリ lに属するパターン集合を {fα}とする • パターン fのカテゴリ lに対する平均類似度 • Sm(l) [f] =Σαwα(l) (f, fα)2 / {|| f ||2 ||fα||2} =Σm=1M λm(l) (f, φm(l))2 / {λ1(l)|| f ||2} λm(l)、 φm(l) は行列 K(l)の固有値と固有ベクトルK(l)=Σαwα(l) <fα, fα> / ||fα||2=Σm=1M λm(l) < φm(l), φm(l) > 上記 Sm(l) [f] の変分を 0 とする極値として求まる
醜いアヒルの子の定理(渡辺慧,1969) • 「醜いアヒルの子と普通のアヒルの子とは、似通った2羽のアヒルの子が似ているのと同じ程度に似ている」 ~ 2つのものの類似性をある基準(例えば、共に真である記述の個数)で測ると、どの2つの類似性も等しい ~ 特徴選択を行っただけでは、対象を複数のクラスに分類することはできない. 特徴に重要性(重み)を付加することが、パターン認識における特徴選択の本質
大 犬 太 部分空間法のバリエーション • 複合類似度法 • Sm(l)[f] =Σm=1M am(l)( f, φm(l))2 / || f ||2 • 混合類似度法(大、犬、太を区別したい) • Sc(l)[f] =Σm=1M am(l)( f, φm (l))2 / || f ||2 - Σn=1N bm(l)( f, ψn (l))2 / || f ||2
φ2 f f φ1 φ1 部分空間法のバリエーション:軌跡 • 単純類似度、複合類似度、混合類似度 • ( f, φ1 )2、 ( f, φ1 )2 + ( f, φ2 )2 、 ( f, φ1 )2 - ( f, φ2 )2 が一定の軌跡 と ノルム|| f || f φ2 φ2 φ1
部分空間法の拡張 • 相互部分空間法 • 日立の特許 • 辞書を部分空間にしないで入力を部分空間 • 辞書・入力両方とも部分空間 • 相互部分空間法 文字認識手法として提案,顔認識手法として普及
λmax = 1 λnext = cos2θ θ 相互部分空間法 Ss(l)[f] = λmaxλmax は行列 Xの最大固有値X = (xij), xij = Σm=1M ( ψi ,φm(l)) ( φm(l),ψj )φm(l)は辞書の部分空間の基底、ψiは fから作られる部分空間の基底
相互部分空間法 未知入力パターン・部分空間Pと辞書パターン・部分空間Qの成す最小角度θ1に基づいて識別を行う θ1: 第1正準角(最小正準角) 2つの部分空間の成す角度は統計学に おいて正準角と呼ばれ、M次元部分空間PとN次元部分空間Q(M≧N)の間にはN個の 正準角が定義できる 入力側がベクトルである部分空間法と比べ、 パターン変動に対する吸収能力を更に高めた手法
制約相互部分空間法 福井和広,山口修“一般化差分部分空間に基づく制約相互部分空間法”,信学論D‐Ⅱ,Vol.87-D-2,No.8,pp1622-1631(2004-8) 相互部分空間法では識別に貢献しない成分(照明等による影響)まで含めて識別を行う 識別に有効な成分から構成される制約部分空間への射影を相互部分空間法に付加した方法
本当に部分空間法で良いのか? • バナナ分布 入江文平氏が発見
ノーフリーランチ定理 • 「あらゆる問題で性能の良い汎用最適化戦略は理論上不可能であり,ある戦略が他の戦略より性能がよいのは、現に解こうとしている特定の問題に対して特殊化(専門化)されている場合のみである.」 ~ 問題領域の知識を可能な限り使用して 最適化すべき.
顔画像処理による対話型コミュニケーションの研究顔画像処理による対話型コミュニケーションの研究 知能情報工学講座 西 奈津子
目的 障害者・高齢者(寝たきり・聾唖者)の 社会参加の機会が増大 日常会話が困難な障害者・高齢者との コミュニケーションシステムの開発 顔画像処理(口部パターン認識)による 対話型コミュニケーションシステムの プロトタイプ開発 基盤研究(C)(2)「分散視覚エージェントの統合に基づく 親和的情報空間の展開」の一環として実施
従来のアプローチ筋萎縮性側索硬化症(ALS)を対象従来のアプローチ筋萎縮性側索硬化症(ALS)を対象 (1) 身体装着センサ方式によるメニュー選択 伝の心(日立ケーイーシステムズ社)・はなしっ子(センサ社) (2) 脳血液量変化検出方式 による選択 重度ALS患者用Yes/No検出装置(日立製作所) (3) 表情の変化を使用したスイッチ代行方式 伝の心(日立ケーイーシステムズ社) 視線を用いた文字入力装置 国立身体障害者リハビリテーションセンター研究所・ 福祉機器開発部
口部パターン認識の提案手法 相互部分空間法を用いた口部パターンの認識 4種類の口部パターンの各々の辞書パターンと 未知入力パターンを部分空間で表現し、2つの 部分空間のなす最小角度を尺度として識別を行う
日常会話の階層化 各階層を4つのグループに分割
口部形状パターンの割り当てと明度ヒストグラムの対応口部形状パターンの割り当てと明度ヒストグラムの対応 “口を開ける” “歯を見せる” “舌を出す” “口をつぼめる”
明度分布の特徴部分を用いた口部パターン認識(B4・M1)明度分布の特徴部分を用いた口部パターン認識(B4・M1) 2つの領域の 面積のみを使用 相互部分空間法を用いた口部パターン認識(M2) 0~255間の全ての明度値を使用して 部分空間を作成 画像明度分布全体を使用して部分空間を作成する ことにより、個人差による画像明度分布の違いに 対するロバスト性が期待できる
結果確認のための口部処理 1.口部分の形状を維持 2.口部分の形状を変化 t t t+1 t+1 255 明度 ヒストグラム変化量(Ht)< TH1 ヒストグラム変化量(Ht) >= TH1 一定時間継続 選択結果は正しい 選択結果が間違っている
認識結果の比較 共通の辞書部分空間を作成した場合の認識率 口部 パターン 手法 77.1% 80.2%
個別の辞書部分空間を作成した場合の認識率 被験者A 91.8% 被験者B 97.5%
個別の辞書部分空間を作成した場合の認識率 被験者A 被験者B 口部 パターン 辞書 部分空間 91.8% 97.5% 個別辞書作成時間 : 1つの口部形状につき,約1sec
障害者による認識実験 • 被験者 7名(男性4名,女性3名 年齢38歳~64歳) ・鹿児島市 身体障害者施設・誠光園 入居者 ・障害等級 1級~2級 ・障害名 脳卒中による身体の部分的な機能全廃・機能障害 脳性小児麻痺 頚椎先天奇形による機能障害
障害を持つ被験者に対し個別の辞書部分空間を作成した場合の認識率障害を持つ被験者に対し個別の辞書部分空間を作成した場合の認識率 81.3%