slide1
Download
Skip this Video
Download Presentation
第1 0 回  パターン認識

Loading in 2 Seconds...

play fullscreen
1 / 40

第1 0 回  パターン認識 - PowerPoint PPT Presentation


  • 98 Views
  • Uploaded on

第1 0 回  パターン認識. 画像認識の概念. 物体認識(object recognition): 画像中に映っている 認識対象の種別、位置、姿勢を同定 すること 分類(classification): パターン認識 予め与えられた カテゴリーのどれに該当するかを同定 すること    ~  文字認識、音声認識. パターン認識 ・ 記号 (文字,音声,・)が対象 ・ 個人性 が変形要因 ・検出と認識は 独立化 可能. 3D物体認識 ・ 人工物,自然物 が対象 ・ 視点変化 による形状変化が変形要因 ・検出と認識は 不可分.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about '第1 0 回  パターン認識' - reuben-george


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1
第10回 

パターン認識

slide2
画像認識の概念
  • 物体認識(object recognition):

画像中に映っている認識対象の種別、位置、姿勢を同定すること

  • 分類(classification):パターン認識

予め与えられたカテゴリーのどれに該当するかを同定すること 

  ~ 文字認識、音声認識

slide3
パターン認識

・記号(文字,音声,・)が対象

・個人性が変形要因

・検出と認識は独立化可能

3D物体認識

・人工物,自然物が対象

・視点変化による形状変化が変形要因

・検出と認識は不可分

パターン認識 v.s. 3D物体認識
slide6
d

θ

メジャー:距離か、角度か?
  • 距離で測ると濃度の違いは大きい
  • 角度で測ると濃度の違いは小さい
  • 角度で測る(Ss =cos2θ:単純類似度)
slide7
同じパターンとは?
  • 濃度が違うパターンは違うと見るのか?
    • 濃度が違っても同じと見たい(濃度=ノルム)
slide8
白黒の反転は同じか?
  • 濃度の変化を無視するなら、白黒の反転も同じとみるべき
slide9
パターンの分布
  • 超楕円錐形
    • 反対側もある(白黒反転)
slide10
同じパターンとは?
  • 背景が違うパターンは違うと見るのか?
    • 背景が違っても同じと見たい(背景=DC成分)
slide11
正準化とその意義
  • オール灰色パターンの直交補空間に射影
    • オール灰色は意味がない=0であって欲しい

オール灰色

ボケ

ボケ

0に

近づく

正準化

正準化

不変

ボケ

ボケ

slide12
部分空間法
  • 分布を部分空間で近似
    • 部分空間の中を同じと見なす
slide13
f

φ2

θ

φ1

部分空間法.vs. 単純類似度
  • 分布を部分空間で近似vs 代表元(単純類似度)
    • cos2θ= { ( f, φ1 )2+( f, φ2 )2 } / || f ||2

φ1 φ2:正規直交基底ベクトル

← 各クラスに属する

パターンの

自己相関行列R

の固有ベクトル

CLAFIC法(渡辺慧,1969):KL展開により部分空間を作成

slide14
部分空間法

未知入力パターン・ベクトルpと辞書パターン・部分空間Qの成す角度θ1を類似度として識別を行う

N:  N次元の辞書部分空間Qを 張る基底ベクトルの数

(p,qi) : 入力ベクトルpと辞書部分空間 Qの第i基底ベクトルqiとの内績

karhunen loeve
Karhunen-Loeveの展開(KL)法:

共分散行列を対角化する行列で変換することにより無相関化

  • Principal Component Analysis(主成分分析)と同値
    • K. Karhunen (1946)
    • M. Loeve (1948)
    • H. Hotelling (1933)
  • パターン認識での再発見
    • 飯島 泰蔵 (1963)  「視覚パターンの基礎方程式」
    • 渡辺 慧 (1965) 「醜いアヒルの子の定理」
    • E.Oja(1983) Subspace Method(部分空間法)
slide16
複合類似度法
  • 複合類似度法の導出:部分空間法の変形 ~類似度計算過程において,固有値による重み付加
    • { ( f, φ1 )2+λ2/λ1( f, φ2 )2 } / || f ||2
    • カテゴリ lに属するパターン集合を {fα}とする
    • パターン fのカテゴリ lに対する平均類似度
      • Sm(l) [f] =Σαwα(l) (f, fα)2 / {|| f ||2 ||fα||2} =Σm=1M λm(l) (f, φm(l))2 / {λ1(l)|| f ||2} λm(l)、 φm(l) は行列 K(l)の固有値と固有ベクトルK(l)=Σαwα(l) / ||fα||2=Σm=1M λm(l) < φm(l), φm(l) > 上記 Sm(l) [f] の変分を 0 とする極値として求まる
slide17
醜いアヒルの子の定理(渡辺慧,1969)
  • 「醜いアヒルの子と普通のアヒルの子とは、似通った2羽のアヒルの子が似ているのと同じ程度に似ている」

 ~ 2つのものの類似性をある基準(例えば、共に真である記述の個数)で測ると、どの2つの類似性も等しい

 ~ 特徴選択を行っただけでは、対象を複数のクラスに分類することはできない.

 特徴に重要性(重み)を付加することが、パターン認識における特徴選択の本質

slide18

部分空間法のバリエーション
  • 複合類似度法
    • Sm(l)[f] =Σm=1M am(l)( f, φm(l))2 / || f ||2
  • 混合類似度法(大、犬、太を区別したい)
    • Sc(l)[f] =Σm=1M am(l)( f, φm (l))2 / || f ||2 - Σn=1N bm(l)( f, ψn (l))2 / || f ||2
slide19
φ2

f

f

φ1

φ1

部分空間法のバリエーション:軌跡
  • 単純類似度、複合類似度、混合類似度
    • ( f, φ1 )2、 ( f, φ1 )2 + ( f, φ2 )2 、 ( f, φ1 )2 - ( f, φ2 )2

 が一定の軌跡 と ノルム|| f ||

f

φ2

φ2

φ1

slide20
部分空間法の拡張
  • 相互部分空間法
    • 日立の特許
      • 辞書を部分空間にしないで入力を部分空間
    • 辞書・入力両方とも部分空間
      • 相互部分空間法

文字認識手法として提案,顔認識手法として普及

slide21
λmax = 1

λnext = cos2θ

θ

相互部分空間法

Ss(l)[f] = λmaxλmax は行列 Xの最大固有値X = (xij), xij = Σm=1M ( ψi ,φm(l)) ( φm(l),ψj )φm(l)は辞書の部分空間の基底、ψiは fから作られる部分空間の基底

slide22
相互部分空間法

未知入力パターン・部分空間Pと辞書パターン・部分空間Qの成す最小角度θ1に基づいて識別を行う

θ1: 第1正準角(最小正準角)

2つの部分空間の成す角度は統計学に   おいて正準角と呼ばれ、M次元部分空間PとN次元部分空間Q(M≧N)の間にはN個の 正準角が定義できる

入力側がベクトルである部分空間法と比べ、     パターン変動に対する吸収能力を更に高めた手法

slide23
制約相互部分空間法

福井和広,山口修“一般化差分部分空間に基づく制約相互部分空間法”,信学論D‐Ⅱ,Vol.87-D-2,No.8,pp1622-1631(2004-8)

相互部分空間法では識別に貢献しない成分(照明等による影響)まで含めて識別を行う

識別に有効な成分から構成される制約部分空間への射影を相互部分空間法に付加した方法

slide24
本当に部分空間法で良いのか?
  • バナナ分布

入江文平氏が発見

slide25
ノーフリーランチ定理
  • 「あらゆる問題で性能の良い汎用最適化戦略は理論上不可能であり,ある戦略が他の戦略より性能がよいのは、現に解こうとしている特定の問題に対して特殊化(専門化)されている場合のみである.」

 ~ 問題領域の知識を可能な限り使用して  最適化すべき.

slide27
目的

障害者・高齢者(寝たきり・聾唖者)の

社会参加の機会が増大

日常会話が困難な障害者・高齢者との

コミュニケーションシステムの開発

顔画像処理(口部パターン認識)による

対話型コミュニケーションシステムの

プロトタイプ開発

基盤研究(C)(2)「分散視覚エージェントの統合に基づく

親和的情報空間の展開」の一環として実施

slide28
従来のアプローチ筋萎縮性側索硬化症(ALS)を対象

(1) 身体装着センサ方式によるメニュー選択

伝の心(日立ケーイーシステムズ社)・はなしっ子(センサ社)

(2) 脳血液量変化検出方式 による選択

重度ALS患者用Yes/No検出装置(日立製作所)

(3) 表情の変化を使用したスイッチ代行方式

伝の心(日立ケーイーシステムズ社)

視線を用いた文字入力装置

国立身体障害者リハビリテーションセンター研究所・

福祉機器開発部

slide29
口部パターン認識の提案手法

相互部分空間法を用いた口部パターンの認識

4種類の口部パターンの各々の辞書パターンと  未知入力パターンを部分空間で表現し、2つの   部分空間のなす最小角度を尺度として識別を行う

slide30
日常会話の階層化

各階層を4つのグループに分割

slide31
口部形状パターンの割り当てと明度ヒストグラムの対応

“口を開ける”

“歯を見せる”

“舌を出す”

“口をつぼめる”

slide32
明度分布の特徴部分を用いた口部パターン認識(B4・M1)

2つの領域の

面積のみを使用

相互部分空間法を用いた口部パターン認識(M2)

0~255間の全ての明度値を使用して

部分空間を作成

画像明度分布全体を使用して部分空間を作成する

ことにより、個人差による画像明度分布の違いに

対するロバスト性が期待できる

slide33
結果確認のための口部処理

1.口部分の形状を維持

2.口部分の形状を変化

t+1

t+1

255   明度

ヒストグラム変化量(Ht)< TH1

ヒストグラム変化量(Ht) >= TH1

一定時間継続

選択結果は正しい

選択結果が間違っている

slide35
認識結果の比較

共通の辞書部分空間を作成した場合の認識率

口部     パターン

手法

77.1%

80.2%

slide37
個別の辞書部分空間を作成した場合の認識率

被験者A

被験者B

口部     パターン

辞書   部分空間

91.8%

97.5%

個別辞書作成時間 : 1つの口部形状につき,約1sec

slide38
障害者による認識実験
  • 被験者 7名(男性4名,女性3名 年齢38歳~64歳)

・鹿児島市 身体障害者施設・誠光園 入居者

・障害等級 1級~2級

・障害名

  脳卒中による身体の部分的な機能全廃・機能障害

  脳性小児麻痺

  頚椎先天奇形による機能障害

ad