音声・音響信号を対象とした
This presentation is the property of its rightful owner.
Sponsored Links
1 / 27

音声・音響信号を対象とした ブラインド音源分離 PowerPoint PPT Presentation


  • 176 Views
  • Uploaded on
  • Presentation posted in: General

音声・音響信号を対象とした ブラインド音源分離. 奈良先端科学技術大学院大学 猿渡 洋 [email protected] 本日の発表内容. ブラインド音源分離( BSS )研究の背景 独立成分分析( ICA )に基づく BSS の説明 時間領域 ICA 周波数領域 ICA 各領域 ICA の適用限界を実証 周波数領域 ICA と時間領域 ICA を統合した多段 ICA に基づく音源分離手法の提案 実環境下における分離実験結果および考察 まとめ. ?. 干渉音. ユーザ以外の干渉音がマイクロホンに混入. 音声認識精度の劣化. 背景.

Download Presentation

音声・音響信号を対象とした ブラインド音源分離

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


2915173

音声・音響信号を対象としたブラインド音源分離

奈良先端科学技術大学院大学

猿渡 洋

[email protected]


2915173

本日の発表内容

  • ブラインド音源分離(BSS)研究の背景

  • 独立成分分析(ICA)に基づくBSSの説明

    • 時間領域ICA

    • 周波数領域ICA

  • 各領域ICAの適用限界を実証

  • 周波数領域ICAと時間領域ICAを統合した多段ICAに基づく音源分離手法の提案

  • 実環境下における分離実験結果および考察

  • まとめ


2915173

干渉音

ユーザ以外の干渉音がマイクロホンに混入

音声認識精度の劣化

背景

ハンズフリー音声通信・認識システム

今日の

天気は何?

マイクロホン

音声認識システム

ユーザ


Cont d

背景(Cont’d)

  • 研究の目標

    • 雑音に頑健なハンズフリー音声処理システム の実現

  • マイクロホンアレー

    • 複数のマイクロホン素子から構成される受音器

    • 目的信号の強調,雑音抑圧が可能

  • マイクロホンアレー処理の欠点

    • 音源の到来方位推定が必要

    • 適応のために無音区間の推定が必要


2915173

ブラインド音源分離

  • 複数の音源信号が混在して観測される場合,観測信号のみから音源信号を推定する技術

    • 独立成分分析(ICA)に基づく手法が主流


2915173

互いに

独立

既知 

音源信号を推定

ICAに基づくブラインド音源分離

事前情報が不要(教師無し適応)

おはよう

話者1

音源1

観測信号1

マイクロホン1

マイクロホン2

観測信号2

こんにちは

音源2

話者2


2915173

<音声応用における課題>

残響に頑健なブラインド音源分離

アルゴリズムの構築

ブラインド音源分離

  • 複数の音源信号が混在して観測される場合,観測信号のみから音源信号を推定する技術

    • 独立成分分析(ICA)に基づく手法が主流

高残響(実)環境下では十分な性能が得られない

(残響時間=0.3秒 ←2400 taps FIRフィルタ)


2915173

時間領域ICA(TDICA)

時間領域においてFIR型の音源分離フィルタを 推定

周波数領域ICA(FDICA)

周波数領域において各周波数帯域毎に音源分離フィルタを推定

従来のアプローチ


Tdica

<利点>

  • 信号自身が有する独立性を評価可能

  • 最適点近傍での収束性に優れている

TDICAに基づく音源分離手法


Tdica1

TDICAの適用

  • 一般の残響抑圧信号処理においては,フィルタ長を長くすることにより残響抑圧性能が向上する

<仮説>

TDICAにおいても,分離フィルタ長を長くする

 ことにより,残響に頑健な音源分離が可能か?

フィルタ長と分離性能の関係を調査


2915173

実験条件

素子間隔:

4 cm

残響時間:

300 ms

  • 原音声: 男女各2名による2短文

    12通りの組み合わせ

  • 音源分離性能の尺度: 干渉音の抑圧量 [dB]


2915173

<欠点>

  • 反復学習規則が複雑

  • 残響環境下では収束性が悪い

  • 直接音,初期反射音成分の分離しかできない

フィルタ長を長くしても

分離性能は向上しない

フィルタ長と分離性能の関係


Fdica

f

<利点>

  • 周波数変換することにより混合問題を簡単化

  • 分離フィルタの最適化を安定かつ高い収束性で実現

FDICAに基づく音源分離手法


Fdica1

FDICAの適用

  • 一般の残響抑圧信号処理においては,帯域分割数(フィルタ長)を増やすことにより残響抑圧性能が向上

<仮説>

FDICAにおいても,分離フィルタの帯域分割数を

増やすことにより,残響に頑健な音源分離が可能か? 

帯域分割数と分離性能の関係を調査


2915173

過度に分割数を増やすと分離性能劣化

<新たな仮説>

帯域分割数を過度に増やすと狭帯域信号間の

独立性の仮定が成立しなくなる?

狭帯域信号間の独立性を定量的に評価するために,

帯域分割数と狭帯域信号間の相関値の関係を調査

帯域分割数と分離性能の関係


2915173

<欠点>

帯域分割数を過度に増やすと狭帯域信号間の

相関が強くなり,独立性の仮定が成立しなくなる

帯域分割数と狭帯域信号間の相関値の関係

過度に分割数を増やすと相関が強くなる


2915173

<欠点>

FDICAでは帯域分割処理により十分な分離性能

に達しない段階で性能が飽和する

帯域分割数と分離性能の関係

相関低い

残響に強い

相関強い

残響に弱い

音源分離性能

帯域分割数

少ない

多い


2915173

利点

周波数変換により 混合問題を簡単化

反復学習における安定性,高速収束性

欠点

帯域分割処理により独立性の仮定が崩壊

分離性能が飽和

補う 

補う 

前段

後段

利点を共に有効利用

FDICAとTDICAを統合した

多段ICA(MSICA) by 西川 他, 2001

各領域ICAの利点・欠点

周波数領域ICA(FDICA)

時間領域ICA(TDICA)

  • 利点

    • 信号自身が有する 独立性を評価可能

    • 最適点近傍での収束性に優れている

  • 欠点

    • 反復学習規則が複雑

    • 残響環境下では収束性が悪い


Msica

MSICAの分離過程

周波数領域ICA

(FDICA)

時間領域ICA

(TDICA)

混合システム

  • 混合問題を簡単化

  • 反復学習における安定性,

      高速収束性

  • 信号自身が有する独立性を

    評価可能

  • 最適点近傍での高収束性


2915173

提案手法の有効性検証

  • MSICAにおけるTDICA部のフィルタ長と分離 性能の関係を調査

  • TDICA,FDICA,及びMSICAの分離性能比較


2915173

MSICAのTDICA部では長いフィルタによる学習が可能

フィルタ長と分離性能の関係

9.4


2915173

提案手法の有効性検証

  • MSICAにおけるTDICA部のフィルタ長と分離 性能の関係を調査

  • TDICA,FDICA,及びMSICAの分離性能比較


2915173

各ICAの分離性能比較

12通りの平均: TDICA: 5.9 dB,FDICA: 9.4 dB,MSICA:12.1 dB


2915173

考察

  • FDICAでは帯域分割処理により十分な分離性能に達しない段階で性能が飽和

  • TDICAでは反復学習規則が複雑であるため長いフィルタによる分離が困難

  • MSICAを用いることでTDICA,FDICAを上回る分離性能が得られた

  • MSICAは本質的にTDICA,FDICAの問題点を解決したといえる


Msica1

MSICAによる分離音声の一例

  • 残響時間 300 ms

    • 混合音声(女性,男性)

    • 分離音声(女性)

    • 分離音声(男性)

女声

男声

-30°

40°

2素子

4cm間隔


2915173

まとめ

  • 残響環境下における時間領域ICA(TDICA), 周波数領域ICA(FDICA)の適用限界を実証

  • FDICAとTDICAを統合した多段ICA(MSICA)に基づくブラインド音源分離手法を提案

  • TDICA,FDICA,及びMSICAの分離性能比較

    • MSICAにおけるTDICA部では長いフィルタの学習が可能であることを確認

    • MSICAの性能はTDICA,FDICAの性能を上回ることを確認


2915173

今後の課題

現在のICAではまだまだ長い残響に対応できない 

⇒音響信号処理の知見を有効に利用  

    空間情報(音源の方位,位置など)の利用

  • 音声認識による性能評価

  • さらに複雑な混合の分離問題に関する検討

    • 雑音が付加された混合

    • 3個以上の複数音源が存在する混合


  • Login