1 / 1

 ・大量のテキストを統計的に解析することで特徴空間を得る  ・学習データに存在しなかった単語の共起関係も予測できる         文書  単  語

1-Q-26 LSA に基づく One-Class SVM を用いた音声認識仮説の検証. 松本 智彦, 佐古 淳, 滝口 哲也, 有木 康雄 ( 神戸大 ). 研究背景・目的. アプローチ.  ・音声認識器による不適切な文書の湧き出し  ・現在の音声認識は音響モデルと言語モデルのみに基づく  ・自動的に不適切な文書を検出し,訂正する手法を提案.  ・書き起こし文書を適切な文書とし,その特徴ベクトルを One-Class SVM により学習  ・仮説文が学習で求まったクラスに含まれるかどうかで   適切な文書か識別. 検証. 音声.

Download Presentation

 ・大量のテキストを統計的に解析することで特徴空間を得る  ・学習データに存在しなかった単語の共起関係も予測できる         文書  単  語

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 1-Q-26LSA に基づくOne-Class SVM を用いた音声認識仮説の検証 松本 智彦, 佐古 淳, 滝口 哲也, 有木 康雄 (神戸大) 研究背景・目的 アプローチ  ・音声認識器による不適切な文書の湧き出し  ・現在の音声認識は音響モデルと言語モデルのみに基づく  ・自動的に不適切な文書を検出し,訂正する手法を提案  ・書き起こし文書を適切な文書とし,その特徴ベクトルを One-Class SVMにより学習  ・仮説文が学習で求まったクラスに含まれるかどうかで   適切な文書か識別 検証 音声 Latent Semantic Analysis (LSA) 学習 音声認識  ・大量のテキストを統計的に解析することで特徴空間を得る  ・学習データに存在しなかった単語の共起関係も予測できる         文書  単  語  ・ vjSを文書の特徴ベクトルと考えることができる 書き起こし文書 複数の仮説文 LSA LSA空間に射影 κij:文書cjにおける単語riの出現回数 λj :文書cjに含まれる全単語数 τi :全文書中での単語riの出現回数 N :全文書数 One-Class SVMによる適切な文書の学習 適切な文書か検証 × ふさわしい仮説文を選択 ストップワードの指定にも利用 認識結果 c1・・・ cj・・・ cN v1T・・・ vjT・・・ vNT 適切な文書 学習により 求まった境界 W U S VT r1 ・ ・ ・ ri ・ ・ ・ rM u1 ・ ・ ・ ui ・ ・ ・ uM = 学習データ R×R R×N 仮説文 特異値分解による次元圧縮 不適切な文書 M×R M×N O 実験条件 実験結果 Juliusの出力した1-bestと,提案手法により得られた  認識結果を,ストップワードとしなかった単語のみの  単語誤り率(WER)で比較 対話                  対話タスクはかなりくだけた発話であるため                  認識率が著しく低い CSJ  改善例 考察 今後の予定 ・認識率の低いタスクにおいて提案手法は有効ではない  ・文書数が膨大になるとLSAによりトピックを捉えきれない  ・n-bestではキーワードとなる単語の変化が少ない  ・挿入誤りの湧き出し  ・読み上げ音声に対する提案手法の適用  ・Confusion Networkを用いた検証  ・音声認識スコアとOne-Class SVMスコアの統合

More Related