Download
1 / 5

ピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築 - PowerPoint PPT Presentation


  • 65 Views
  • Uploaded on

ピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築. 綱川 隆司 1    岡崎 直観 1     辻井 潤一 1,2 1 東京大学大学院情報理工学系研究科コンピュータ科学専攻 辻井研究室 2 School of Computer Science, University of Manchester / National Centre for Text Mining, UK. モチベーション. 英語とその他の言語の2言語間の対訳辞書は,英語以外の2言語間の対訳辞書に比べ資源が豊富

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'ピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築' - fawzi


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

ピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築ピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築

綱川 隆司1   岡崎 直観1    辻井 潤一1,2

1東京大学大学院情報理工学系研究科コンピュータ科学専攻 辻井研究室

2School of Computer Science, University of Manchester / National Centre for Text Mining, UK


モチベーションピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築

  • 英語とその他の言語の2言語間の対訳辞書は,英語以外の2言語間の対訳辞書に比べ資源が豊富

  • 英語を中間言語(ピボット言語)として英語以外の2言語の単語を結びつけることで,既存の対訳辞書に比べより多くの対訳項目の獲得が期待できる

  • 辞書の英語項目によって単純に結びつけるだけでなく,統計的機械翻訳を用いて可能な限り結びつける


対訳辞書のマージピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築

単純な辞書マッチングでは1対訳しか

獲得できない


対訳辞書のマージピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築


フレームワークピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築

代谢综合症

中英対訳

フレーズ対

(確率付き)

p(メタボリック|代谢)=0.35

p(シンドローム|综合症)=0.50

中英

対訳辞書

フレーズベース

統計的

機械翻訳

マージした

日中対訳

フレーズ対

(確率付き)

同一の英語を持つフレーズ対の併合・確率の再計算

単語アラインメント・対訳フレーズ対抽出

メタボリック

シンドローム

日英対訳

フレーズ対

(確率付き)

日英

対訳辞書

中英辞書の

日本語訳

その他の特徴等


ad