50 likes | 137 Views
ピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築. 綱川 隆司 1 岡崎 直観 1 辻井 潤一 1,2 1 東京大学大学院情報理工学系研究科コンピュータ科学専攻 辻井研究室 2 School of Computer Science, University of Manchester / National Centre for Text Mining, UK. モチベーション. 英語とその他の言語の2言語間の対訳辞書は,英語以外の2言語間の対訳辞書に比べ資源が豊富
E N D
ピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築ピボット言語を介したフレーズベース統計的機械翻訳を用いた対訳辞書の構築 綱川 隆司1 岡崎 直観1 辻井 潤一1,2 1東京大学大学院情報理工学系研究科コンピュータ科学専攻 辻井研究室 2School of Computer Science, University of Manchester / National Centre for Text Mining, UK
モチベーション • 英語とその他の言語の2言語間の対訳辞書は,英語以外の2言語間の対訳辞書に比べ資源が豊富 • 英語を中間言語(ピボット言語)として英語以外の2言語の単語を結びつけることで,既存の対訳辞書に比べより多くの対訳項目の獲得が期待できる • 辞書の英語項目によって単純に結びつけるだけでなく,統計的機械翻訳を用いて可能な限り結びつける
対訳辞書のマージ 単純な辞書マッチングでは1対訳しか 獲得できない
フレームワーク 代谢综合症 中英対訳 フレーズ対 (確率付き) p(メタボリック|代谢)=0.35 p(シンドローム|综合症)=0.50 中英 対訳辞書 フレーズベース 統計的 機械翻訳 マージした 日中対訳 フレーズ対 (確率付き) 同一の英語を持つフレーズ対の併合・確率の再計算 単語アラインメント・対訳フレーズ対抽出 メタボリック シンドローム 日英対訳 フレーズ対 (確率付き) 日英 対訳辞書 中英辞書の 日本語訳 その他の特徴等