160 likes | 275 Views
日中機械翻訳における 名詞訳語の選択. 鳥取大学大学院工学研究科 展瑜 徳久雅人 池原悟 村上仁一. 研究の背景. ● 機械翻訳の問題:名詞の訳語選択 例:あんなに働いてよく 体 が続くものだ < 身体 >< 体格 > ・・・ < 体力 > ● 従来 の方法: 日英翻訳の場合:意味属性による翻訳方式 「結合価文法による動詞と名詞の訳語選択能力の評価」(金出地 2003 ) 例:彼は友人を 家 まで送った. 訳語候補 ●本研究の考え:日中翻訳において名詞訳語選択. 具体. 「家族」 family 「 居住施設 」 house
E N D
日中機械翻訳における 名詞訳語の選択 鳥取大学大学院工学研究科 展瑜 徳久雅人 池原悟 村上仁一
研究の背景 ●機械翻訳の問題:名詞の訳語選択 例:あんなに働いてよく体が続くものだ <身体><体格>・・・<体力> ●従来の方法: 日英翻訳の場合:意味属性による翻訳方式 「結合価文法による動詞と名詞の訳語選択能力の評価」(金出地 2003) 例:彼は友人を家まで送った. 訳語候補 ●本研究の考え:日中翻訳において名詞訳語選択 具体 「家族」 family 「居住施設」house 「家屋」 house 人 具体物 場所 家族 居住施設 家屋
目 的 日本語の基本名詞に対して訳語の多義構造 日中翻訳における「意味属性体系」の 識別能力 日中機械翻訳のための意味属性体系の提案
日本語基本名詞の訳語の多義構造 ●対 象: IPALの基本名詞1,081語 「計算機用日本語名詞辞書IPAL解説編 情報処理振興事業協会技術センター 1996」 ●使用辞典: 日中辞典 「北京・対外経済貿易大学と商務印 書館及び日本小学館の共同編集1987」 ●出力データ:「対応表」
●日本語基本名詞の中国語訳語多義分布 (対象:1081語基本名詞) 最大多義数:30, 多義:60%の基本名詞
●日英中の結果と比較 (1,081語の多義について) 例:「手」の多義: 10 5 30 日、英の結果:「日英機械翻訳における名詞の訳語選択」(桐沢 2000)
意味属性の語義識別能力 ●意味属性による訳語選択 単語の「意味的用法」が分かれば,その単語がどの 語義で使用されたか判断できる可能性がある 見出し語 意味属性 訳語語義 例文 訳し分け可能 树木 木头 梆子 樹木 材木 楽器 木を植える 木 木で造った家 木を入れる スポーツ着 制服 仕事着 运动服 衣服 制服 工作服 訳し分け不可能 ユニフォーム
●日中において既存意味属性の適用性 意味属性体系の量的な有効性 (対象:1081語基本名詞) 問題あり
訳語の多義から見た名詞の分類 (対象:多義を持つ見出し語,638語) 問題あり
中国語は語義が広い ●考 察 意味属性の粒度が不適切 原因 訳語が他の品詞 対応する意味属性がなし 意味の包含関係の差
日中翻訳のための意味属性体系 意味属性の拡張 ●既存の意味属性の再配置(252語) 例:見出し語 意味属性 訳語語義 拡張した意味属性 594 手 手 1035 方法 手段 手 1166 権利 归……所有 592 腕 臂 - 手掌 596手のひら - 笔迹 1097筆跡 - 手指头 598手の指 ・ ・ ・ ・ ・ ・ ・ ・ ・ - (手里的)棋子[牌] 921遊び道具・運動具 既存意味 属性体系
例:日本語 意味属性 中国語 鳥 「538 鳥」 鸟 鸡 ●意味属性の細分類(48語) 536 動物 538 鳥 538.1 鳥<野禽類> 538.2 鳥<家禽類> 537 獣 538 鳥 <鸟> 雀,烏等 <鸡> 鶏,家鴨等
●新しい意味属性の追加(10語) 686 植物(部分) 687 芽・苗 690 根 ・・・・・・ 697 花 700 実・種子・穂 704 樹皮・果皮 705 細胞 例: 686 植物(部分) ・・・・・・ 697 花 700 実・種子・穂 704 樹皮・果皮 704zy 木質部(追加した意味属性) 705 細胞 図:木の断面図
●意味属性を拡張した効果 意味属性の量的な有効性 (対象:1081語基本名詞) 問題あり
訳語の多義から見た名詞の分類 (対象:多義を持つ見出し語,638語) 問題あり 日英割合:「日英機械翻訳における名詞の訳語選択」(桐沢 2000)
まとめ ●日中翻訳において意味的用法による名詞の 訳語選択 • 日英のための意味属性体系を日中に適用 • 拡張すべき点を考察 • 拡張を行い,訳し分けの効果を確認 結果: 訳語が一意に決まる場合 全単語1,081語の場合: 49% 71% 多義のある638語の場合:15.5% 59.5% ●結論:日中翻訳にも「意味属性体系」が有効