結合価文法による動詞と
This presentation is the property of its rightful owner.
Sponsored Links
1 / 33

結合価文法による動詞と 名詞の訳語選択能力の評価 PowerPoint PPT Presentation


  • 68 Views
  • Uploaded on
  • Presentation posted in: General

結合価文法による動詞と 名詞の訳語選択能力の評価. 鳥取大学大学院工学研究科 金出地真人  徳久雅人       村上仁一   池原悟. 研究の背景. 複数の訳語を持つ語の 訳語選択の問題. 例:送る     I send a letter. I see her off . I spend summer vacation. 結合価文法による翻訳方式. 結合価文法による訳語選択. 結合価パターン対の例

Download Presentation

結合価文法による動詞と 名詞の訳語選択能力の評価

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


3939025

結合価文法による動詞と名詞の訳語選択能力の評価

鳥取大学大学院工学研究科

金出地真人  徳久雅人  

    村上仁一   池原悟


3939025

研究の背景

複数の訳語を持つ語の

訳語選択の問題

例:送る    I send a letter.

I see heroff.

I spend summer vacation.

結合価文法による翻訳方式


3939025

結合価文法による訳語選択

結合価パターン対の例

見出し語:『送る』  パターン数12

  • N1(人) が N2(休暇) を 送るN1 spend N2

  • N1(人) が N2(生活) を 送る  N1 live N2

  • 用言と格要素(体言+助詞)の関係を記述

  • 一般名詞意味属性によって体言を制約


3939025

一般名詞意味属性体系

約40万語の一般名詞を最大12段の木構造を構成する2710の意味属性に分類

名  詞

抽  象

具  体

抽象物

主  体

場  所

[ ]

私、彼、彼女…

岩波書店 1997

日本語語彙体系より


3939025

パターンの例文への適用方法

例:彼は友人を家まで送った。

1.用言『送る』のパターンを検索

見出し語:送る

(1) N1(人) が N2(休暇) を 送るN1 spend N2

(2) N1(人) が N2(生活) を 送る  N1 live N2

(3) N1(主体)が N2(主体) を N3(場所) に/へ/まで 送る

N1 seeN2 toN3

2.格要素、意味属性、助詞の適合率からパターンを決定

3.パターンの意味属性による体言の訳語選択

『家』の意味属性と訳語

<家族>:home、<居住施設>:house、<家屋>:house


3939025

研究の目的

結合価文法の効果が定量的には不明

評価実験で定量的に検証

結合価文法の有効性を考察


3939025

評価実験

実験の手順

1.結合価文法を用いて例文を翻訳

2.正解例と1の翻訳結果を比較、評価

評価対象:IPAL辞書[情報処理振興事業協会技術センター 1996]

・重要な日本語基本動詞、名詞を収録

・各単語の用法ごとに日本語例文付

・例文の英訳は翻訳家により作成

・例文は多くが単文

・例文数:動詞5242文、名詞1062文


3939025

結合価文法の適用方法

・結合価文法の人手ででの適用は困難

            ↓

・翻訳ソフト『ALT-J/E』を使用

実験システム:ALT-J/E

<特徴>

・翻訳アルゴリズムに結合価文法を使用

<問題点>

・頻度情報によりパターンを決定

          ↓

・人手による適用より精度が高い可能性


3939025

評価基準

・対象とする動詞、名詞部分のみ評価

・評価は『○』『△』『×』の三段階

・評価者1名で判断

評価○:ALTの訳と対訳の訳語が一致した場合

例:二つの川がこの地点で合う。

対訳:The two rivers join at this point.

ALT訳:Two rivers join in this point.


3939025

評価△:ALTと対訳の訳語が異なるが、

     意味的に正しい場合

例:彼は準備を急いだ。

対訳:He prepared quickly.

ALT訳:He hurried preparation.

評価×:ALTの訳が意味的にも間違っている場合

  例:彼らは海底に沈んでいた船を陸に揚げた。

  対訳:They salvaged the sunken vessel on

the bottom of the sea.

ALT訳:They deep-fried in land the ships

that had sunk in the bottom of the sea.


3939025

比較対象

デフォルト訳語

・各単語の訳語で最もよく使われる語

・PROCEED和英辞書の先頭に表記されている語

例:『送る』

①【荷物などを】send ← デフォルト訳語に決定

②【人を】(見送る)see

③【時を過ごす】spend

・評価基準はALTと同じ基準


3939025

実験結果(動詞)


3939025

実験結果(名詞)


3939025

考察(動詞)

  • 実験結果より結合価文法により89%の例文に対し、意味の正しい動詞の訳語を選択

  • 11%の例文について訳語選択に失敗              ↓

        原因を調査し結合価文法の           有効性の限界を調査


3939025

正しい動詞訳語を選択できなかった原因

・5242文中誤り589文→122文調査


3939025

1.パターンが登録されていない場合(21%)

例:学生が教授に教授の都合を電話で伺った。

対訳:The student phoned the professor and asked him

when he would be free.

ALT:A student listened the professor’s circumstances

with a telephone to a professor.

例文に対応したパターンなし

結合価文法を使えず訳語選択に失敗

足りないパターンの追加により解決

例:N1(人) が N2(人) に N3(状態) を 伺う N1 ask N2’s N3


3939025

2.パターンの照合に失敗した場合(37%)

例:彼は海外で夏休みを送った。

対訳:He spend his summer vacation abroad.

ALT:He saw a summer vacation off at a foreign country .

動詞『送る』のパターン

「N1(主体) が N2(主体) を N3(場所) で 送る N1 see N2 off at N3」

「N1(人) が N2(休暇、時間) を 送る N1 spend N2」

                   :

ALTがパターン照合に失敗

パターン照合アルゴリズムの修正により改善の余地有り


3939025

3.慣用表現が用いられている場合(11%)

例:彼は話の腰を折った。

対訳:He interrupted a person’s speech.

ALT訳:He broke the waist of talk.

慣用表現専用のパターンの登録が必要

  例:N1(人)が話の腰を折る N1 interrupt a person’s speech


3939025

4.形態素解析に失敗した場合(9%)

5.係り受け解析に失敗した場合(17%)

・訳語選択を行なう前処理の問題

         ↓

・正しく処理されることが前提条件

訳語選択の問題ではないので対象外


3939025

6.例文が複数の意味にとれる場合(5%)

例:職場の不満から彼は家族の者に当たった。

対訳:He was hard on his family because of

complaints he had about his job.

ALT訳:He corresponded to the person of his

family from the discontent of a place of work.

例文に対応するパターン

「N1(人) が N2(人) に当たる」

?

be hard on

?

correspond to

結合価文法による訳し分けの限界


3939025

パターン数別の正解率

・パターン数の増加による訳語精度の向上

・パターン数の増加によるパターン選択ミスの可能性

パターンの数が多いとパターン選択が困難


3939025

動詞のまとめ

結合価文法の有効性

・評価実験の結果、89%の正解率

・原因の解決により9~10%の精度向上

結合価文法の限界

・文脈上複数の意味にとれる文に対しては一意に決定不可


3939025

考察(名詞)

  • デフォルトの訳語に比べ6%の精度向上

  •             ↓

  • 動詞の評価結果に比べ効果少

  • 原因

  • IPAL名詞の約5割が多義なし

  •          ↓

  •  デフォルトの正解率の上昇

  • ・結合価文法は用言の訳語選択を目的に開発


3939025

正しい名詞訳語を選択できなかった原因

・調査文数1062文


3939025

3.パターンの格要素の制約が弱い場合(17%)

例:彼は相手に 意向 を質した。

対訳:He asked the other party of their intention.

ALT訳:He asked his partner about a mind.

例文に対応するパターン

「N1(主体)がN2(主体)にN3(抽象)を質す」

名詞

意向の意味属性と英訳語

<意図>:intention

<思想>:mind

     ↓

いずれの意味属性も<抽象>

配下のため、一意に決定不可

具体

抽象

思想

意図


3939025

解決手段の考察

・意味属性の深いパターンを追加

例:「N1(主体)がN2(主体)にN3(意図)を質す」

             ↓

     正しいパターン選択は困難

             ↓

パターンですべての意味属性を一意に決定不可

原因

・パターンは用言の訳し分けが目的

          ↓

・用言の英訳語が同じ場合、他のパターンと

 区別できるだけの意味属性の定義で充分


3939025

4.対象の名詞がパターンの要素外の場合(8%)

例:逃亡した男は地方で生き延びている。

対訳:The man who escaped is surviving in the countryside.

ALT訳:The man who escaped has survived in a district.

例に対応するパターン

「N1(主体、動物)が生き延びる」

         ↓

『地方』を含む格要素はパターン外

解決の可能性

パターンに任意格の追加

例:「 N1(主体、動物)が 【N2(村落)で】 生き延びる」


3939025

6.慣用表現(24%)

例:彼女は亭主を尻に敷いている。

対訳:She dominates her husband.

ALT訳:She is spreading her husband out on the back.

・動詞の場合と同様に個別のパターンを登録で解決

例:「N1(主体)がN2(主体)を尻に敷く  N1dominate N2」

その他の原因

パターンの追加などによる解決は不明

(∵原因3、4より)


3939025

先行研究との比較

先行研究(桐澤 2000)

・意味属性によるIPALの名詞の訳し分け精度を調査


3939025

本研究の結果との対比

意味属性によって訳し分け精度が若干向上


3939025

本研究の結果との対比

・意味属性決定による訳し分け精度の効果を確認


3939025

名詞のまとめ

結合価文法の有効性

・評価の結果、正解率がデフォルトより6%向上

・慣用表現のパターン追加により3%の精度向上

結合価文法の限界

・パターンの定義外の名詞は訳し分け不可

・すべての名詞についてパターンの登録は不可


3939025

まとめ

・IPAL辞書の基本動詞、名詞の訳し分け精度を調査

正解率

動詞89%(デフォルト55%)、名詞91%(85%)

限界

動詞98~99%、名詞94%

今後の課題

・IPAL辞書以外の動詞、名詞への効果調査


  • Login