220 likes | 375 Views
意味属性の共起による 「 A の B」 型名詞句の翻訳規則. 鳥取大学 工学部 ○徳久雅人 守谷有司 村上仁一 池原 悟. 1.はじめに. 「A の B」 型名詞句の機械翻訳 日本語での意味は多彩 ⇒ 様々な英語表現に翻訳 教師の経験 ⇒ experience as a teacher 左側の脳 ⇒ left side of brain. A. B. B. as. A. A. B. A. of. B. 先行研究. 「A の B」 型名詞句の意味分類・意味解析 [島津ら86],[冨浦ら95]
E N D
意味属性の共起による「AのB」型名詞句の翻訳規則意味属性の共起による「AのB」型名詞句の翻訳規則 鳥取大学 工学部 ○徳久雅人 守谷有司 村上仁一 池原 悟 FIT2003
1.はじめに • 「AのB」型名詞句の機械翻訳 日本語での意味は多彩 ⇒ 様々な英語表現に翻訳 教師の経験 ⇒ experience as a teacher 左側の脳 ⇒ left side of brain A B B as A A B A of B FIT2003
先行研究 • 「AのB」型名詞句の意味分類・意味解析 [島津ら86],[冨浦ら95] • 用例ベースによる翻訳 [飯盛ら96] ⇒意味的関係を用いた網羅的規則作成が困難 • 意味属性・文法属性による翻訳規則 [池原ら02] ⇒検討した英語表現は8つ,自動化未着手 FIT2003
本研究の目的 「AのB」型名詞句の機械翻訳 • 広範な英語表現に対応 • 意味属性を用いた規則の半自動作成 • ■ 手順 • 大規模な日英表現対を収集・分類 • 意味属性の共起を用いた規則の作成 • 相補的規則の追加 • 実験 FIT2003
2.英語表現の分類 • 本研究で取り扱う名詞句 • 係り受け関係がある名詞句 例文:リンゴの木に花が咲いている。 対訳:The apple trees are in blossom. • 取り扱わない名詞句 • 英訳部分が名詞句でない. 例文:食事の支度ができましたから,席に着いて下さい。 対訳:When the meal is ready, please come to your seat. • 複合名詞,形式名詞などの場合 FIT2003
「AのB」の抽出 平和,象徴 辞書引き peace, symbol 表現の抜粋 symbol of peace 標本の収集 日英文対応コーパス: 33万件 ハトは平和の象徴だ。 / The dove is the symbol of peace. 「AのB」アライメント 失敗 手作業で再収集 約3万件の 標本を収集 成功 手作業で確認
candle flame (ロウソクの炎) ⇒ A + B 型 star in the sky (空の星) ⇒ B in A 型 英語表現の分類 • 英語表現の選択規則を作るために, 英語表現を分類 分類結果: 英語表現 49 種類 翻訳対象: 28種類(出現頻度が10件以上) 標本全体の 99 %をカバー FIT2003
3.意味属性規則の作成 意味属性: 日本語語彙大系の一般名詞意味属性 • 形態素解析結果は意味属性が曖昧 • 5,000件を手作業で絞り込み,学習データに (例) 林檎の花 / apple blossom 林檎 (【果樹】,【果物】) 花 (【花(本体)】,【舞踊・演劇・諸芸】,【興隆】) if【果樹】の【花(本体)】then A+B 型
一般名詞 果樹 林檎 果物 一般名詞意味属性体系 名詞 具体 抽象 … … …… …… …… …… 生物 無生物 植物 動物 …… 果樹 樹木 果物 菓子 FIT2003
3.意味属性規則の作成 意味属性: 日本語語彙大系の一般名詞意味属性 • 形態素解析結果は意味属性が曖昧 • 5,000件を手作業で絞り込み,学習データに (例) 林檎の花 / apple blossom 林檎 (【果樹】,【果物】) 花 (【花(本体)】,【舞踊・演劇・諸芸】,【興隆】) if【果樹】の【花(本体)】then A+B 型
汎化による規則の自動生成 • 意味属性の汎化による規則のカバー率向上 店のカレー if 【商店】の【飯】 then B at A 型 [中井ら99]の手法により他の規則との競合を回避 2項目についての汎化 【商店】の上位概念 ⇒ 【店舗等】 【飯】の上位概念 ⇒ 【料理】 if 【店舗等】の【料理】 then B at A 型 「レストランのピザ」にもマッチ
意味属性規則の生成数 合計: 440,545 個 FIT2003
4.相補的規則の作成 • 意味属性による一般規則がなじまない 先行研究[飯盛ら96],[池原ら02] • 「名詞字面」による規則...英語6表現,90規則 「係る動詞」による規則...英語6表現,47規則 (例) 「彼の家」 ⇒ 所有格 + B 「上着の雪を払う」 ⇒ B from A FIT2003
5.実験 • 目的: 英語表現型の選択性能を評価 • 方法: • 「AのB」型名詞句を含む文を入力 (規則作成に使わなかった標本 1,000 件) • 単語訳し分けは不問.英語表現型に注目 • 評価者1名(大学院生) • 評価基準: ◎:対訳と一致 ○:対訳と一致しないが規則の表現でも可 △:動詞などによっては規則の表現でも可 ×:誤った英語表現 FIT2003
○.例文:患者の体温 正解:the patient’s temperature A’s B型 出力:temperature of a patient B of A型 △.例文:彼の指示 (を受ける) 正解:instruction from him B from A 型 出力:his instruction 所有格+B型 FIT2003
実験結果 ※ 形態素解析誤りは評価対象外 選択精度: 意味属性規則のみ...60.1 % (◎と○) 相補規則と併用........69.3 % FIT2003
6.考察:誤りの原因 i ) 単語に複数の意味属性がある場合 入力: 屋上の望遠鏡 正解: the telescope on the roof (B on A 型) 出力: the telescope in the roof (B in A 型) 意味属性 解析結果 【上】 屋上 【家屋(部分〈場(その他)〉)】 if【家屋】の【機械】 then 「B in A」 型 適用規則 今後の課題 ⇒ 複数の意味属性からなる条件の記述
汎化による 生成は過剰 意味属性では 困難 291【乗務員】 292【運転手】 293【乗務員(その他)】 列車の車掌 conductors on this train (B on A) ii) 類似する意味関係に様々な英語表現 タクシーの運転手 taxi driver (A+B) オートバイのライダー motorcyclist (単語) FIT2003
7.おわりに • まとめ • 「AのB」型名詞句とその対訳を約 3 万件収集 • 28種類の英語表現に着目 (カバー率 99 %) • 意味属性規則を半自動生成 (5千→44万個) • 手作業で相補規則を作成 (137個) • 表現選択実験 • 意味属性規則のみの正解率: 60.1 % • 補足規則と併用時の正解率: 69.3 % FIT2003
今後の課題 • 自動生成のために • 意味属性の絞込みの自動化 • 選択精度向上のために • 複数の意味属性を条件とする規則の設計 • 動詞規則(結合価パターン)の強化 • 翻訳のために • 名詞訳語選択 FIT2003