1 / 17

テキストから獲得可能な因果関係知識の類別 およびその自動獲得の試み -接続助詞「ため」を含む文を中心に-

テキストから獲得可能な因果関係知識の類別 およびその自動獲得の試み -接続助詞「ため」を含む文を中心に-. 乾孝司 乾健太郎 松本裕治 奈良先端科学技術大学院大学 takash-i@is.aist-nara.ac.jp. 概要 (1分サマリー). 接続標識を含む文から 因果関係知識を獲得する. 【 目的 】. よく晴れた ため 洗濯物が早く乾いた。. cause ( 〈 よく晴れる 〉 , 〈 洗濯物が早く乾く 〉 ). 【 知見1 】. 「ため」複文全体の約 90 %から、 cause, effect, precondition, means 関係の

thor
Download Presentation

テキストから獲得可能な因果関係知識の類別 およびその自動獲得の試み -接続助詞「ため」を含む文を中心に-

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. テキストから獲得可能な因果関係知識の類別およびその自動獲得の試み-接続助詞「ため」を含む文を中心に-テキストから獲得可能な因果関係知識の類別およびその自動獲得の試み-接続助詞「ため」を含む文を中心に- 乾孝司 乾健太郎 松本裕治 奈良先端科学技術大学院大学 takash-i@is.aist-nara.ac.jp

  2. 概要(1分サマリー) 接続標識を含む文から 因果関係知識を獲得する 【目的】 よく晴れたため洗濯物が早く乾いた。 cause (〈よく晴れる〉, 〈洗濯物が早く乾く〉)

  3. 【知見1】 「ため」複文全体の約90%から、 cause, effect, precondition, means関係の いずれかの事例が獲得できる。 【知見2】 約97%の精度で、新聞記事1年分から 約35,000件の因果事例が獲得できる見通し を得た。 【論点1】「ため」複文から獲得可能な因果関係には       どのような種類があるか? 【論点2】どの程度の精度と量の因果関係知識が      自動的に獲得できるのか?

  4. 目的 因果関係知識を テキストから 自動的に 獲得する 因果関係知識:推論の基盤/テキスト理解/プラン認識 テキスト:大量の電子化テキストの存在 自動的:人手獲得(例えばCYC)⇒拡張性の問題

  5. 因果関係知識の例 地震が起こったから津波が発生したのだ。 cause (〈地震が起こる〉,〈津波が発生する〉) 洗濯物を干したのに乾かなかった。 effect (〈洗濯物を干す〉,〈洗濯物が乾く〉) 本棚が一杯になったので蔵書を捨てる。 precond (〈本棚が一杯になる〉,〈蔵書を捨てる〉) 切符を買うため切符売り場へ行った。 means (〈切符売り場へ行く〉, 〈切符を買う〉 )

  6. 知識獲得の方針(接続標識が手掛かり) • さまざまな標識が利用可 • 同じ標識で異なる因果関係をもつ事例が存在     ⇒獲得可能な因果関係ごとに文を分類する バングラディシュではマングローブを破壊したため、大水害が発生した。 effect (〈バングラディシュでマングローブを破壊する〉,〈大水害が発生する〉) 本棚が一杯になったので蔵書を捨てる。 precond (〈本棚が一杯になる〉,〈蔵書を捨てる〉) 切符を買うため切符売り場へ行った。 means (〈切符売り場へ行く〉,〈切符を買う〉)

  7. 因果関係の類型 • 類型基準:意志性  事態=(意志的行為|非意思的事態) Act SOA 必要条件 (緩やかな)十分条件

  8. 【論点1】 ある接続標識(「ため」)を含む文から獲得可能な因果関係にはどのような種類があるか? 「ため」複文全体の約90%から、 cause, effect, precond, means関係のいずれかの事例が獲得できる。

  9. 【論点2】 素性 ALT-J/E翻訳システム用辞書(NTT) EDR概念辞書 意志性 格 日本語語彙大系(NTT) モダリティ どの程度の精度と量の因果関係知識が自動的に獲得できるのか? • 機械学習アプローチ(Support Vector Machine) means Precision cause 0.96 effect 約97%の精度で、新聞記事1年分から約35,000件の因果事例が獲得できる見通しを得た。 precond 0.90 0.50 Recall

  10. 応用例:感情的テキスト理解 非明示 因果関係知識による推論 太郎はパーティーを 楽しんだ 快 明示的 キーワードスポッティング 洗濯物を干したのに、乾いていなかった。 不快 期待されるゴール が成立しない effect (〈洗濯物を干す〉,〈洗濯物が乾く〉)

  11. 因果事例の項について 切符を買う ため 切符売り場へ行っ た × means (〈切符売り場へ行く〉, 〈切符を買う〉 ) • 自然言語で表現する(形式言語は用いない) • モーダル情報は捨象される           ⇒文から文への変換⇒言い換え

  12. 修辞関係との比較 獲得 * 晴れたのに 洗濯物が早く乾いた。 認識 本研究での因果関係は、修辞関係ではなく、 その修辞関係を成り立たせる(より抽象度が高い)関係 CONTRAST REASON 晴れなかったのに洗濯物が早く乾いた。 晴れたため洗濯物が早く乾いた。 cause(〈晴れる〉, 〈洗濯物が早く乾く〉)

  13. 因果関係知識の獲得に関する関連研究

  14. (意志的行為|非意思的事態)の推定 変動要因 位置(従属節 or 主節) 主体(人,組織か否か) モダリティ(テンス) 主節 従属節 • 文脈によって変動 • 機械学習アプローチ(Support Vector Machine) Accuracy 0.97 Baseline:多数決戦略 (頻度ベース/文脈考慮なし) 0.95 0.90 0.812 Coverage

  15. 接続助詞の頻度分布[日本経済新聞1990年より]接続助詞の頻度分布[日本経済新聞1990年より]

  16. 因果事例の派生操作 precond (〈ダンボールの需要が増える〉, 〈生産の拡大を決める〉) * 決める 要求する 実施する 狙う ・・・ precond (〈ダンボールの需要が増える〉, 〈生産を拡大する〉) 一部の用言 を含む因果事例はそこから 新たな因果事例を生成できる          ⇒データスパースネス対策 *

  17. 分類に利用する素性 *1:エントリのない動詞については人手で付与 *2:人手で付与

More Related