1 / 53

言語体系とコンピュータ

言語体系とコンピュータ. 2006 年度 2 学期 第 8 回. 本日の内容. 単語の意味を決める (文の中の)単語の意味,解説編 選択制約,意味的整合性 格文法,格フレーム,意味素 シソーラスを用いた方法 連想関係を使った方法 意味にまつわるその他の問題. 単語の意味( 1 ). 単語 なんらかの 意味 を持つ(通常は複数ある) 単語の意味を決めるとは 文中の単語の意味が,複数の意味の内のどの意味であるかを決定すること. 単語の意味( 2 ). 単語 通常: 意味1,意味2,意味3,... 例: 単語  「やま」

brock
Download Presentation

言語体系とコンピュータ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 言語体系とコンピュータ 2006年度2学期 第8回

  2. 本日の内容 • 単語の意味を決める • (文の中の)単語の意味,解説編 • 選択制約,意味的整合性 • 格文法,格フレーム,意味素 • シソーラスを用いた方法 • 連想関係を使った方法 • 意味にまつわるその他の問題

  3. 単語の意味(1) • 単語 • なんらかの意味を持つ(通常は複数ある) • 単語の意味を決めるとは • 文中の単語の意味が,複数の意味の内のどの意味であるかを決定すること

  4. 単語の意味(2) • 単語 • 通常: 意味1,意味2,意味3,... 例: 単語 「やま」 意味1:周りの土地より著しく高くなった所 意味2:量の多い様子 意味3:重要なポイント,クライマックス 意味4:象徴的な巨大な組織 ... その単語だけを見ていてもどれかはわからない.

  5. 単語の意味(3) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? • 人はどうやっているか? →複数の語でみているのでは?

  6. 単語の意味(4) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? • 人はどうやっているか? →複数の語でみているのでは? 山 動く 山 芝刈り 行く 話 山 向かえる ←これでどうか?

  7. 単語の意味(5) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? • 人はどうやっているか? →複数の語でみているのでは? 山 動く        → 巨大な組織 山 芝刈り 行く   → 周りより高くなった陸地 話 山 向かえる  → クライマックス

  8. 単語の意味(6) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? • 人はどうやっているか? →複数の語でみているのでは? 太郎 山 眺める 書類 山 抱える 事件 山 越す ←これはどうか?

  9. 単語の意味(7) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? • 人はどうやっているか? →複数の語でみているのでは? 太郎 山 眺める  → 周りより高くなった陸地 書類 山 抱える  → 量の多い様子 事件 山 越す   → クライマックス

  10. 単語の意味(8) • どうやったら意味がわかるか? →複数の語だけか? 山 動く        → 巨大な組織 山 芝刈り 行く   → 周りより高くなった陸地 話 山 向かえる  → クライマックス 太郎 山 眺める  → 周りより高くなった陸地 書類 山 抱える  → 量の多い様子 事件 山 越す   → クライマックス

  11. 単語の意味(9) • どうやったら意味がわかるか? →複数の語だけか? 山 動く        → 巨大な組織 山 芝刈り 行く   → 周りより高くなった陸地 話 山 向かえる  → クライマックス 太郎 山 眺める  → 周りより高くなった陸地 書類 山 抱える  → 量の多い様子 事件 山 越す   → クライマックス 少なくとも「語」だけでなく文を作成しているはず

  12. 単語の意味(10) 少なくとも「語」だけでなく文を作成しているはず • どうやったら意味がわかるか? →複数の語+統語構造も利用しているはず 山が動く        → 巨大な組織 山へ芝刈りに行く   → 周りより高くなった陸地 話の山を向かえる  → クライマックス 太郎が山を眺める  → 周りより高くなった陸地 書類の山を抱える  → 量の多い様子 事件が山を越す   → クライマックス

  13. 単語の意味(11) 「語」と統語構造で意味は解決するか? • どうやったら意味がわかるか? →複数の語+統語構造も利用しているはず 山が動く        → 巨大な組織 山へ芝刈りに行く   → 周りより高くなった陸地 話の山を向かえる → クライマックス 太郎が山を眺める   → 周りより高くなった陸地 書類の山を抱える  → 量の多い様子 事件が山を越す   → クライマックス

  14. 単語の意味(12) 表層的な統語構造が一致するのに 意味が異なることもある:曖昧 • どうやったら意味がわかるか? →複数の語+統語構造も利用しているはず 山が[どうする]     → 巨大な組織 山へ[]に[どうする] → 周りより高くなった陸地 []の山を[どうなる] → クライマックス []が山を[どうする]  → 周りより高くなった陸地 []の山を[どうする] → 量の多い様子 []が山を[どうする]  → クライマックス

  15. 単語の意味(13) • どうやったら意味がわかるか? 文の中の複数の語と統語情報を利用している しかし,完全ではない →同じ表層的構造でも意味が違うことがある   太郎が山を眺める/事件が山を越える   日本の山に登る/話の山に差し掛かる

  16. 単語の意味(14) • 例:「A の B」はいろんな意味関係で使用 • 言語の理解  : Bが事象を表す • 太郎の親戚  : Bが関係を表す • 日産の自動車 : AがBの属性  木の家 • 東外大の望月 : 所属・所有  花子の鉛筆 • 美人の妻    : AであるB  日課の体操              などなど

  17. 単語の意味(15) • 例:「A の B」はいろんな意味関係で使用 • 言語の理解  : Bが事象を表す • 太郎の親戚  : Bが関係を表す • 日産の自動車 : AがBの属性  木の家 • 東外大の望月 : 所属・所有  花子の鉛筆 • 美人の妻    : AであるB  日課の体操              などなど 表層上は同じ「AのB」という形の表現だが意味関係はたくさんの曖昧性がありうる 表層の形だけでは, 一意には決まらないことが多い

  18. 単語の意味(16) • ある単語の意味を一意に決めるには • 文脈の情報がなければわからないもの • 文脈があってもよくわからないも こういうものもある.計算は非常に難しい. →ここではとりあげない. 1文を読んで人間が一意に意味を決められるもの →何か,なぞを解く鍵が1文の中で見つけられる 鍵:意味的整合性

  19. 単語の意味を決める(1) • 鍵:意味的整合性 • 1文を持ってくると,その中の単語間の意味的な整合性をどうにかして計算 • 意味的に矛盾のない(整合性のある)組み合わせを,各単語の意味として導き出す • 核となる考え方,材料,道具 選択制限,格フレーム,意味素,用例,連想関係

  20. 単語の意味を決める(2) • かいつまんで言うと... 例: 職場の花を食事に誘う. 花 (1)植物の花  (2)美しい人 • (1)では,植物を食事に誘うことになる →意味的におかしい • (2)では,意味的に整合性がとれる  →この意味に決定する

  21. 単語の意味を決める(3) • 大事な役割をするのは動詞 • 例: 職場の花を食事に誘う. 植物ではおかしいのは「誘う」に合わないから 動詞を中心に文中の各語の意味を考える →格文法(フィルモアの格文法)

  22. 格文法と格フレーム(1) • (フィルモアの)格文法 case grammar • 語と語の間の意味的関係を動詞を中心に捉える 表層格:主格(he),目的格(him),所有格(his)       ガ格(彼が),ヲ格(彼を),ニ格(彼に) 深層格:文中の動詞に対し,どの単語がどのような役割を持つか 動作主格(A),経験者格(E),道具格(I),対象格(O),源泉格(S),目標格(G),場所格(L),時間格(T)

  23. break ( I ) break A O John O (with a hammer) the window the window break I O a hammer the window 格文法と格フレーム(2) • 深層格に基づく文の意味表現(格構造表現) the window broke. John broke the window (with a hammer). a hammer broke the window

  24. 格文法と格フレーム(3) • 各構造表現は複雑→格フレームで表現 break1 - subject:O (the window broke.) break2 - subject:Aobject:O (with:I) (John broke the window with a hammer. ) break3 - subject: Iobject:O (A hammer broke the window.)

  25. break1 break2 break3 subject O: ... subject A: ... object O: ... (with I : ... ) subject I: ... object O: ... 格文法と格フレーム(4) • 格フレームは以下のようにもあらわされる

  26. break1 break2 break3 subject O: ... subject A: ... object O: ... (with I : ... ) subject I: ... object O: ... 格文法と格フレーム(5) • 格フレームは以下のようにもあらわされる 格スロット 入りうる単語に共通の属性を定義 格スロット

  27. 格文法と格フレーム(6) • 格スロット: • 入りうる単語に共通の属性を定義 • 属性が合わない単語(の意味)は入らない • 入れると意味的整合性があわないので →意味的に矛盾しない解釈だけが選択される

  28. 格文法と格フレーム(7) • 格スロット:共通の属性を定義 • 属性として利用する情報 (いろいろ) • 意味素:名詞を意味によって分類 • シソーラス:類似語,類義語の分類 • 用例:同じ用法で使用される語のまとまり • 単語の意味を決める  →格フレームと選択制限によって決める • 入力文 ~ 適切な格フレームを選択

  29. 格文法と格フレーム(8) • 格スロットの要素(意味素,シソーラス,用例) • 意味素の例:IPAL (Web上で) concrete, animal, organization,... • 意味素(意味素性)を階層構造化 • 通常,重複ありの分類

  30. 意味素を用いた方法(1) • 意味素と格フレームの組み合わせ 「かける」 • <HUM/ORG>ガ <HUM>ニ<MEN>ヲ • <HUM>ガ<LOC/PRO>ニ<CON>ヲ • <HUM/ANI>ガ<CON>ニ<CON>ヲ

  31. 意味素を用いた方法(2) • 意味素と格フレームの組み合わせ 「かける」 • <HUM/ORG>ガ <HUM>ニ<MEN>ヲ • <HUM>ガ<LOC/PRO>ニ<CON>ヲ • <HUM/ANI>ガ<CON>ニ<CON>ヲ 彼が姉に希望をかける 会社が彼に期待をかける 姉がハンガーにタオルをかける 犬が電柱におしっこをかける

  32. シソーラスを用いた方法(1) • 格スロット:共通の属性を定義 • 属性として利用する情報 (いろいろ) • 意味素:名詞を意味によって分類 • シソーラス:類似語,類義語の分類 • 用例:同じ用法で使用される語のまとまり • 単語の意味を決める  →格フレームと選択制限によって決める • 入力文 ~ 適切な格フレームを選択

  33. シソーラスを用いた方法(2) • 格スロットの要素(意味素,シソーラス,用例) • シソーラス(類語辞典など)Webで • 概念的なまとまりで単語を分類 • 各分類(概念)を階層構造化 • 通常,重複ありの分類

  34. シソーラスを用いた方法(3) • シソーラス(番号)と格フレームの組み合わせ 「かける」 • <?>ガ <?>ニ<?>ヲ • <?>ガ<?>ニ<?>ヲ • <?>ガ<?>ニ<?>ヲ 彼が姉に希望をかける  → 1 会社が彼に期待をかける  → 1 姉がハンガーにタオルをかける → 2 犬が電柱におしっこをかける → 3

  35. シソーラスを用いた方法(4) • シソーラス(番号)と格フレームの組み合わせ 「かける」 • <?>ガ <?>ニ<?>ヲ • <?>ガ<?>ニ<?>ヲ • <?>ガ<?>ニ<?>ヲ 彼が姉に希望をかける  → 1 会社が彼に期待をかける  → 1 姉がハンガーにタオルをかける → 2 犬が電柱におしっこをかける → 3 角川類語新辞典の例を用いて格フレームのスロット属性を考える

  36. 連想関係によって意味を決める(1) Cranes were used to lift building materials. • a large waterbird with long legs and necks. • a large machine used to lift heavy loads. どっちか? 連想関係で決める

  37. 連想関係によって意味を決める(2) Cranes were used to lift building materials. • a large waterbird with long legs and necks. • a large machine used to lift heavy loads. 見出し語[語義1] ... 語11,語12, 語13, ... , 語1n 見出し語[語義2] ... 語21,語22, 語23, ... , 語2n

  38. 連想関係によって意味を決める(3) 入力文   wawb wc wdwewf Wc1: Wg Wk Wb Wi Wj 一致度1 Wc2: Wg Wk WeWf Wl Wm 一致度2

  39. 連想関係によって意味を決める(4) 入力文   wawb wc wdwewf Wc1: Wg Wk Wb Wi Wj 一致度1 Wc2: Wg Wk WeWf Wl Wm 一致度2  こっち(Wc2:語義2)の方が可能性が高そう(尤もらしい)

  40. 連想関係によって意味を決める(5) Cranes were used to lift building materials. (used to)lift building material • a large waterbird with long legs and necks. Wc1: large waterbird long leg neck • a large machine used to lift heavy loads. Wc2: large machine (used to) lift heavy load

  41. 連想関係によって意味を決める(6) Cranes were used to lift building materials. (used to)lift building material Wc1: large waterbird long leg neck Wc2: large machine (used to) lift heavy load それぞれの語釈文に現れる単語入力文中の単語の一致度

  42. 連想関係によって意味を決める(7) Cranes were used to lift building materials. (used to)lift building material Wc1: large waterbird long leg neck Wc2: large machine (used to) lift heavy load 「一致度」だけではなかなか一致しないことが多いので拡張!

  43. 連想関係によって意味を決める(8) 入力文 wawb wcwdwewf Wc1: Wg Wh Wb Wi Wh WaWxWz WqWr Wc2: Wg Wk WeWf Wl Wm Wa Wn Wo Wj Wy Wq WpWd 類義語で拡張 類義語で拡張

  44. 連想関係によって意味を決める(9) 入力文 wawb wcwdwewf Wc1: Wg Wh Wb Wi Wh WaWxWz WqWr Wc2: Wg Wk WeWf Wl Wm Wa Wn Wo Wj Wy Wq WpWd 一致度2 類義語で拡張 一致度4 類義語で拡張

  45. 連想関係によって意味を決める(10) レシーバー  ①受話器。受信器。特に、耳につけてきくもの。  ②テニスなどで、相手のサーブを受けとめる側の人。 文1.片手でレシーバーを耳に当てる。 文2.レシーバーはサーブされたボールを2回バウンドする前に相手コートに打ち返し、お互いに ラリーを続ける。 文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく反応しなければなりません。 文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行き着きます。

  46. 連想関係によって意味を決める(11) レシーバー  ①受話器。受信器。特に、耳につけてきくもの。  ②テニスなどで、相手のサーブを受けとめる側の人。 文1.片手でレシーバーを耳に当てる。 文2.レシーバーはサーブされたボールを2回バウンドする前に相手コートに打ち返し、お互いに ラリーを続ける。 文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく反応しなければなりません。 文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行き着きます。 連想関係を利用し,どうにかして計算してみよ

  47. 単語の意味を決める-その他(1) • 意味素かシソーラスか? • 言語データを収集 →分析し,分類し,体系化すると,シソーラス →それをさらに抽象化すると,意味素 • シソーラスは修正が容易 • 不足分を補えばよし • 意味素は修正がたいへん • 全体の体系がくずれては困る

  48. 単語の意味を決める-その他(2) • 意味素かシソーラスか? • シソーラスは処理効率が悪い • 対応する事例を見つけないとならないので比較が多い • 意味素は処理効率がよい • 抽象化されているので,比較数が少ない • シソーラスは意味の弁別力が高い • 分類が細かい分,区別もつきやすい • 意味素は抽象度の度合いにより変化

  49. 単語の意味を決める-その他(3) • 格フレームの問題 • 格フレームの記述は高コスト(作るのが大変) • 例えば,機械翻訳では NTTのALT-J/E(日英翻訳)  約3000の意味素を使って,約6000の格フレーム • これだけ作っても,逆変換には使えない • J→Eとして作った格フレームの対応はJ→E方向のみ • E→Jが欲しければ,別に格フレームの対応が必要

  50. 単語の意味を決める-その他(4) • 動詞が存在しない文(言語表現は?) • 日本語では大いにありうる • 例:名詞句「A の B」は,  新聞記事 320000行中に248417例 出現 • 英語ではbe動詞の文 • 格文法,格フレームは使えない

More Related