530 likes | 638 Views
言語体系とコンピュータ. 2006 年度 2 学期 第 8 回. 本日の内容. 単語の意味を決める (文の中の)単語の意味,解説編 選択制約,意味的整合性 格文法,格フレーム,意味素 シソーラスを用いた方法 連想関係を使った方法 意味にまつわるその他の問題. 単語の意味( 1 ). 単語 なんらかの 意味 を持つ(通常は複数ある) 単語の意味を決めるとは 文中の単語の意味が,複数の意味の内のどの意味であるかを決定すること. 単語の意味( 2 ). 単語 通常: 意味1,意味2,意味3,... 例: 単語 「やま」
E N D
言語体系とコンピュータ 2006年度2学期 第8回
本日の内容 • 単語の意味を決める • (文の中の)単語の意味,解説編 • 選択制約,意味的整合性 • 格文法,格フレーム,意味素 • シソーラスを用いた方法 • 連想関係を使った方法 • 意味にまつわるその他の問題
単語の意味(1) • 単語 • なんらかの意味を持つ(通常は複数ある) • 単語の意味を決めるとは • 文中の単語の意味が,複数の意味の内のどの意味であるかを決定すること
単語の意味(2) • 単語 • 通常: 意味1,意味2,意味3,... 例: 単語 「やま」 意味1:周りの土地より著しく高くなった所 意味2:量の多い様子 意味3:重要なポイント,クライマックス 意味4:象徴的な巨大な組織 ... その単語だけを見ていてもどれかはわからない.
単語の意味(3) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? • 人はどうやっているか? →複数の語でみているのでは?
単語の意味(4) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? • 人はどうやっているか? →複数の語でみているのでは? 山 動く 山 芝刈り 行く 話 山 向かえる ←これでどうか?
単語の意味(5) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? • 人はどうやっているか? →複数の語でみているのでは? 山 動く → 巨大な組織 山 芝刈り 行く → 周りより高くなった陸地 話 山 向かえる → クライマックス
単語の意味(6) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? • 人はどうやっているか? →複数の語でみているのでは? 太郎 山 眺める 書類 山 抱える 事件 山 越す ←これはどうか?
単語の意味(7) • その単語だけを見ていてもわからない. • どうやったら意味がわかるか? • 人はどうやっているか? →複数の語でみているのでは? 太郎 山 眺める → 周りより高くなった陸地 書類 山 抱える → 量の多い様子 事件 山 越す → クライマックス
単語の意味(8) • どうやったら意味がわかるか? →複数の語だけか? 山 動く → 巨大な組織 山 芝刈り 行く → 周りより高くなった陸地 話 山 向かえる → クライマックス 太郎 山 眺める → 周りより高くなった陸地 書類 山 抱える → 量の多い様子 事件 山 越す → クライマックス
単語の意味(9) • どうやったら意味がわかるか? →複数の語だけか? 山 動く → 巨大な組織 山 芝刈り 行く → 周りより高くなった陸地 話 山 向かえる → クライマックス 太郎 山 眺める → 周りより高くなった陸地 書類 山 抱える → 量の多い様子 事件 山 越す → クライマックス 少なくとも「語」だけでなく文を作成しているはず
単語の意味(10) 少なくとも「語」だけでなく文を作成しているはず • どうやったら意味がわかるか? →複数の語+統語構造も利用しているはず 山が動く → 巨大な組織 山へ芝刈りに行く → 周りより高くなった陸地 話の山を向かえる → クライマックス 太郎が山を眺める → 周りより高くなった陸地 書類の山を抱える → 量の多い様子 事件が山を越す → クライマックス
単語の意味(11) 「語」と統語構造で意味は解決するか? • どうやったら意味がわかるか? →複数の語+統語構造も利用しているはず 山が動く → 巨大な組織 山へ芝刈りに行く → 周りより高くなった陸地 話の山を向かえる → クライマックス 太郎が山を眺める → 周りより高くなった陸地 書類の山を抱える → 量の多い様子 事件が山を越す → クライマックス
単語の意味(12) 表層的な統語構造が一致するのに 意味が異なることもある:曖昧 • どうやったら意味がわかるか? →複数の語+統語構造も利用しているはず 山が[どうする] → 巨大な組織 山へ[]に[どうする] → 周りより高くなった陸地 []の山を[どうなる] → クライマックス []が山を[どうする] → 周りより高くなった陸地 []の山を[どうする] → 量の多い様子 []が山を[どうする] → クライマックス
単語の意味(13) • どうやったら意味がわかるか? 文の中の複数の語と統語情報を利用している しかし,完全ではない →同じ表層的構造でも意味が違うことがある 太郎が山を眺める/事件が山を越える 日本の山に登る/話の山に差し掛かる
単語の意味(14) • 例:「A の B」はいろんな意味関係で使用 • 言語の理解 : Bが事象を表す • 太郎の親戚 : Bが関係を表す • 日産の自動車 : AがBの属性 木の家 • 東外大の望月 : 所属・所有 花子の鉛筆 • 美人の妻 : AであるB 日課の体操 などなど
単語の意味(15) • 例:「A の B」はいろんな意味関係で使用 • 言語の理解 : Bが事象を表す • 太郎の親戚 : Bが関係を表す • 日産の自動車 : AがBの属性 木の家 • 東外大の望月 : 所属・所有 花子の鉛筆 • 美人の妻 : AであるB 日課の体操 などなど 表層上は同じ「AのB」という形の表現だが意味関係はたくさんの曖昧性がありうる 表層の形だけでは, 一意には決まらないことが多い
単語の意味(16) • ある単語の意味を一意に決めるには • 文脈の情報がなければわからないもの • 文脈があってもよくわからないも こういうものもある.計算は非常に難しい. →ここではとりあげない. 1文を読んで人間が一意に意味を決められるもの →何か,なぞを解く鍵が1文の中で見つけられる 鍵:意味的整合性
単語の意味を決める(1) • 鍵:意味的整合性 • 1文を持ってくると,その中の単語間の意味的な整合性をどうにかして計算 • 意味的に矛盾のない(整合性のある)組み合わせを,各単語の意味として導き出す • 核となる考え方,材料,道具 選択制限,格フレーム,意味素,用例,連想関係
単語の意味を決める(2) • かいつまんで言うと... 例: 職場の花を食事に誘う. 花 (1)植物の花 (2)美しい人 • (1)では,植物を食事に誘うことになる →意味的におかしい • (2)では,意味的に整合性がとれる →この意味に決定する
単語の意味を決める(3) • 大事な役割をするのは動詞 • 例: 職場の花を食事に誘う. 植物ではおかしいのは「誘う」に合わないから 動詞を中心に文中の各語の意味を考える →格文法(フィルモアの格文法)
格文法と格フレーム(1) • (フィルモアの)格文法 case grammar • 語と語の間の意味的関係を動詞を中心に捉える 表層格:主格(he),目的格(him),所有格(his) ガ格(彼が),ヲ格(彼を),ニ格(彼に) 深層格:文中の動詞に対し,どの単語がどのような役割を持つか 動作主格(A),経験者格(E),道具格(I),対象格(O),源泉格(S),目標格(G),場所格(L),時間格(T)
break ( I ) break A O John O (with a hammer) the window the window break I O a hammer the window 格文法と格フレーム(2) • 深層格に基づく文の意味表現(格構造表現) the window broke. John broke the window (with a hammer). a hammer broke the window
格文法と格フレーム(3) • 各構造表現は複雑→格フレームで表現 break1 - subject:O (the window broke.) break2 - subject:Aobject:O (with:I) (John broke the window with a hammer. ) break3 - subject: Iobject:O (A hammer broke the window.)
break1 break2 break3 subject O: ... subject A: ... object O: ... (with I : ... ) subject I: ... object O: ... 格文法と格フレーム(4) • 格フレームは以下のようにもあらわされる
break1 break2 break3 subject O: ... subject A: ... object O: ... (with I : ... ) subject I: ... object O: ... 格文法と格フレーム(5) • 格フレームは以下のようにもあらわされる 格スロット 入りうる単語に共通の属性を定義 格スロット
格文法と格フレーム(6) • 格スロット: • 入りうる単語に共通の属性を定義 • 属性が合わない単語(の意味)は入らない • 入れると意味的整合性があわないので →意味的に矛盾しない解釈だけが選択される
格文法と格フレーム(7) • 格スロット:共通の属性を定義 • 属性として利用する情報 (いろいろ) • 意味素:名詞を意味によって分類 • シソーラス:類似語,類義語の分類 • 用例:同じ用法で使用される語のまとまり • 単語の意味を決める →格フレームと選択制限によって決める • 入力文 ~ 適切な格フレームを選択
格文法と格フレーム(8) • 格スロットの要素(意味素,シソーラス,用例) • 意味素の例:IPAL (Web上で) concrete, animal, organization,... • 意味素(意味素性)を階層構造化 • 通常,重複ありの分類
意味素を用いた方法(1) • 意味素と格フレームの組み合わせ 「かける」 • <HUM/ORG>ガ <HUM>ニ<MEN>ヲ • <HUM>ガ<LOC/PRO>ニ<CON>ヲ • <HUM/ANI>ガ<CON>ニ<CON>ヲ
意味素を用いた方法(2) • 意味素と格フレームの組み合わせ 「かける」 • <HUM/ORG>ガ <HUM>ニ<MEN>ヲ • <HUM>ガ<LOC/PRO>ニ<CON>ヲ • <HUM/ANI>ガ<CON>ニ<CON>ヲ 彼が姉に希望をかける 会社が彼に期待をかける 姉がハンガーにタオルをかける 犬が電柱におしっこをかける
シソーラスを用いた方法(1) • 格スロット:共通の属性を定義 • 属性として利用する情報 (いろいろ) • 意味素:名詞を意味によって分類 • シソーラス:類似語,類義語の分類 • 用例:同じ用法で使用される語のまとまり • 単語の意味を決める →格フレームと選択制限によって決める • 入力文 ~ 適切な格フレームを選択
シソーラスを用いた方法(2) • 格スロットの要素(意味素,シソーラス,用例) • シソーラス(類語辞典など)Webで • 概念的なまとまりで単語を分類 • 各分類(概念)を階層構造化 • 通常,重複ありの分類
シソーラスを用いた方法(3) • シソーラス(番号)と格フレームの組み合わせ 「かける」 • <?>ガ <?>ニ<?>ヲ • <?>ガ<?>ニ<?>ヲ • <?>ガ<?>ニ<?>ヲ 彼が姉に希望をかける → 1 会社が彼に期待をかける → 1 姉がハンガーにタオルをかける → 2 犬が電柱におしっこをかける → 3
シソーラスを用いた方法(4) • シソーラス(番号)と格フレームの組み合わせ 「かける」 • <?>ガ <?>ニ<?>ヲ • <?>ガ<?>ニ<?>ヲ • <?>ガ<?>ニ<?>ヲ 彼が姉に希望をかける → 1 会社が彼に期待をかける → 1 姉がハンガーにタオルをかける → 2 犬が電柱におしっこをかける → 3 角川類語新辞典の例を用いて格フレームのスロット属性を考える
連想関係によって意味を決める(1) Cranes were used to lift building materials. • a large waterbird with long legs and necks. • a large machine used to lift heavy loads. どっちか? 連想関係で決める
連想関係によって意味を決める(2) Cranes were used to lift building materials. • a large waterbird with long legs and necks. • a large machine used to lift heavy loads. 見出し語[語義1] ... 語11,語12, 語13, ... , 語1n 見出し語[語義2] ... 語21,語22, 語23, ... , 語2n
連想関係によって意味を決める(3) 入力文 wawb wc wdwewf Wc1: Wg Wk Wb Wi Wj 一致度1 Wc2: Wg Wk WeWf Wl Wm 一致度2
連想関係によって意味を決める(4) 入力文 wawb wc wdwewf Wc1: Wg Wk Wb Wi Wj 一致度1 Wc2: Wg Wk WeWf Wl Wm 一致度2 こっち(Wc2:語義2)の方が可能性が高そう(尤もらしい)
連想関係によって意味を決める(5) Cranes were used to lift building materials. (used to)lift building material • a large waterbird with long legs and necks. Wc1: large waterbird long leg neck • a large machine used to lift heavy loads. Wc2: large machine (used to) lift heavy load
連想関係によって意味を決める(6) Cranes were used to lift building materials. (used to)lift building material Wc1: large waterbird long leg neck Wc2: large machine (used to) lift heavy load それぞれの語釈文に現れる単語入力文中の単語の一致度
連想関係によって意味を決める(7) Cranes were used to lift building materials. (used to)lift building material Wc1: large waterbird long leg neck Wc2: large machine (used to) lift heavy load 「一致度」だけではなかなか一致しないことが多いので拡張!
連想関係によって意味を決める(8) 入力文 wawb wcwdwewf Wc1: Wg Wh Wb Wi Wh WaWxWz WqWr Wc2: Wg Wk WeWf Wl Wm Wa Wn Wo Wj Wy Wq WpWd 類義語で拡張 類義語で拡張
連想関係によって意味を決める(9) 入力文 wawb wcwdwewf Wc1: Wg Wh Wb Wi Wh WaWxWz WqWr Wc2: Wg Wk WeWf Wl Wm Wa Wn Wo Wj Wy Wq WpWd 一致度2 類義語で拡張 一致度4 類義語で拡張
連想関係によって意味を決める(10) レシーバー ①受話器。受信器。特に、耳につけてきくもの。 ②テニスなどで、相手のサーブを受けとめる側の人。 文1.片手でレシーバーを耳に当てる。 文2.レシーバーはサーブされたボールを2回バウンドする前に相手コートに打ち返し、お互いに ラリーを続ける。 文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく反応しなければなりません。 文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行き着きます。
連想関係によって意味を決める(11) レシーバー ①受話器。受信器。特に、耳につけてきくもの。 ②テニスなどで、相手のサーブを受けとめる側の人。 文1.片手でレシーバーを耳に当てる。 文2.レシーバーはサーブされたボールを2回バウンドする前に相手コートに打ち返し、お互いに ラリーを続ける。 文3.レシーバーは、スパイクによって放たれるボールに対して、すばやく反応しなければなりません。 文4.スピーカーの元祖を尋ねると、電話機の受話器(レシーバー)に行き着きます。 連想関係を利用し,どうにかして計算してみよ
単語の意味を決める-その他(1) • 意味素かシソーラスか? • 言語データを収集 →分析し,分類し,体系化すると,シソーラス →それをさらに抽象化すると,意味素 • シソーラスは修正が容易 • 不足分を補えばよし • 意味素は修正がたいへん • 全体の体系がくずれては困る
単語の意味を決める-その他(2) • 意味素かシソーラスか? • シソーラスは処理効率が悪い • 対応する事例を見つけないとならないので比較が多い • 意味素は処理効率がよい • 抽象化されているので,比較数が少ない • シソーラスは意味の弁別力が高い • 分類が細かい分,区別もつきやすい • 意味素は抽象度の度合いにより変化
単語の意味を決める-その他(3) • 格フレームの問題 • 格フレームの記述は高コスト(作るのが大変) • 例えば,機械翻訳では NTTのALT-J/E(日英翻訳) 約3000の意味素を使って,約6000の格フレーム • これだけ作っても,逆変換には使えない • J→Eとして作った格フレームの対応はJ→E方向のみ • E→Jが欲しければ,別に格フレームの対応が必要
単語の意味を決める-その他(4) • 動詞が存在しない文(言語表現は?) • 日本語では大いにありうる • 例:名詞句「A の B」は, 新聞記事 320000行中に248417例 出現 • 英語ではbe動詞の文 • 格文法,格フレームは使えない