1 / 59

数理 言語情報論 第 5 回

数理 言語情報論 第 5 回. 2009 年 11 月 4 日. 数理言語情報学研究室 講師 二宮 崇. 今日の講義の予定. HPSG (Head-driven phrase structure grammar, 主辞駆動句構造文法 ). HPSG: 導入. Head-driven Phrase Structure Grammar (Pollard & Sag 1985, 1994) 主辞が中心的な役割を果たす 文法枠組 辞書の情報を増やすことにより、句構造 規則をできる限り減らす辞書指向 素性構造、単一化に基づく単一化文法の一つ

savea
Download Presentation

数理 言語情報論 第 5 回

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 数理言語情報論 第5回 2009年11月4日 数理言語情報学研究室 講師 二宮 崇

  2. 今日の講義の予定 HPSG (Head-driven phrase structure grammar, 主辞駆動句構造文法)

  3. HPSG: 導入 • Head-driven Phrase Structure Grammar (Pollard & Sag 1985, 1994) • 主辞が中心的な役割を果たす文法枠組 • 辞書の情報を増やすことにより、句構造規則をできる限り減らす辞書指向 • 素性構造、単一化に基づく単一化文法の一つ • ここではPollard & Sag (1994) Head-driven Phrase Structure Grammar, University of Chicago Pressに基づいて解説

  4. HPSG: 導入 • 主辞 • 句構造の中心的役割を果たす語・句のこと • 例:「美しい花」→「花」 • 例:「彼は美しい花を見た」→「見た」 • 直感的には、最も重要そうな要素、他に修飾先がない要素のことを指すと考えればとりあえず差し支えない

  5. HPSG: 導入 • 語彙化文法 • CFGでは些細な方針変更の結果、ほとんどの句構造規則を書きなおさなくてはいけなくなってしまったり、、、 • 例:S → NP VP, VP → V NPとあったとき、主語のNPと目的語のNPはどのような名詞がくるのか、その分布が異なるので、NP-SUBJとNP-OBJにわけたい。しかし、そうすると、NP→N,...とある規則も全て書き直し。しかも、N→”taro“などの規則も二重に書かなくてはいけない! • 単語ごとに例外的、固有の振舞いが多い • 結果、単語を付与した非終端記号になり、そのための句構造規則を追加しなくてはいけない

  6. HPSG: 用語 (1) 補語(complement):英語でならったSVOCのCのことじゃなくて、主辞がとることができる句、単語のこと。つまり、SVOCの表記なら、主辞はVになって、残りのS,O,Cが補語ということになる。 下位範疇化(subcategorization): 主辞が補語と結合して、より大きな句を作ること。例えば、動詞は、目的語をとって動詞句になるようなこと。 主格(nominative): ひらたくいえばSVOCのSである。 対格(accusative): ひらたくいえばSVOCのOである。 指定部(specifier): countableな単数の名詞が手前にもつべき単語、句。例えば、dogはdogの前にtheや、a、my、theirといった単語がこないと非文になる。そういうtheやaのことを指定部という。

  7. HPSG: 用語(2) N: 名詞(noun)のこと V: 動詞(verb)のこと A: 形容詞(adjective)のこと P: 前置詞(preposition)のこと S: 文(sentence)のこと NP: 名詞句(noun phrase)のこと VP: 動詞句(verb phrase)のこと AP: 形容詞句(adjective phrase)のこと PP: 前置詞句(prepositional phrase)のこと

  8. HPSG: 用語 (3) • 素性 • PHON: 音韻(phonology)をあらわす素性。文にあらわれる単語そのものと思えばよい。 • SYNSEM: syntax and semanticsのこと。HPSGは昔、SYNという素性とSEMという素性に別れていましたが、最近はこれがくっついてSYNSEMという一つの素性になりました。 • NONLOCAL: 文中において遠い関係をあらわす情報を格納する。例えば、英語においてbook which I readという名詞句があったとき、このbookというのは I readの目的語になるわけですが、このbookとI readの目的語が入るべき位置とはちょっと遠い関係にある。こういう関係の情報を格納する素性。 • LOCAL: NONLOCALに対して、比較的、局所的な情報を格納しているが、基本的にはここには単語、句に関する全ての情報が書かれていて、NONLOCALを通して単語の情報が遠いところにまで輸出される、と考えるとよいだろう。

  9. HPSG: 用語 (4) • 素性 • CATEGORY: CATとよく省略して書かれる。これは日本語では範疇と呼ばれている。この素性に属する素性構造によって、格、時制、相、法、態、定不定、可算不可算などの情報が記述される。CFGでいうところの非終端記号を表している素性構造と思えばよい。 • CONTENT: いわゆるセマンティックスが入るところ。それに加えて統語的な人称、数、性が入る。 • HEAD: 主辞に関する情報が入っている素性。重要な役割を果たす素性です。 • DTRS: daughtersの略。言語学においては何故かノードの親子関係を「parent, child」と呼ばず、「mother, daughter」と呼ぶ。ここに属する値としてはHEAD_DTRとかSUBJ_DTRといった素性をもつ素性構造があり、ここに子供の素性構造を格納することにより、構文木を記述する

  10. HPSG: 用語(5) • 選択素性 • どのような補語をとるか • VALENCE:SUBJ: 主語のリスト • VALENCE:COMPS: 目的語のリスト • VALENCE:SPR: 指定部のリスト • どのような句を修飾するか • MOD: 修飾先の句

  11. HPSG: 辞書項目 HD: she nom CASE: nil nil noun cons SUBJ: TL: nil HEAD: PHON: COMPS: valence LOCAL: CAT: synsem cat word local SPR: VALENCE: nil SYNSEM: CONTENT: CONTEXT: fem INDEX: GEND: context ppro ref BACKGROUND: NUM: RESTR: sing female cons HD: nil RELN: PERS: TL: psoa 3rd nil INSTANCE: • 辞書項目“she”に対する素性構造

  12. HPSG: 辞書項目 word PHON: <she> SYNSEM: synsem LOCAL: local CAT: CONTENT: CONTEXT: cat HEAD: VALENCE: noun CASE: nom valence SUBJ:<> COMPS:<> SPR:<> ppro INDEX: RESTR: <> ref PER: 3rd NUM: sing GEND: fem 1 context BACKGR: < > psoa RELN: female INST: “she”に対応する素性構造 (AVM表記) 1

  13. 型階層: 基本的で特殊な型 ... -3.1 0.1 1.0 ... ... “a” “aa” ... “aab” ... -1 0 1 2 ... float + - integer string boolean ⊥ (ボトム) ブーリアン、整数、実数、文字列

  14. 型階層:リスト cons HD:⊥ TL:list <> nil nil TL: cons y <x|y> list x HD: ⊥ <x1, x2,..., xn> <x1|<x2|,...,<xn|<>>...>> (ボトム) TL: TL: TL: <a, b, c> cons cons cons nil <a|<b|<c|<>>> HD: HD: HD: b c a <a, b|<c>> リストの表記 リスト表記の例

  15. 型階層: 句構造まわり head-subj-struc head-mark-struc head-adj-struc head-comp-struc head-filler-struc phrase DTRS: con-struc word head-struc HEAD-DTR: sign NON-HEAD-DTR: sign coord-struc CONJ: sign CONJ-DTR: sign sign PHON: list SYNSEM: synsem QSTORE: set RETRIEVED: list con-struc object ⊥

  16. 型階層: 句構造内部 local CAT: cat CONT: content CONX: context synsem LOCAL: local NONLOCAL: nonlocal nonlocal TO-BIND: nonlocal1 INHERITED: nonlocal1 none nonlocal1 SLASH: set REL: set QUE: set mod-synsem object ⊥

  17. 型階層: 統語(1/2) verb VFORM: vform AUX: bool INV: bool prep PFORM:pform that for noun CASE: case conj comp reltvzr adj det mark subst PRD: bool MOD: mod-synsem marked unmarked func SPEC:synsem val SUBJ: list COMPS: list SPR: list marking cat HEAD: head VALENCE: val MARKING: marking head object

  18. 型階層: 統語(2/2) psp (past participle) prp (present participle) pas (passive participle) base fin inf nom acc to of ... ger case pform vform object

  19. 型階層: 意味(1/2) refl recp ppro ana npro pron quant DET: semdet RESTIND: npro nom-obj INDEX: index RESTR: set psoa the exists forall content BACKGROUND: set CONTEXTUAL-INDICES: c-inds semdet object

  20. 型階層: 意味(2/2) 3rd 2nd 1st masc ref there it fem neut person sing plu index PERSON: person NUMBER: number GENDER: gender gender number object

  21. 略記: 名詞句 i j k l m synsem LOCAL: local CAT: CONTENT: cat HEAD: VALENCE: noun CASE: i valence SUBJ:<> COMPS:<> SPR:<> nom-obj INDEX: index PERSON: NUMBER: GENDER: k j l m NP[] [ , , ]

  22. 略記:文 i j k l synsem LOCAL: local CAT: CONTENT: cat HEAD: VALENCE: verb VFORM:: AUX: INV: i j k valence SUBJ:<> COMPS:<> SPR:<> l S[ , AUX, INV]

  23. 略記: 動詞句 i j k l synsem LOCAL: local CAT: CONTENT: cat HEAD: VALENCE: verb VFORM:: AUX: INV: i j k valence SUBJ:<synsem> COMPS:<> SPR:<> l VP[ , AUX, INV]

  24. HPSGを構成する要素 • 文法 • 型階層 • 語彙項目(Lexical Entry) • 句構造規則(Schema, 句構造の親子間の形) • プリンシプル(Principle, 句構造の親子間の制約のこと) • 語彙規則(Lexical Rules) • 木構造 • スキーマを再帰的に適用することによって導出される構造

  25. 語彙項目 synsem LOCAL: local CAT: CONTENT: cat HEAD: VALENCE: verb VFORM:fin valence SUBJ:<NP[nom] [3rd, sing]> COMPS:<> SPR:<> 1 RELN: walk WALKER: 1 自動詞の例”walks”

  26. 語彙項目 synsem LOCAL: local CAT: CONTENT: cat HEAD: VALENCE: verb VFORM:fin valence SUBJ:<NP[nom] [3rd, sing]> COMPS:<NP[acc] > SPR:<> 1 2 RELN: see SEER: SEEN: 1 2 他動詞の例”sees”

  27. 語彙項目 synsem LOCAL: local CAT: CONTENT: cat HEAD: VALENCE: verb VFORM:fin valence SUBJ:<NP[nom] [3rd, sing]> COMPS:<NP[acc] ,NP[acc] > SPR:<> 1 2 3 RELN: give GIVER: GIVEN:: GIFT: 1 2 3 ditransitive verbの例”gives”

  28. 略記: 句構造と木構造 1 HEAD NON-HEAD phrase SYNSEM: DTRS: 2 3 1 head-struc HEAD-DTR: NON-HEAD-DTR: 1 2 3 NON-HEAD HEAD 3 2 左が主辞の場合 右が主辞の場合

  29. 句構造規則(スキーマ1) VAL: SUBJ: COMPS: SPR: 1 3 4 HEAD COMP VAL: SUBJ: COMPS: < |> SPR: 1 2 3 2 4 HEAD-COMPLEMENT-SCHEMA

  30. 句構造規則(2) VAL: SUBJ:<> COMPS: SPR: 2 3 SUBJ HEAD VAL: SUBJ: <> COMPS: SPR: 1 1 2 3 HEAD-SUBJECT-SCHEMA

  31. PHON: <gives> VAL: SUBJ: <NP[nom][3rd, sing]> COMPS: <NP[acc], NP[acc]> SPR: <> NP NP[3rd, sing] NP he gives her a present

  32. PHON: <gives, her> VAL: SUBJ:< NP[nom]> COMPS:< NP[acc]> SPR:<> 1 3 PHON: <gives> VAL: SUBJ: < > COMPS: < , > SPR: <> 1 2 3 NP NP[3rd, sing] NP[acc] 2 he gives her a present

  33. PHON: <gives, her, a present> VAL: SUBJ: < NP[nom]> COMPS: <> SPR:<> 1 PHON: <gives, her> VAL: SUBJ:< > COMPS:< > SPR:<> 1 3 PHON: <gives> VAL: SUBJ: < > COMPS: < , > SPR: <> 1 2 3 NP[acc] NP[3rd, sing] NP[acc] 3 2 he gives her a present

  34. PHON: <he, gives, her, a present> VAL: SUBJ: <> COMPS: <> SPR: <> PHON: <gives, her, a present> VAL: SUBJ: < > COMPS: <> SPR:<> 1 PHON: <gives, her> VAL: SUBJ:< > COMPS:< > SPR:<> 1 3 PHON: <gives> VAL: SUBJ: < > COMPS: < , > SPR: <> 1 2 3 NP[acc] 1 NP[nom][3rd, sing] NP[acc] 3 2 he gives her a present

  35. どのようにして句構造規則を適用するか? HEAD-DTR: NON-HEAD-DTR: word PHON: “gives” SS:LOC:CAT: cat HEAD: VALENCE: verb VFORM:fin DTRS: valence SUBJ:<NP[nom] [3rd, sing]> COMPS:<NP[acc] ,NP[acc] > SPR:<> 1 2 3 word PHON: “her” SS:LOC:CAT:HEAD: noun CASE:acc 親=(句構造規則)⊔(娘をDTRS:にいれた構造) givesとherをDTRS:にいれた構造

  36. どのようにして句構造規則を適用するか? VAL: SUBJ: COMPS: SPR: 1 句構造規則 3 4 HEAD COMP VAL: SUBJ: COMPS: < |> SPR: 1 2 3 2 4 PHON: <gives> VAL: 左娘 右娘 SUBJ: <NP[nom]> COMPS: <NP[acc],NP[acc]> SPR: <> NP[acc] gives her

  37. どのようにして句構造規則を適用するか? VAL: SUBJ: COMPS: SPR: 1 句構造規則 3 4 HEAD COMP VAL: SUBJ: COMPS: < |> SPR: 1 2 3 単一化 2 4 PHON: <gives> VAL: SUBJ: <NP[nom]> COMPS: <NP[acc],NP[acc]> SPR: <> 左娘 NP[acc] 右娘 gives her

  38. どのようにして句構造規則を適用するか? VAL: SUBJ:NP[nom] COMPS: <NP[acc]> SPR: <> 1 句構造規則 3 4 HEAD COMP VAL: SUBJ: COMPS: < |> SPR: 1 2 3 単一化 NP[acc] 2 4 PHON: <gives> VAL: SUBJ: COMPS: < | > SPR: 1 1 左娘 2 2 3 4 2 右娘 gives her

  39. どのようにして句構造規則を適用するか? VAL: SUBJ: COMPS: SPR: 1 3 4 HEAD COMP VAL: SUBJ: COMPS: < |> SPR: 1 2 3 2 4 PHON: <gives> VAL: SUBJ: <NP[nom]> COMPS: <NP[acc],NP[acc]> SPR: <> 左娘 NP[nom] 右娘 gives she

  40. 修飾句の句構造規則 I found a pretty red and brown hair blue eye girl. 主語や目的語の数は決まっているけど、修飾句をいくつとるのかは主辞からはわからない

  41. 句構造規則(スキーマ3, 4) • HEAD-MODIFIER SCHEMA (LEFT) • HEAD-MODIFIER SCHEMA (RIGHT) LMOD RMOD HEAD HEAD HEAD:MOD: HEAD:MOD: 1 1 1 1

  42. プリンシプル SYNSEM:LOCAL:CAT:HEAD: 1 NON-HEAD HEAD SYNSEM:LOCAL:CAT:HEAD: 1 ⊥ • 句構造の親子間の制約の集合 • HEAD FEATURE PRINCIPLE

  43. プリンシプル PHON: ⊕ 1 2 NON-HEAD HEAD PHON: PHON: 2 1 • 句構造の親子間の制約の集合 • PHONOLOGY PRINCIPLE

  44. プリンシプル ⊕ SYNSEM:NONLOCAL: QUE: REL: SLASH: 1 2 ⊕ 3 4 ⊕ 5 6 NON-HEAD HEAD SYNSEM:NONLOCAL: QUE: REL: SLASH: SYNSEM:NONLOCAL: QUE: REL: SLASH: 2 1 4 3 6 5 • 句構造の親子間の制約の集合 • NONLOC FEATURE PRINCIPLE

  45. プリンシプル(HPSGの本の中) • 親子間の制約 • プリンシプル1∧プリンシプル2∧プリンシプル3∧… • 実は、句構造規則もプリンシプルの一つ • ID-SCHEMA PRINCIPLE=SCHEMA1∨SCHEMA2∨SCHEMA3 ∨... • 主に、情報を下から上にあげるための規則群と考えればよい

  46. プリンシプル(実装) • プリンシプルをモジュールとして用意 • プリンシプル1 • プリンシプル2 • プリンシプル3 • … • 句構造規則に対し、プリンシプルをモジュールとして使ったり使わなかったりしている。 • 親子=(S1∧P1∧P2)∨(S2∧P2∧P3∧P4)∨(S3 ∧P1∧P2∧P4)∨...

  47. 語彙継承と語彙規則(c.f. Shieber: An Introduction to Unification-Based Approaches to Grammar, 1986) • 語彙項目を楽に記述する手法とも考えられる • 語彙化 • 従来の単一化文法で与えられていた規則性の多くを語彙継承と語彙テンプレートに還元、体系化 • 語彙継承 (Lexical Inheritance) • 語彙項目と語彙テンプレートの包摂関係 • 例) “sees”の語彙項目は、3人称単数の語彙テンプレートと他動詞の語彙テンプレートを継承(=単一化)することにより得られる • 語彙規則 (Lexical Rule) • 素性構造の包摂関係で記述できない語彙項目の関係を変形により与える • 例) 受身、疑問形、関係節の動詞

  48. 語彙継承 (Lexical Inheritance) eats walks Transitive Intransitive 3rd-sing main-verb finite 3rd-person singular verb 語彙テンプレートの単一化により語彙項目を生成

  49. 語彙規則(Lexical Rule) 現在分詞の giving 関係節の中の giving 関係節の中の give given (受動態) gives giving give • 素性構造の包摂関係で記述できない語彙項目の関係を変形により与える

  50. 語彙規則: 疑問文 LOCAL:CAT: HEAD: verb[+AUX, -INV, fin] VAL: SUBJ:< N[nom]> COMPS: 1 2 LOCAL:CAT: HEAD: verb[+AUX, +INV, fin] VAL: SUBJ: <> COMPS:< | > 1 2 Subject-Auxiliary Inversion Lexical Rule

More Related