1 / 14

自然言語処理 2007(5 回目 )

自然言語処理 2007(5 回目 ). 東京工科大学 コンピュータサイエンス学部 亀田弘之. 自然言語処理の概要. 文字認識 形態素解析 統語解析(構文解析) 意味解析 談話解析 状況解析 世界解析(他者理解など). 技術的に重要な項目. 文字認識 → スキャナの高度化 形態素解析 → データマイニング 情報検索 統語解析(構文解析) →  機械翻訳  音声対話 意味解析 → (同上) 談話解析 → (同上). Chasen と Juman. 日本語を対象とする形態素解析の代表的なプログラム

callum
Download Presentation

自然言語処理 2007(5 回目 )

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 自然言語処理2007(5回目) 東京工科大学 コンピュータサイエンス学部 亀田弘之

  2. 自然言語処理の概要 • 文字認識 • 形態素解析 • 統語解析(構文解析) • 意味解析 • 談話解析 • 状況解析 • 世界解析(他者理解など)

  3. 技術的に重要な項目 • 文字認識 → スキャナの高度化 • 形態素解析 → データマイニング 情報検索 • 統語解析(構文解析) →  機械翻訳  音声対話 • 意味解析 → (同上) • 談話解析 → (同上)

  4. ChasenとJuman • 日本語を対象とする形態素解析の代表的なプログラム • Chasenをインストールして使ってみよう。 • www.vector.co.jpを通じて公開されている。aa • WinCha というWindowsインタフェースのものもある。(今はメインテナンスされてない。)

  5. Chsenを使ってデータ処理してみよう! • 各自、新聞記事、小説、ブログなどさまざまなジャンルのテキストに対して、Chasenを利用して形態素解析してみてください。(後日、レポートとして提出してもらいます。)

  6. 構文解析(統語解析) • 教科書の第3章以降の話をしますが、第3章は多くの人には関係ないので、実質第4章の話をします。

  7. まずは、背景にある理論から • 言語理論 • 論理学 • プログラミング

  8. 言語理論 • 形式言語(言語と文法、文脈自由文法) • 論理学 • 述語論理(推論、レゾリューション法) • プログラミング • 論理型プログラミング(Prolog)

  9. 準備 • 次の文の構造を分析してみよう。Tom broke the cup.

  10. 文法 • G = { Vn, Vt, σ, P } • Vn:非終端記号 • Vt:終端記号 • σ:開始記号 • P:書き換え規則

  11. G = {Vn, Vt, σ, P} • Vn ={S, NP, VP, PrpN, V, Det, N} • Vt = {Tom, broke, the, cup} • σ =S • P={S→NP VP, NP →PrpN, VP →V NP,NP → Det N, PrpN → Tom, V →broke,Det →the, N→cup}

  12. Prologの導入

  13. Prologの動作を理解する。

  14. 問題 • Tom broke the big cup.の構造を分析し、この文を処理するための文法G1を書け。また、G1を基にPrologプログラムを作成せよ。

More Related