190 likes | 262 Views
今日はたくさん演習します。. 自然言語処理 2013 - 平成 25 年 11 月 4 日 (No4)-. 東京工科大学 コンピュータサイエンス学部 亀田弘之. UAE 教育フェアの報告(参考). 平成 25 年 10 月 29 日(火) ~10 月 31 日(木) UAE アブダビ (Abu Dhabi) ADNEC 約 160 校参加(日本は16校) URL : http://www.najahonline.com/. まずは形態素解析の続きから. (先週のレポートを踏まえて). レポート課題 No3 (本日提出ポート課題).
E N D
今日はたくさん演習します。 自然言語処理2013-平成25年11月4日(No4)- 東京工科大学 コンピュータサイエンス学部 亀田弘之
UAE教育フェアの報告(参考) 平成25年10月29日(火)~10月31日(木) UAEアブダビ(Abu Dhabi) ADNEC 約160校参加(日本は16校)URL:http://www.najahonline.com/ 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech.
まずは形態素解析の続きから 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech. (先週のレポートを踏まえて)
レポート課題No3(本日提出ポート課題) 形態素解析ツール(MeCab, Chasen, Jumanのどれか1つ)を利用して、学長挨拶(http://www.teu.ac.jp/gaiyou/006488.html)を形態素解析しなさい。 提出日は、次回(11/4)の授業の時とします。 表紙等もいつも通りとします。 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech.
参考(学長挨拶本文) 東京工科大学は1986年に工学系単科大学としてスタートしました。以来、日本初のメディア学部の設置など、常に社会のニーズを読みながら進化を続け、現在では5学部と大学院を擁し、蒲田と八王子の2キャンパスを有する総合大学へと発展しています。 本学は、新しい大学です。伝統校のような長い歴史はありませんが、新しい大学には、時代に即応した革命や新たな試みに挑戦できる柔軟な態勢があります。2012年度も新しい試みを実行します。それが「教養学環」の設置です。これにより、今までの教養教育を改革・充実させ、社会で必要とされる社会人基礎力、東京工科大学の学生として身につけてほしい教養を学部横断教育として行っていきます。しっかりとした教養を備えるということは、発展著しい社会の変化に適応できる普遍的な知識を身につけること。これを「東京工科大学教養スタンダード」とし、その後の専門教育の充実や学生の就業力向上をめざします。 東京工科大学の教育の根幹にある考えは「実学主義」です。「実学主義」とは「実社会で役立つ専門的な知識や技術、加えてその基盤となる人間としての適応力を高めるための教育」です。これは単に学問を修めるためだけでなく、卒業後、一人ひとりがそれぞれの分野で学んできたことを活かして、社会で活躍できる実践力を磨くことです。そのために、入学から就職・進学まで、一貫したサポート体制でみなさんの夢の実現を応援します。ぜひ東京工科大学の門を叩いて、飛び込んで来てください。 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech.
WinChaで形態素解析をしてみる 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech. • 学習目標 • 形態素解析ツールの使い方を覚える (自分で使えることが目標) • 日本語の文法に馴れる • 余力のある人は、各ツールの使い道を考えるとともに、限界についても考えてみてください。 (つまり、当該ツールの得意とするところ、不得意とするところ、対応できていないところ など) • Prolog言語を知る
演習1 Winchaで以下の文を解析する 5分で実行 漱石の小説嫌いが問題になっている。 今日もしなければあとで困りますよ。 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech.
NLPのプログラムに挑戦! 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech. • Prologのインストール • プログラム作成手順 • IC分析(Immediate Constitutes Analysis by Leonard Bloomfield) • 形式文法の設定 • Prolog形式への書き換え • NLPプログラムの実行(その1) • 構文木を出力するプログラムへの拡張 • NLPプログラムの実行(その2) • 対話プログラム(Eliza)の紹介(次回の予告)
Swi-Prologのインストール 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech. 作業1: 検索エンジンで swi-prolog と入力して検索 Swi-prolog のページを見つける。 作業2: ダウンロードページへ行く。 作業3: インストールする。 作業4: 起動するか確認。 (注)終了のさせ方 ?- halt. と入力する。
Prolog入門 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech. • 実際に動かしながら身に着けよう! • ポイントは、... • ユニフィケーション(unification)という概念 • リスト形式における縦棒記号の取り扱い (この2点が学習目標です!)
構文解析プログラムを書いてみよう! 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech. (まずは動かしてみよう!)
練習2 • Prologシステムを起動 • Swi-prologのアイコンをダブルクリック • Prologシステムの終了 • halt. 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech.
練習3 unificationの確認 Porlogの起動 1 = 1. 3.14159 = 3.14159. 2.0 = 2. Prologの終了 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech.
練習4 簡単な構文解析器作成 • 対象言語L = { “John walks.”} • ヒント • 言語の各文を分析(I.C.分析) • 文法を設定 • Prolog言語で記述 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech.
予習問題(前回のパワポより複写) • 英文Tom broke the big cup.に対して以下のことを行え。 • この構造を分析せよ。 • この文を処理するための文法G1を書け。 • G1を基にPrologプログラムを作成せよ。 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech.
文法(復習) • G = { Vn, Vt, σ, P } • Vn:非終端記号 • Vt:終端記号 • σ:開始記号 • P:書き換え規則 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech.
s(A,C):-n(A,B),vp(B,C). vp(A,C):-v(A,B),np(B,C). np(A,C):-d(A,B),n(B,C). n([tom|T],T). n([cup|T],T). v([broke|T],T). d([the|T],T). 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech.
Prog2.pl 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech. s(A,C,s(_n,_vp)):- n(A,B,_n),vp(B,C,_vp). vp(A,C,vp(_v,_np)):- v(A,B,_v),np(B,C,_np). np(A,C,np(_d,_n)):- d(A,B,_d),n(B,C,_n). n([tom|T],T,n(tom)). n([cup|T],T,n(cup)). v([broke|T],T,v(broke)). d([the|T],T,d(the)).
練習問題(次回までにやっておくこと) 自然言語処理2013 (H. Kameda) Tokyo Univ. of Tech. I have a book. You have a book. I need the beautiful book. You throw a ball. 上記の英文を処理することのできる文法を設定し、それに基づき構文解析プログラムを作成しなさい。