110 likes | 182 Views
コーパスを使用した言語の研究. 実際に存在する文字、単語、語群、文など 語彙 用例 文法(語のつながり) 文体 など 意味などの概念を直接には扱えない 理論研究でなく実証研究. コーパスから直接見出せないもの コーパスを分ける イギリス英語とアメリカ英語 小説と新聞とテキスト 話し言葉と書き言葉 女性と男性の話し言葉 オバマとリンカーン. 意味や概念 タグをつける タグをつけて分類、抽出をする. 目的によりコーパスを選ぶ(構築) 大学入試問題 大学生の英作文のエラー 新聞英語 ある作家の作品. 既存のコーパスの利用 一般的な英語の特徴
E N D
実際に存在する文字、単語、語群、文など • 語彙 • 用例 • 文法(語のつながり) • 文体 • など • 意味などの概念を直接には扱えない • 理論研究でなく実証研究
コーパスから直接見出せないもの • コーパスを分ける • イギリス英語とアメリカ英語 • 小説と新聞とテキスト • 話し言葉と書き言葉 • 女性と男性の話し言葉 • オバマとリンカーン
意味や概念 • タグをつける • タグをつけて分類、抽出をする
目的によりコーパスを選ぶ(構築) • 大学入試問題 • 大学生の英作文のエラー • 新聞英語 • ある作家の作品
既存のコーパスの利用 • 一般的な英語の特徴 • 大規模コーパスの利用 • Brown,Lob,Frown,Flob • BNC • COCA • COHA (Corpusof Historical American English) • Time • など
単なる調査では不十分 • 数を数えただけ • 数を数えて整理しただけ • 吟味されていない
気をつけること • 信頼性と妥当性 • 信頼性がないと妥当性はない • 概念数値化概念 • 解釈を間違えないない
数字に注意 • TTR • コーパスの大きさ • 統計 大きな数値を扱うので注意 • 大きな作業 サンプルでチェック • 意味を吟味 • man 男の人 人間
http://kkitao.e-learning-server.com/class/corpus/index.html • レポート7月28日 • 企画案6月28日