1 / 11

コーパスを使用した言語の研究

コーパスを使用した言語の研究. 実際に存在する文字、単語、語群、文など 語彙 用例 文法(語のつながり) 文体 など 意味などの概念を直接には扱えない 理論研究でなく実証研究. コーパスから直接見出せないもの コーパスを分ける イギリス英語とアメリカ英語 小説と新聞とテキスト 話し言葉と書き言葉 女性と男性の話し言葉 オバマとリンカーン. 意味や概念 タグをつける タグをつけて分類、抽出をする. 目的によりコーパスを選ぶ(構築) 大学入試問題 大学生の英作文のエラー 新聞英語 ある作家の作品. 既存のコーパスの利用 一般的な英語の特徴

atira
Download Presentation

コーパスを使用した言語の研究

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. コーパスを使用した言語の研究

  2. 実際に存在する文字、単語、語群、文など • 語彙 • 用例 • 文法(語のつながり) • 文体 • など • 意味などの概念を直接には扱えない • 理論研究でなく実証研究

  3. コーパスから直接見出せないもの • コーパスを分ける • イギリス英語とアメリカ英語 • 小説と新聞とテキスト • 話し言葉と書き言葉 • 女性と男性の話し言葉 • オバマとリンカーン

  4. 意味や概念 • タグをつける • タグをつけて分類、抽出をする

  5. 目的によりコーパスを選ぶ(構築) • 大学入試問題 • 大学生の英作文のエラー • 新聞英語 • ある作家の作品

  6. 既存のコーパスの利用 • 一般的な英語の特徴 • 大規模コーパスの利用 • Brown,Lob,Frown,Flob • BNC • COCA • COHA (Corpusof Historical American English) • Time • など

  7. 単なる調査では不十分 • 数を数えただけ • 数を数えて整理しただけ • 吟味されていない

  8. 気をつけること • 信頼性と妥当性 • 信頼性がないと妥当性はない • 概念数値化概念 • 解釈を間違えないない

  9. 数字に注意  • TTR • コーパスの大きさ • 統計 大きな数値を扱うので注意 • 大きな作業 サンプルでチェック • 意味を吟味 • man 男の人 人間

  10. The End

  11. http://kkitao.e-learning-server.com/class/corpus/index.html • レポート7月28日 • 企画案6月28日

More Related