1 / 15

1 月 19 日 辞書

1 月 19 日 辞書. 自然言語処理における辞書の役割 機械辞書設計の要点 辞書の種類と用途. アナウンス. NTT の人の講演はキャンセルになりました NSW の説明資料「 IT 系ビジネス 実際の現場から」があります. 自然言語処理における辞書の役割. 人間用の辞書との違い 語義の定義方法の違い 人間用 語義文が中心 計算機用 結合価,上位概念,下位概念. 計算機用辞書(日本). IPAL http://www.ipa.go.jp/STC/NIHONGO/IPAL/ipal.html EDR

eman
Download Presentation

1 月 19 日 辞書

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 1月19日辞書 • 自然言語処理における辞書の役割 • 機械辞書設計の要点 • 辞書の種類と用途

  2. アナウンス • NTTの人の講演はキャンセルになりました • NSWの説明資料「IT系ビジネス 実際の現場から」があります

  3. 自然言語処理における辞書の役割 • 人間用の辞書との違い • 語義の定義方法の違い • 人間用 • 語義文が中心 • 計算機用 • 結合価,上位概念,下位概念

  4. 計算機用辞書(日本) • IPAL • http://www.ipa.go.jp/STC/NIHONGO/IPAL/ipal.html • EDR • http://www2.nict.go.jp/kk/e416/EDR/J_index.html

  5. 英語の辞書WordNet • http://www.cogsci.princeton.edu/~wn/

  6. EDR電子化辞書の構造 http://www2.nict.go.jp/kk/e416/EDR/J_index.html

  7. 機械辞書設計の要点 • 見出し語登録基準の問題 • 単語収録の範囲 • 一般語:国語辞典の見出しなど • 固有名詞:人名,地名,企業名など • 専門用語:分野毎に用意される.複合語も登録が必要 • 単語収録の単位 • 短単位,長単位 • 見出し語の表記の問題 • 漢字,平仮名,片仮名 • 活用語の扱い • 規則的な活用→不変部分を辞書に登録 • その他の辞書登録語選択の問題 • 同形異義語,数詞,用言性名詞,副詞の派生形

  8. 見出し語の表記の問題長単位語として登録すべき語見出し語の表記の問題長単位語として登録すべき語

  9. 一般名詞の意味属性体系の例 人間 一般名詞 具体 主体 人 神仏など 組織 役・職 場 自然 地勢 施設 宇宙 地域 具体物 動物 生物 植物 無生物 自然物 文化 抽象 抽象物 制度・習俗 人間活動 精神 事 事象 行為 自然現象 非生命 存在 生命 抽象的 関係 類・系 関連 性質 状態 形状 数量 場所 時間

  10. 辞書の種類と用途言語解析用の辞書 • 形態素解析用の辞書 • 構文解析用の辞書 • 意味解析用の辞書

  11. 辞書の種類と用途応用システムの辞書 • 機械翻訳用の辞書 • 日本文校正用の辞書 • 音声合成用の辞書 • キーワード自動抽出用の辞書

  12. 日本文校正用の辞書日本文中の誤りの種類と検出の方法日本文校正用の辞書日本文中の誤りの種類と検出の方法

  13. 日本語文音声変換処理 /:単語境界,//:アクセント境界(強結合),*:アクセント句境界(弱結合),Pポーズ

  14. 日本語文音声変換システムの辞書情報の例

  15. キーワード自動抽出システムの辞書の例

More Related