1 / 54

OUG ライフサイエンス分科会 医学用語シソーラスと UMLS について

OUG ライフサイエンス分科会 医学用語シソーラスと UMLS について. 2005 年 1 月 20 日   特定非営利活動法人医学中央雑誌刊行会 編成課 浜田雅美 hamada-m@jamas.or.jp. 医学用語シソーラス各版概要. 各版用語数. 医中誌 Web  統制語へのマッピング. シソーラス参照機能 用語一覧. シソーラス参照機能 カテゴリー表示. 略語の候補語 ( ディスクリプタ ) への案内. 第 4 版             1999 年. ・ MeSH 1997 年版の全用語の 99 %以上に対応

frasier
Download Presentation

OUG ライフサイエンス分科会 医学用語シソーラスと UMLS について

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. OUGライフサイエンス分科会医学用語シソーラスとUMLSについてOUGライフサイエンス分科会医学用語シソーラスとUMLSについて 2005年1月20日   特定非営利活動法人医学中央雑誌刊行会 編成課 浜田雅美 hamada-m@jamas.or.jp

  2. 医学用語シソーラス各版概要

  3. 各版用語数

  4. 医中誌Web 統制語へのマッピング

  5. シソーラス参照機能 用語一覧

  6. シソーラス参照機能 カテゴリー表示

  7. 略語の候補語(ディスクリプタ)への案内

  8. 第4版            1999年 ・MeSH 1997年版の全用語の99%以上に対応 ・非ディスクリプタの充実(広範囲な典拠資料を元に最新の用語を追加) ・現在の医学での出現頻度を考慮したディスクリプタの選択 (変更語数 4,341) ・新設語・削除語・変更語(一部抜粋)をリストにして掲載

  9. ディスクリプタの変更例 Ketosis, Diabetic → 糖尿病性ケトアシドーシス Tupaiidae → ツパイ科 抗エストロゲン剤 →Estrogen Antagonists 抗原-自己 →自己抗原 昼間治療 → デイケア 胼胝 →べんち 類肉腫症→サルコイドーシス

  10. 第5版            2003年 MeSH2001年版への対応 国内医学に適合したシソーラスの作成  ・薬効別カテゴリーを採用(MeSHのPharmacologic      Actionから)  ・生薬、漢方薬の収載 (日本薬局方より)  ・看護、介護用語の充実  ・疾患名以外はディスクリプタを自然語形に  ・物質名、細菌名以外は和文表記優先  ・使用頻度の低いMeSH用語を整理、統合

  11. MeSHPharmacologic Action のカテゴリー

  12. 医中誌 化学作用(薬効)カテゴリー

  13. Good Clinical Practice NANDA看護診断 移動介助 介護保険 義肢装具士 清拭 治験コーディネーター 特定機能病院 訪問看護ステーション HACCP SOAP (経過記録) 医療的ケア 看護情報システム 臍帯血バンク 生活保護 特定機能病院 排泄介助 要介護認定 医中誌独自語の例  (581語)

  14. 第5版シソーラスに収載しなかったMeSH語の例※ 国内医学分野では頻度が少ないと思われたため第5版シソーラスに収載しなかったMeSH語の例※ 国内医学分野では頻度が少ないと思われたため ・Ambystoma mexicanum メキシコサンショウウオ  (B2:脊椎動物) ・Koro コロ (セレベス島のマカッサル人やその他の極東地域の土着民に起こる急性の妄想状態)(F1:行動と行動メカニズム) ・Saturn 土星 (H1:自然科学) ・Jews ユダヤ人 (M1:人間) ・Hospitals, Group Practice グループ診療病院 (N2:保健医療の施設、人的要員、サービス)

  15. 第6版      2007年1月予定 ・MeSH2005年版への対応 ・UMLS2005年版への対応づけ ・シソーラス参照機能の充実 (登録年、用語の説明、など) ・副標目、チェックタグの見直し

  16. MeSH2005対応

  17. MeSH2002-05新設語 ※ MeSH2005のヒストリー項目の登録年が2002-2005のものをカテゴリー別にディスクリプタ数を集計した。総用語数はカテゴリーの重複をふくまないディスクリプタ数なので、カテゴリー別語数の合計とは異なる。

  18. MeSH2005カテゴリー別用語数

  19. 2002~2005MeSHの主な変更点 ・動物のカテゴリーの改変 ・ウイルスの表記の変更 ・植物療法のための植物名の増大 (約1000語) ・生命倫理用語の充実 ・膜輸送蛋白質、酵素等、生体機能蛋白質用語の  充実 ・遺伝学関連のカテゴリー新設  G13遺伝学的現象、G14遺伝学的構造 ・ナノテクノロジー関連の用語の追加                            他

  20. MeSH2005対応における課題 ・植物名の大幅増加に対応するか? ・植物名と生薬名の関連づけ ・歴史関係の用語

  21. 植物名と生薬名の整理 ・日本薬局方収載の生薬(94品目)について、 MeSHの植物の用語に対応する。 例:当薬 センブリ・・・Swertia japonica (センブリ)の                開花期の全草   リンドウ科 GentianaceaeB06.388.100.450     ミヤマアケボノソウ属 SwertiaB06.388.100.450.594      当薬 ・・・医中誌独自語    生物学的製剤 Biological ProductsD24.310     植物製剤 Plant Preparations D24.310.784       生薬  ・・・医中誌独自語        当薬  ・・・医中誌独自語

  22.  歴史(戦争)関連の用語MeSH 2005 Kカテゴリー 24語 ・ September 11 Terrorist Attacks 9月11日テロ(アメリカ同時多発テロ) ・ Russian-Japanese War 日露戦争  ・ History, 15th Century 15世紀の歴史  ・ French Revolution フランス革命 

  23. UMLSから各用語集へ MeSH 各国語版 標準病名集 UMLS ICD-10 MeSH MedDRA SNOMED-CT DSM CRISP Thesaurus etc 医学用語シソーラス MedDRA-J

  24. UMLSとは • Unified Medical Language System  統合(一体化)医学用語システム http://www.nlm.nih.gov/research/umls/ • 開発:米国国立医学図書館 National Library of Medicine (NLM)  及び外部協力機関(Lexical Technology Inc, ピッツバーグ、コロンビア等の大学, Mayo Clinic,等) 1986年~開発に着手 • 目的:各種情報源(Source)からの電子化した生物医学情報を統合化するシステムの開発を支援する。 • 更新頻度:3-4回/年 最新版:2004AC

  25. 開発時の背景 ・電子化された情報の交換のために、情報(用語など)の標準化が各分野で推進されたが、個々の体系を結びつけるツールが無かった。 ・学術情報の分野における情報資源の管理運用は、経営学の分野に比べ立ち遅れていた。図書館がその役割をになうものとしてNLMによりIAIMS(Integrated Academic Information Mangement)計画が1983年に発表された。

  26. 保健医療データのタイプ ・臨床データ   ・・・患者記録、検査結果、診断、等  (SNOMED、DSM-IV、電子カルテ) ・管理(経営)上のデータ   ・・・保険請求、オーダリング、等 (レセプト電算処理) ・公衆衛生のデータ   ・・・疾病統計、感染症報告、副作用報告、等     (ICD-10、MedDRA) ・学術情報のデータ    ・・・ PubMed (MeSH) 、等   

  27. 主要な情報源 (アルファベット順) DSM-IV Diagnostic and Statistical Manual of Mental Disorders, 4th edition (精神疾患の診断と分類の手引き 第4版) ICD-10 International Classification of Diseases(国際疾病分類) ICPC International Classification of Primary Care (プライマリケア国際分類) MedDRA Medical Dictionary for Regulatory Activities (メドラ) MeSH、およびMeSH各国語版 Medical Subject Headings (医学件名標目表) SNOMED-CT Systematized Nomenclature of Medicine-Clinical Term (スノメド)

  28. 2004AC概要 • Official Counts: • Release version: 2004AC • Release format: RRF • Concepts: 1,137,344 • Number of concept names (AUIs): 5,386,827 • Number of distinct concept names (SUIs): 4,571,553 • Number of distinct normalized concept names (LUIs): 4,090,845 • Number of sources (distinct source families by language): 114 • Number of sources contributing concept names: 132 • Number of languages contributing concept names: 17

  29. UMLS3つの構成要素 1.Metathesaurus(メタシソーラス) 生物医学分野で使われる多くの異なる統制語彙集や分類に    出現するConcept(概念)に関する情報のデータベース 2.Semantic Network(語義ネットワーク) メタシソーラスの中の全ての概念に対して、一貫したカテゴリー   と、 Concept(概念)間の重要な内部関係を示す 3.Lexical resources(辞書的(言語学的)な情報源)    自然言語処理(Natural Language Processing System)に対して   必要な辞書的情報を提供する。

  30. 1.Metathesaurus 生物医学分野で使われる多くの異なる統制語彙集や分類に出現するConceptに関する情報のデータベース 出典ごとの語彙を、UMLSの編集者によりConceptごとにまとめ、固有の識別子をつけた。

  31. Concept: • 一つの独立した概念。CUI(Concept Unique Identifier 概念識別子)という個有の識別子を持つ。 • Conceptは、様々なTerm(同義語、異表記語、訳語)Definition(定義)Relation(Conceptの位置づけ)Sorce(出典)などからなる。

  32. Conceptを構成する要素 Concept: 一つの独立した概念でUMLSの基本となる単位 CUI: Concept Unique Identifier 概念識別子 Semantic Type: Concept の意味から見た属性(性質) Definition: 各Conceptの定義 (MeSH由来のものが多い) Synonyms:同義語 (下位語、類義語は含まない。) Other languages:他言語訳 Sources: 出典 (100以上の出典) Ancestors:起源、系統 出典ごとの階層構造 Relation: Concept間(相互)の関係

  33. Concept (CUI) Terms (LUIs) Strings (SUIs) Atoms (AUIs)* RRF Only C0004238Atrial Fibrillation(preferred) Atrial FibrillationsAuricular Fibrillation Auricular Fibrillations L0004238Atrial Fibrillation (preferred)Atrial Fibrillations S0016668Atrial Fibrillation (preferred) A0027665Atrial Fibrillation(from MSH)A0027667Atrial Fibrillation(from PSY) S0016669Atrial Fibrillations A0027668Atrial Fibrillations(from MSH) L0004327(synonym) Auricular FibrillationAuricular Fibrillations S0016899Auricular Fibrillation(preferred) A0027930Auricular Fibrillation(from PSY) S0016900(plural variant)Auricular Fibrillations A0027932Auricular Fibrillations(from MSH)

  34. Relation: Concept間の関係には下記の2つがある。 • メタシソーラス全体にわたる高次の関係 (semantic types,semantic networks) • 各出典の中ごとの独自の分類体系 (MeSHにおけるTree,ICD-10のコード)

  35. 2.Semantic Network ・Semantic types Conceptの意味からみた属性 (カテゴリー構造になっている) ・Semantic network relationship = Inter-concept relationships 意味からみたConceptとConceptの関係のネットワーク  メタシソーラスの中の全てのConceptに対して、一貫したカテゴリーを持つために、UMLSにて整理した各Conceptの属性(Semantic types)と、それぞれのConcept と Concept の間の重要な関係を示すネットワーク(Semantic network)を持つ。

  36. Semantic Type: 各ConceptはUMLSで与えた概念の属性を持つ。 Entity:実在物  生物、解剖学的構造、化学物質、物質の構造  発見、器具、言語、組織、集団、等 Event:事象  行動、ケア、研究活動、生理的現象、疾病、  外傷、等 

  37. Semantic network relationshipの例 ・Hierarchical 階層関係 isa (is-a-kind-of)  ある種類の中の一つ part-of  ある部分 ・Associative 関連関係 location-of  場所、位置 caused-by  原因と結果 treats 処置 ・Cross-references 相互に関連する

  38. 3.Lexical Resources ・SPECIALIST Lexicon: Concept(英語)についての辞書的(言語学的)な 情報を示す。 ・Lexical tools: 自然言語処理を支援するツール 自然言語処理(Natural Language Processing System)に対して必要な辞書的情報を提供する。

  39. 英語における様々な語形変化 ・Inflection 語尾変化 noun 名詞   nucleus, nuclei verb 動詞   cauterize, cauterizes, cauterized, cauterizing adjective 形容詞  red, redder, reddest ・Derivation  派生 verb (動詞) ←→  noun (名詞) cauterize -- cauterization adjective (形容詞) ←→ noun (名詞) red -- redness

  40. Lexical tools ・生物医学分野の用語における辞書的な語形変化に  対応するツール。(自然言語処理) ・主なツール   ・Normalization: 正規化ツール   ・Indexes:   複合語を個別のWordに分け、 並べ替えたIndexを作成   ・Lexical Variant Generation program (lvg):     辞書的な変化形を発生させるプログラム ・SPECIALIST Lexiconをベースにする。 ・名詞の抽出や、検索エンジンなどのために用いられる。

  41. 2003年厚生労働科学研究 「UMLSと連携した日本語医学用語シソーラスの作成に関する研究班」(班長:脊山洋右)にて、第5版シソーラスデータをもとに、UMLSのMeSH2002部分との対応を図った。2003年厚生労働科学研究 「UMLSと連携した日本語医学用語シソーラスの作成に関する研究班」(班長:脊山洋右)にて、第5版シソーラスデータをもとに、UMLSのMeSH2002部分との対応を図った。

  42. 研究班の中で指摘された事項 ・より適切な訳語がある。   ニトロソエチル尿素→エチルニトロソ尿素・一般的に普及している用語に変更した方がよい Ataxia Telangiectasia   毛細管拡張性失調症→血管拡張性失調症 ・同義語に不適切なものがある Antibody-Producing Cells 抗体産生細胞 × ←Immunoglobulin-Producing Cell(MeSH由来) × ←免疫グロブリン産生細胞 ・酸と酸塩、エステルの使い分けを明確に Ioxaglic Acid×←Ioxaglate ・日本語表記の追加 (主に化合物名) Fatty Acids, Monounsaturated     ← 一価不飽和脂肪酸

  43. MeSHのEntry Term(同義語扱い) のうちUMLSのCUIが異なるもの CUI: C0028850 Ocular Motility Disorders 眼球運動障害 C0155339Brown Tendon Sheath Syndrome腱鞘症候群  ICD-9-CM,SNOMED-CT,ReadCodes C0152219Cyclophoria 回転斜位  ICD-9-CM,SNOMED-CT,ReadCodes C0242567Opsoclonus 眼球クローヌス SNOMED-CT,ReadCodes C0152222Parinaud‘s Syndrome パリノー症候群  SNOMED-CT,ReadCodes(訳語はステッドマンによる)

  44. UMLSおよび関連サイト ◆UMLSKnowledge Source Server http://www.nlm.nih.gov/research/umls/umlsmain.html ◆「UMLSと連携した日本語医学用語シソーラスの作成」研究班のサイト http://aqua.h.u-tokyo.ac.jp/jumls/ 「現時点までの成果」から日本語のPubMed検索等のページが見られます。(要登録)

More Related