1 / 11

中医药信息数据平台 -- 构建与挖掘

中医药信息数据平台 -- 构建与挖掘. 欧阳子博 2014.4.18. OUTLINE. 1. 整体思路 2. 文章特点 3. 数据平台设计 4. 数据挖掘设计 5. 总结与展望. 整体思路. 构建 herbBioMap2.0 挖掘 herbBioMap2.0. 文章特点. 基于中医药数据特点设计关联数据库,研究了中医药数据预处理方法。开发了基于 herbBioMap2.0 的中医药数据库全文搜索引擎,对中药、中药化学成分、中药方剂、中医证候等的关联性和西医标准进行研究,为更好理解中医药物质基础、组方规律提供了一定理论依据。

cleta
Download Presentation

中医药信息数据平台 -- 构建与挖掘

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 中医药信息数据平台--构建与挖掘 欧阳子博 2014.4.18

  2. OUTLINE • 1. 整体思路 • 2. 文章特点 • 3. 数据平台设计 • 4. 数据挖掘设计 • 5. 总结与展望

  3. 整体思路 • 构建herbBioMap2.0 • 挖掘herbBioMap2.0

  4. 文章特点 • 基于中医药数据特点设计关联数据库,研究了中医药数据预处理方法。开发了基于herbBioMap2.0的中医药数据库全文搜索引擎,对中药、中药化学成分、中药方剂、中医证候等的关联性和西医标准进行研究,为更好理解中医药物质基础、组方规律提供了一定理论依据。 • 提出基于最小集合覆盖算法的中药成分聚类方法,提出了富集度概念和差异度概念,对中药成分数据化研究提供新思路。 • 提出了基于UMLS关联的中医药证候分析方法。UMLS(Unified Medical Language System)是一套国际通用的一体化医学用语系统。本文通过国际卫生组织提供的中医证候标准,提出一套中医证候标准化的UMLS关联分析方法。 • 基于网络药理学方法,充分利用HerbBioMap数据库,对800首类风湿性关节炎中药方剂进行系统分析,形成对中医方剂分析的标准化流程。

  5. 数据平台设计 共计12张关系型数据表,其中6张表收录了636种常用中药、10838种中药成分、13974种药对关系DIMI记录、1304种常用方剂、418种WHO中医标准证候、50种西医疾病与中医疾病术语对应表。另外6张表记录了包括中药、中药成分、中药方剂、中医证候、证候UMLS、证候OMIM等在内的数据之间的关系,形成了一个完成的从微观到宏观的中医药信息数据库。 • 1. 数据库设计 • 2. 数据平台设计

  6. FULL TEXT SEARCH ENGINE

  7. herbBioMap2.0数据挖掘 • Min Set Cover for herb – compound • Association Rule for ZHENG – UMLS/Disease

  8. Min Set Cover A given set : The set of subsets of S : where is a subset of S, and The objective: Find a set s.t.

  9. Association Rule • I = {i1,i2,i3….in}, A I,B I,AB=O • Find top • max{s, c} for AB • Where: support = • confidence = P(B|A) =

  10. OUTLOOK • 1. connections • More test for : • herb – formule – zheng–(UMLS) – Disease – omim – herb cid • 2. data precision • 3 platform improvement

  11. Thank you !

More Related