120 likes | 430 Views
中医药信息数据平台 -- 构建与挖掘. 欧阳子博 2014.4.18. OUTLINE. 1. 整体思路 2. 文章特点 3. 数据平台设计 4. 数据挖掘设计 5. 总结与展望. 整体思路. 构建 herbBioMap2.0 挖掘 herbBioMap2.0. 文章特点. 基于中医药数据特点设计关联数据库,研究了中医药数据预处理方法。开发了基于 herbBioMap2.0 的中医药数据库全文搜索引擎,对中药、中药化学成分、中药方剂、中医证候等的关联性和西医标准进行研究,为更好理解中医药物质基础、组方规律提供了一定理论依据。
E N D
中医药信息数据平台--构建与挖掘 欧阳子博 2014.4.18
OUTLINE • 1. 整体思路 • 2. 文章特点 • 3. 数据平台设计 • 4. 数据挖掘设计 • 5. 总结与展望
整体思路 • 构建herbBioMap2.0 • 挖掘herbBioMap2.0
文章特点 • 基于中医药数据特点设计关联数据库,研究了中医药数据预处理方法。开发了基于herbBioMap2.0的中医药数据库全文搜索引擎,对中药、中药化学成分、中药方剂、中医证候等的关联性和西医标准进行研究,为更好理解中医药物质基础、组方规律提供了一定理论依据。 • 提出基于最小集合覆盖算法的中药成分聚类方法,提出了富集度概念和差异度概念,对中药成分数据化研究提供新思路。 • 提出了基于UMLS关联的中医药证候分析方法。UMLS(Unified Medical Language System)是一套国际通用的一体化医学用语系统。本文通过国际卫生组织提供的中医证候标准,提出一套中医证候标准化的UMLS关联分析方法。 • 基于网络药理学方法,充分利用HerbBioMap数据库,对800首类风湿性关节炎中药方剂进行系统分析,形成对中医方剂分析的标准化流程。
数据平台设计 共计12张关系型数据表,其中6张表收录了636种常用中药、10838种中药成分、13974种药对关系DIMI记录、1304种常用方剂、418种WHO中医标准证候、50种西医疾病与中医疾病术语对应表。另外6张表记录了包括中药、中药成分、中药方剂、中医证候、证候UMLS、证候OMIM等在内的数据之间的关系,形成了一个完成的从微观到宏观的中医药信息数据库。 • 1. 数据库设计 • 2. 数据平台设计
herbBioMap2.0数据挖掘 • Min Set Cover for herb – compound • Association Rule for ZHENG – UMLS/Disease
Min Set Cover A given set : The set of subsets of S : where is a subset of S, and The objective: Find a set s.t.
Association Rule • I = {i1,i2,i3….in}, A I,B I,AB=O • Find top • max{s, c} for AB • Where: support = • confidence = P(B|A) =
OUTLOOK • 1. connections • More test for : • herb – formule – zheng–(UMLS) – Disease – omim – herb cid • 2. data precision • 3 platform improvement