1 / 24

毕设进度与安排

毕设进度与安排. 基于生物分子网络的疾病药物关联机制调研 张鹏 2014.4. 介绍提纲. 一 要做什么 二 已做什么 三 将做什么. 要做些什么. drug network. 虽然之前有过许多基于网络的药物靶标预测以及疾病基因预测的方法,但是由于基因,蛋白等网络关系的复杂性,要探究药物与疾病之间的global mapping关系还是比较困难,即使存在一些global mapping的算法,基本上都很难涵盖一些网络内部生物关系,如蛋白复合物,蛋白多功能表达,蛋白家族以及传输信号反馈等,所以,寻找比较完备的多网络信息融合的global mapping就具有十分重要的意义。.

olathe
Download Presentation

毕设进度与安排

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 毕设进度与安排 基于生物分子网络的疾病药物关联机制调研 张鹏 2014.4

  2. 介绍提纲 • 一 要做什么 • 二 已做什么 • 三 将做什么

  3. 要做些什么 drug network 虽然之前有过许多基于网络的药物靶标预测以及疾病基因预测的方法,但是由于基因,蛋白等网络关系的复杂性,要探究药物与疾病之间的global mapping关系还是比较困难,即使存在一些global mapping的算法,基本上都很难涵盖一些网络内部生物关系,如蛋白复合物,蛋白多功能表达,蛋白家族以及传输信号反馈等,所以,寻找比较完备的多网络信息融合的global mapping就具有十分重要的意义。 background network • 从功能角度 主要是从PPI或者其他的网络中寻找药物靶标和致病分子功能相关模块,如蛋白复合物,蛋白家族,pathway等 • 从网络拓扑角度 依靠背景网络的拓扑关系以及各生物网络之间的整合,依据拓扑相似和功能相似之间的关系来构建基于背景生物分子网络的药物-疾病的关系 • 从direct-mapping角度 主要从数据库中寻找已发现药物靶标直接为致病基因或其他致病分子的药物-疾病关系 disease network

  4. 已做什么 • 功能和direct-mapping 从direct-mapping的角度和功能的角度主要是调研了一些数据库(drugBank,Bind,OMIM,HPRD,DAVID,STRING等)以及学习使用Galaxy平台。另外借助保元汤的例子运用CIPHER,drugCIPHER,NIMS(NIDA)等进行了简单的计算 • 网络拓扑结构分析调研

  5. 已做什么 • 基于网络的药物疾病文献调研思路 基于PPI网络的药物靶标预测算法以及药物干预 基于其他网络(代谢网络,信号通路网络,基因调控网络) 的疾病药物作用分析 不同网络之间的融合,以及网络拓扑学相关文献 相关的global mapping文献以及在多向网络中随机走的相关文献 基于基因网络(或PPI网络)疾病基因预测算法并比较

  6. 已做什么 一 致病基因预测方法调研 1 基于linkage interval预测 2 基于clustering 预测 3 基于propagation 预测 4 预测方法比较

  7. Oti M. Oti, B. Snel, M. A. Huynen, and H. G. Brunner. Predicting disease genes using protein-protein interactions. J. Med. Genet., 43(8):691{698, August 2006. Hypothesis: physically interacting proteins tend to be involved in the same cellular process and mutations in their genes may lead to similar disease phenotypes Oti: for each disease d,let Gd be the genes known to be associated with d,and let P1 P2.. Pn be the interaction partners of the products of Gd.if Pi and d belong in the same linkage interval,Pi is seen as the candidate one.

  8. Propagation O. Vanunu and R. Sharan. A propagation-based algorithm for inferring gene-disease assocations. In Proceedings of the German Conference on Bioinformatics, pages 54{63, 2008. R. Sharan et al. Conserved patterns of protein interaction in multiple species. Proc Natl Acad Sci U S A, 102(6):1974–1979, February 2005. S. Kohler, S. Bauer, D. Horn, and P. N. Robinson. Walking the interactome for prioritization of candidate disease genes. Am. J. Human Genet., 82(4):949{958, 2008. 算法步骤: 1 对候选节点(nodeA),其相似分数S由两部分构成,周围节点的扩散F以及与该节点与未知疾病(Disease4)的相似度Y 2 w 表示以实验的方式从reference2中通过 logistic回归模型得到 3 Y将疾病网络中的与A相关的疾病 (disease1)与未知疾病之间的距离用 logistic方程归一化为[0 1]的数值 4 S=F+Y 5 迭代扩散 ST=αW'S(T-1)+(1-α)Y 6 全网络比较排序 当然,如果不考虑Y的话就成为普通的随机走(random walk)的算法(S. Kohler et al.)

  9. Clustering (graph summarization) 1 Navlakha S. Navlakha, R. Rastogi, and N. Shrivastava. Graph summarization with bounded error. InProceedings of the 2008 ACM SIGMOD Conference, pages 419{432, 2008. S. Navlakha, M. C. Schatz, and C. Kingsford. Revealing biological modules via graph summarization. J. Comp. Biol., 16(2):253{264, 2009. 基于MDL(最短描述长度)的图形压缩聚类,其主要原理就是在网络中使用贪婪算法最小化其聚类造成的边的损失从而达到最大化描述原网络的主要结构。 同时,还可以根据相同的聚类方式进一步聚类,得到分层级的类。将基因网络划分成更小的模块,达到致病基因预测的目的。 D G

  10. Clustering (graph summarization) 2 VI-cut S. Navlakha, J. White, N. Nagarajan, M. Pop. Finding biologically accurate clusterings in hierarchical tree decompositions using the variation of information. InProceedings of RECOMB 2009, LNCS, volume 5541, pages 400{417, 2009. 进一步地,navakha提出了在分层次树的基础上根据节点的功能再次聚类, 从而达到每个子类中的节点尽可能地满足同一个功能。其主要原理是找出一个node-cut(图中绿色节点)的集合,满足将原来的分层树的叶划分成不同的类的信息熵最小。 由于其原来的树是建立在PPI网络的蛋白间Czekanowski-Dice距离的基础上,所以可以通过聚类后中的节点来预测蛋白复合物,当然也可以预测致病基因。

  11. 预测方法比较 1 在PPI网络中比较各种算法的精度以及查全率(recall) 2 在PPI网络中各种算法的预测结果 特殊性

  12. 已做什么 二 不同的背景网络分析调研 1 基于PPIs网络(基因网络) 2 基于代谢通路网络 3 基于信号传输通路网络 4 其他

  13. 基于代谢通路网络分析 Barabási A L, Gulbahce N, Loscalzo J. Network medicine: a network-based approach to human disease[J]. Nature Reviews Genetics, 2011, 12(1). Lee D S, Park J, Kay K A, et al. The implications of human metabolic network topology for disease comorbidity[J]. PNAS, 2008, 105(29). Hu J, Locasale J W, Bielas J H, et al. Heterogeneity of tumor-induced gene expression changes in the human metabolic network[J]. Nature, 201: 3. Shen Y, Liu J, Estiu G, et al. Blueprint for antimicrobial hit discovery targeting metabolic networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2010, 107 代谢通路网络的构建 共代谢通路的相连基因共表达

  14. 基于代谢通路网络分析 Lee D S, Park J, Kay K A, et al. The implications of human metabolic network topology for disease comorbidity[J]. PNAS, 2008, 105(29). 为了进一步分析共代谢通路的疾病的伴随性质,对1300多万的病例进行分析,并且定义其两个疾病的伴随系数为CX,Y,表示两个疾病同时同发生在一组病人里面的程度。同时,为了分析在代谢疾病网络(MND)中疾病的分布和伴随,分析了其节点和距离对分布以及伴随性质的影响。 伴随疾病的分布 MND中的节点度数与 MND中的节点距离与其 对应疾病分布 疾病伴随性关系

  15. Zamir E, Bastiaens P I H. Reverse engineering intracellular biochemical networks[J]. Nature chemical biology, 2008, 4(11): 643-647. 信号通路网络结构 在信号通路网络上关联疾病药物关系 Reverse engineering a network structure 1 Reverse engineering的主要目的就是根据对模块的干扰和干扰后的反应来推算模块之间的信号传输关系,进而构建信号传输网络。 其依据的原理是当一个干扰作用后整个模块达到平衡态,所有的干扰对一个模块的作用的微分商之和为0. 即解方程 根据方程中 的正负来推断模块i,j之间的作用关系,正表示促进,负表示抑制。

  16. 在miRNAs层面上关联疾病药物关系 Lu M, Zhang Q, Deng M, et al. An Analysis of Human MicroRNA and Disease Associations[J]. PLoS ONE, 2008, 3(10): e3420. 药物干预文献调研 Campillos M. Drug Target Identification Using Side-Effect[J]. Microbiol. Rev, 2005, 29: 935. Vazquez A. Optimal drug combinations and minimal hitting sets[J]. BMC Systems Biology, 2009, 3(1): 1-6. Csermely P, Korcsmáros T, Kiss H J M, et al. Structure and dynamics of molecular networks: A novel paradigm of drug discovery: A comprehensive review[J]. Pharmacology & therapeutics, 2013, 138(3): 333-408.‘ Ágoston V, Csermely P, Pongor S. Multiple weak hits confuse complex systems: a transcriptional regulatory network as an example[J]. Physical Review E, 2005, 71(5): 051909. Csermely P, Agoston V, Pongor S. The efficiency of multi-target drugs: the network approach might help drug design[J]. Trends in Pharmacological Sciences, 2005, 26(4): 178-182.

  17. 将做什么 • 继续调研文献数据库的基础上做一个简单的基于三层多向网络的随机走实现药物疾病的拓扑结构关联分析方法RWRTH (random walk with restart on three-layer heterogeneous network)。 • 1 RWRTH介绍 基于相似结构的药物作用功能相关的靶标子网以及功能相关的基因通常引起表型相似的疾病的假设,构建一个简易基于基因网络的三层多向网络结构(如右图所示),利用随机走(random walk)的算法在三层网络间扩散,通过概率分布寻找具有紧密关系的药物-基因-疾病的子网关系,通过已知的药物-疾病关系验证算法准确性,并与已知算法比较RWRTH的优越性,同时探究其可能存在的目前未知的药物-疾病关系。 D 药物网络 G 基因网络 P 疾病网络

  18. 将做什么 • 2 RWRTH方法 2.1 三层多向网络的构建 构建该多向网络需要至少五个网络,即:药物网络,药物-靶标网络,基因网络,疾病基因网络,疾病网络等,当然如果考虑网络融合,在构建基因网络的时候可以把例如代谢网络等融合,参考comCIPHER的做法,如下: 选择FDA允许的多靶标的药物外加drugbank中抗肿瘤药物,通过SIMCOMP计算药物化学结构相似网络 通过DrugBank数据库找出所选药物的药物靶标关系 从HPID,BIND,IntAct,MINT,OPHID等五个数据库中找出PPIs,然后映射到Entrez gene ID,得到基因网络 已知的疾病-致病基因关系可以从OMIM中得到 所选择的疾病相似网络通过MimMiner计算得到

  19. 将做什么 • 2 RWRTH方法 2.2 RWRTH算法 2.2.1网络的融合 在2.1的基础上的网络融合分为两部分,一是共节点的相似性叠加,二是背景网络的融合。 考虑到共靶标的药物之间,共致病基因的疾病之间,以及共药物的靶标之间,同致病的致病基因之间存在一定相似性,所以共节点的相似性来完善2.1的网络。 药物网络(在疾病网络相似) 将其归一化 式中N表示药物网络中的节点数; 表示药物网络本身的相似结构; 表示二者之间选择的常数。 表示最终的药物空间的相似性矩阵,同理 表示疾病空间相似性 基因网络 式中 为基因i,j共同一药物靶标(1或者0) 基因共疾病。 归一化 式中的 表示在基因网络中基于最短距离的相似性[0-1], 表示二者之间的相似性抉择参数, 表示基因网络空间最终的相似性。

  20. 将做什么 • 2 RWRTH方法 2.2 RWRTH算法 2.2.2 二分图邻矩阵的计算 现在考虑两个网络之间的节点的邻矩阵 ,假设药物网络用D,基因网络用G,疾病网络用P表示. D-G之间 同理,在P-G之间 这样就形成了总共五个矩阵,

  21. 将做什么 • 2 RWRTH方法 2.3 RWRTH算法 2.2.2 传输概率矩阵M的计算 首先为了简便起见,假设D和P之间不能流通,且无论在那一层发生调层随机走的概率都是 。并且假设D中节点数为N,G中为K,P中为Z。 表示G中的节点i随机到D中节点j的概率,以此类推 在D中其传输概率矩阵(与P中的相似)为 在G中的传输概率矩阵为

  22. 将做什么 • 2 RWRTH方法 2.2 RWRTH算法 2.2.3 随机游走方程的建立 这里将作为任意时刻的状态向量 , ,N,K和Z分别为D,G,P的节点的数目,那么就有随机走的迭代方程: 式中,r表示在任意步数t时从种子节点 重启的概率,M表示其扩散矩阵。 2.2.4 初始状态 的确定 为了简化起见,假设其初始状态从D和从P开始游走的概率相同,均为 d0 g0 p0根据初始种子节点数目而确定,在每层网络中的种子节点满足和为1的平均概率分布 2.2.5最终状态的确定 当最终随机走基本达到稳态时,也就是前后两次的向量的一阶范数差小于某个数量级(10-6)时就可以认为达到终态

  23. 将做什么 • 2 RWRTH方法 2.3 药物-基因-疾病的子网的获得 在随机游走后我们根据三层多向网络中每个节点的概率分布找出D-G-P的子网N=[d1...di g1 g](如图中红色节点子网所示) 2.3.1 截止频率β 设定划分概率界限为β,三层网络中所有的大于β 的节点n N 2.3.2 初始节点的选择 一般来说可以从D或者P中选择种子节点,同时直接 的其他的网络中的节点也被当做种子节点。 每次随机走的时候都在D或P选择之前子网中不含有的 节点作为种子节点,直到网络中没有空闲的节点为止。 得到了α个子网N。 D 应该在包含三个网络的节点的前提下使其G中的基因节点的最短距离和最小的前提下选择β G P

  24. 将做什么 • 3 RWRTH验证 3.1 随机验证 保持每个子网的节点以及不同层级连接关系不变,多次随机产生α个子网,比较其在G中节点最短距离和的平均值和最小值 3.2 富集倍数 通过从CID数据库中已知的疾病-药物关系以及所选出的已知的子网中所包含的的这种关系来计算出其富集倍数,并与其它算法比较 3.3 功能模块 从子网中选出部分子网解释已有相关文献阐述验证的药物-疾病关系 或者从DAVID中通过GO来验证 3.4 鲁棒性 改变相关的参数,观察其对最终的结果的影响程度 • 4 RWRTH讨论 在子网络N的划分上其依据的假设不是很合理,另外G中还可以融合其他的网络(如代谢网络,信号传导网络等)的信息,提高随机走的预测的准确性 • 5 借鉴 Li Y, Patra J C. Genome-wide inferring gene–phenotype relationship by walking on the heterogeneous network[J]. Bioinformatics, 2010, 26(9): 1219-1224. Chen X, Liu M X, Yan G Y. Drug–target interaction prediction by random walk on the heterogeneous network[J]. Molecular BioSystems, 2012, 8(7): 1970-1978. Zhao S, Li S. A co-module approach for elucidating drug–disease associations and revealing their molecular basis[J]. Bioinformatics, 2012, 28(7): 955-961.

More Related