100 likes | 316 Views
姓名:詹科 导师:李昂生 研究员 研究方向:复杂网络. 摘要 生物信息学聚类算法介绍 生物学蛋白质功能注释 利用聚类算法的结果分析蛋白质互作网络. 生物信息学聚类算法介绍. 高通量的生物学实验产生大量的蛋白质互作数据 . 如何从从这些实验数据 中挖掘有用的信息以给生物学实验提供线索 ? 已经存在的方法之一是对网络进行聚类分析 . 存在 6 种生物信息学聚类算法 :
E N D
姓名:詹科 导师:李昂生 研究员 研究方向:复杂网络
摘要 • 生物信息学聚类算法介绍 • 生物学蛋白质功能注释 • 利用聚类算法的结果分析蛋白质互作网络
生物信息学聚类算法介绍 高通量的生物学实验产生大量的蛋白质互作数据. 如何从从这些实验数据 中挖掘有用的信息以给生物学实验提供线索? 已经存在的方法之一是对网络进行聚类分析. 存在6种生物信息学聚类算法: 1 Network Blast。既可以对多个网络进行比对,也可以对单个网络进行聚类.算法控制一个cluster包含的最大节点数是15。最后由程序筛选以删除高度重合的clusters。 2 Clique Finder。 2006年由Adamcsek等提出。
3 Markov clustering. 2002年. Enright等 提出.将一个网络的邻接矩阵转换为一个随机矩阵。然后重复如下步骤进行聚类: Expansion。 Inflation。
Density-perriphery based clustering .由Altaf-UI-Amin等于2006年提出。这是一种贪心算法。一个cluster进行增长,以达到一个密度值,这个值位于一个特定的阈值之上。 • Molecular Complex Detection.由Bader和Hogue于2003年提出。是首个对互作进行聚类的算法。也是从一个种子节点进行贪心增长。Mcode对每个节点以这个节点的“k-core”邻居的密度赋予权值。赋值最高的节点作为种子。邻居节点基于其权值被加入。 • Spectral Clustering
二 生物学蛋白质功能注释 01表示METABOLISM。 01.01表示 amino acid metabolism。即更多的分级表示更加细化的功能分类。 一个蛋白质可以具有一种功能。也可以具有多个功能。例如: YAL003w这个蛋白质只具有一种功能:12.04.02。YAL009w具有三种功能:10.03.02,42.10和 43.01.03.09。
三 利用聚类算法的结果分析蛋白质互作网络 研究对象:酵母蛋白质互作网络。2617个节点。11855个互作。连通子图是2375个节点。 利用P值方法预测76个未知蛋白质的功能。
我们的方法:同样的网络,利用small community的理论,寻找这个网络中的蛋白质功能模块。 已知节点 未知节点 已知community 未知community 利用2种预测算法对未知节点进行功能预测. 预测了其中56个未知蛋白质的功能. 与以前的预测互补.
对另外的酵母中的3个蛋白质互作网络进行聚类分析.对另外的酵母中的3个蛋白质互作网络进行聚类分析. 结果还在整理中.