slide1 n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
复杂网络 PowerPoint Presentation
Download Presentation
复杂网络

Loading in 2 Seconds...

play fullscreen
1 / 90

复杂网络 - PowerPoint PPT Presentation


  • 215 Views
  • Uploaded on

Lecture 15. 复杂网络. 2011.5. 讲授内容. 图论与复杂网络 生物复杂网络与主要类型 蛋白质 - 蛋白质相互作用 蛋白质 - 蛋白质相互作用数据库 蛋白质 - 蛋白质相互作用研究主要算法 蛋白质 - 蛋白质相互作用研究示例 途径数据库 蛋白质结构可视化工具与相互结合 未来研究展望. 1 图论与复杂网络. 基本概念. 前言. 我们生活在一个充满形形色色网络的多彩世界里 例如,高速公路网、铁路网、电力网格、电信网、互联网 生物网络:神经网、食物网、流行病传播网. Where‘s George 网绘美境内现金流网络. 人际关系网.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about '复杂网络' - alia


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide2
讲授内容
  • 图论与复杂网络
  • 生物复杂网络与主要类型
  • 蛋白质-蛋白质相互作用
  • 蛋白质-蛋白质相互作用数据库
  • 蛋白质-蛋白质相互作用研究主要算法
  • 蛋白质-蛋白质相互作用研究示例
  • 途径数据库
  • 蛋白质结构可视化工具与相互结合
  • 未来研究展望
slide4
前言
  • 我们生活在一个充满形形色色网络的多彩世界里
  • 例如,高速公路网、铁路网、电力网格、电信网、互联网
  • 生物网络:神经网、食物网、流行病传播网
slide7
关于图论
  • 图论是一个古老的但又十分活跃的分支,它是网络技术的基础。
  • 图论的创始人是瑞士数学家欧拉(L. Euler)。
  • 1736年,欧拉发表了图论方面的第一篇论文,解决了著名的哥尼斯堡七桥难题。
  • 一百年后,在1847年基尔霍夫第一次应用图论的原理分析电网,从而把图论引进到工程技术领域。
slide8
图论的发展
  • 20世纪50年代以来,图论的理论得到了进一步发展,将很多复杂庞大的工程系统和管理问题用图描述,可解决工程设计和管理决策的最优化问题。
  • 例如,完成工程任务的时间最少,距离最短,费用最省等等。
  • 目前,图论在数学、工程技术、经营管理、生物信息学等各方面受到越来越广泛的重视。
slide9
图论是运筹学的分支
  • 运筹学包括:数学规划(线性规划,非线性规划,整数规划,组合规划等)图论、网络流、决策分析、排队论可靠性数学理论、库存论、对策论搜索论、模拟计算等等
slide10
图的基本类型

有向图

无向图

权重无向图

slide11
复杂网络
  • 复杂网络即结构呈现高度复杂性的网络。
  • 我们面临的网络基本上都是复杂网络。
  • 主要参考文献(建议阅读)Steven H.Strogatz. Exploring complex networks. Nature, 410(8):268-276, 2001
slide13
生物网络研究范围
  • 目前,生物网络通常指局限于单个生物体内的、分子水平的研究。
  • 数据和信息的获取:主要搜集来自于通过实验的反应或相互作用联系在一起的特定生物分子。
  • 利用组分(信号、转录、相互作用等)作用方法取得网络的一致性。
slide14
生物网络主要研究类型
  • 信号网络
  • 代谢网络
  • 基因调控网络
  • 蛋白质相互作用网络
slide15
信号网络
  • 细胞内部的有序系列事件:输入和输出,时间和空间域。
  • 细胞内常常充斥着干扰(噪音):难以获得清晰有条理的理想图或表。
  • 在个体的不同组织类型中具有不同的信号途径,使得信号网络的研究更趋于复杂化。
slide16

信号网络: 研究经由时间和空间的细胞内的活化电位

slide17
代谢网络
  • 主要研究目标:代谢途径中的可测产物。
  • 代谢网络的主要特点:
  • 多数代谢网络是稳态的。
  • 代谢途径中的关键节点是可控节点。
  • 在代谢网络中存在负反馈有助于系统的稳定。
  • 对绝大多数代谢途径的研究适用于数学分析手段。
slide18

Boehringer-Mannheim 资源管理表

代谢网络

化学变化网络Networks of chemical change

http://us.expasy.org/

slide20

image credit: U.S. Department of Energy Genomes to Life Program, http://doegenomestolife.org.

基因调控网络

slide21

基因调控网络

  • 很多元素可以调控基因产物浓度,主要包括cDNA、mRNA、蛋白质、小分子等
  • 核酸-核酸,蛋白质-核酸相互作用。
  • 对表型差异非常敏感:基因表达变化巨大,不仅仅在物种之间,可以在同一物种的成员之间。
  • 可能是研究的最为复杂的网络之一。
slide22

Eric H. Davidson,Jonathan P. Rast Paola Oliveri,Andrew Ransick,Cristina Calestani,

Chiou-Hwa Yuh, Takuya Minokawa, Gabriele Amore,Veronica Hinman, Ce´sar Arenas-Mena,

Ochan Otim, C. Titus Brown, Carolina B. Livi,Pei Yun Lee, Roger Revilla, Alistair G. Rust,

Zheng jun Pan, Maria J. Schilstra, Peter J. C. Clarke,Maria I. Arnone, Lee Rowen,

R. Andrew Cameron, David R. McClay, Leroy Hood, Hamid Bolouri

A Genomic Regulatory Network for Development. Science, 2002, 295 1669-1678

建议阅读

slide23
蛋白质相互作用网络
  • 蛋白质的复合体:功能相互作用蛋白质的定位,或参与特定生物活动的蛋白质-蛋白质相互作用 (例如,小泡结合)。
  • 实验方法对相互作用网络的研究常常会导致假阳性或假阴性的产生。
  • 在所有生物网络中,相互作用网络可能是最为“模糊化的”。
slide24

蛋白质相互作用: 功能复杂性的描述

Lethality and centrality in protein networks

H. JEONG, S. P. MASON, A.-L. BARABÁSI & Z. N. OLTVAI

Nature411, 41 - 42 (2001); doi:10.1038/35075138

slide25

生物网络间的关系:

每个 “网络” 都是人工网络依据功能、仅仅依据功能来定义网络, 所有网络是相互关联的

slide27

相关内容

  • 蛋白质-蛋白质相互作用背景
  • 相互作用的重要性
  • 蛋白质相互作用技术对其它领域的影响
  • 蛋白质相互作用类型
  • 蛋白质相互作用研究方法
slide28
蛋白质-蛋白质相互作用背景
  • 蛋白质控制细胞的活性,并作为引起细胞生物活性的媒介
  • 一个细胞不是静态的

形状在变化

分裂

代谢

  • 不同类型的细胞具有不同的意义

淋巴细胞

神经细胞

slide29
蛋白质-蛋白质相互作用的重要性

一信号蛋白与另一蛋白结合可能有系列不同结果 : 

  • 这种结合可以使得一个信号蛋白在某个位置具备活性,或者在某个位置执行其功能。
  • 两个蛋白质的结合导致构象的改变,从而影响活性、或者更易于接近其它的结合域,允许附加的蛋白质相互作用。
slide30
蛋白质-蛋白质相互作用的重要性
  • 设想在一个细胞中,突然蛋白质间的特定相互作用消失了。这个不幸的细胞将变的又“聋”又“盲”,随即瘫痪,最终裂解。
  • 特定的相互作用几乎包含在所有的生理学过程中。
slide31
相互作用研究对其它领域的影响
  • 肿瘤生物学

对蛋白质-蛋白质相互作用的研究有助于深入了解许多已知的原癌基因、肿瘤抑制因子和DNA修复蛋白群的功能。

  • 药物遗传学

药物遗传学研究已经扩展到包括对药物输送、药物受体和药物靶标的研究。

注:药物遗传学(pharmacogenetics)是生化遗传学的一个分支学科,它研究遗传因素对药物代谢动力学的影响,尤其是在发生异常药物反应中的作用。

slide32
蛋白质相互作用类型
  • 二元蛋白质相互作用
  • 支架蛋白质
  • 多元蛋白质相互作用

http://www.udel.edu/chem/bahnson/chem667/crotty/scaffolding_proteins.html#scaffolding

slide33
蛋白质相互作用类型—其他分类方式
  • 代谢和信号途径 。
  • 发育过程中,参与相同细胞功能的蛋白质群的形态形成途径。
  • 大量高分子聚合的结构复合物和分子机。
slide35
数据库开发背景
  • 近年蛋白质技术的快速发展,诸如双杂交技术、噬菌体展示技术和质谱技术,使得我们有可能创建生物分子相互作用网络的详细图谱。
  • 初步的图谱制作已经获得了大量的数据。随着相互作用数据集的增长,需要研发专门的数据库和计算方法,用于数据的存储、可视化和信息的分析,便于知识的有效发现。
  • 蛋白质-蛋白质相互作用的网络数据资源很多,下面罗列了部分资源:
    • BIND (Interaction Network Database)
    • DIP (Database of Interacting Proteins)
    • Protein-Protein Interaction Server
    • Protein-Protein Interface
slide37
示例:什么是DIP?
  • 蛋白质相互作用数据库
  • 1999 年在 UCLA建立
  • 最初目的

extract and integrate protein-protein info and build a user-friendly environment.

slide38
DIP数据库的使用

用于研究

  • Protein function
  • Protein-protein relationship
  • Evolution of protein-protein interaction
  • The network of interacting proteins
  • The environments of p-p interactionspredict
  • Unknown protein-protein interaction
  • The best interaction conditions
slide39
DIP的结构

Protein Table

Method Table

Interaction Table

Reference Table

slide40
DIP数据现状
  • Number of proteins 19344
  • Number of organisms 154
  • Number of interactions 56048
  • Number of distinct experiments describing an interaction 63168
  • Number of data sources (articles) 3213
  • Number of data sources (other) 34
slide41
相关卫星数据库
  • DLRP (http://dip.doe-mbi.ucla.edu/dip/DLRP.cgi)

- Database of Ligand-Receptor Partners

  • LiveDIP(http://dip.doe-mbi.ucla.edu/ldipc/tmpl/livedip.cgi)

- data of the protein states and state transition in protein-protein interaction.

  • JDIP

- a stand-alone Java application that provides a graphical, browser- independent interface to the DIP database.

slide42
主要蛋白质数据库和蛋白质相互作用数据库(1)主要蛋白质数据库和蛋白质相互作用数据库(1)
slide43
主要蛋白质数据库和蛋白质相互作用数据库(2)主要蛋白质数据库和蛋白质相互作用数据库(2)
slide45
蛋白质相互作用预测算法
  • 预测蛋白质的相互作用是目前生物信息学中最具挑战性的研究。
  • 计算预测效率高、花费少。
  • 常见算法分类:1)基于基因组信息方法;2)基于进化关系的方法;3)基于蛋白质序列的从头预测方法;4)基于三维结构信息的方法。
slide46
蛋白质相互作用重要算法
  • 系统发育谱法
  • 基因邻接法
  • 基因融合法
  • 镜像树法
  • 突变关联法
  • 进化速率关联法
  • 基于保守蛋白质相互作用的方法
  • 基于蛋白质一级结构信息的预测方法
  • 基于蛋白质三维结构信息的预测方法
http www biomedcentral com 1471 2105 4 2
电子版的全文可以在该网址获得: http://www.biomedcentral.com/1471-2105/4/2

MCODE算法

一个在大型蛋白质相互作用网络中自动寻找分子复合体的方法

MCODE 算法的操作步骤分三个阶段:

顶点加权复合体预测随意后加工(基于特定连通性准则在已获得的复合体 中过滤或增加蛋白质)

slide49
蛋白质相互作用进展
  • 分子公共知识数据库pSTIING刚刚面世(2006)。
  • 欧洲生物信息学研究院和人类蛋白质组学组织(HUPO)联合启动蛋白质相互作用和其他蛋白质组学数据研究。
  • Stelzl U 等(2005)发布了首个人类蛋白质组相互作用图谱。
  • 美国学者2006年在Nature上公布了蛋白质相互作用图谱。为进一步蛋白质间相互作用提供了技术支持和可参照系,将大大推动对人类蛋白质组网络的认知。
slide51
6.1 相互作用研究的实验手段
  • 常规实验手段
  • 高通量相互作用研究的蛋白质芯片技术
slide52
研究相互作用的常规实验方法
  • 标记融合蛋白法Tagged Fusion Proteins
  • 免疫共沉淀反应Coimmunoprecipitation
  • 酵母双杂交法Yeast Two-hybrid
  • 新型生物传感技术(生物大分子相互作用分析仪)Biacore
  • 原子力显微镜Atomic Force Microscopy (AFM)
  • 荧光能量共振转移试验Fluorescence Resonace Energy Trasfer (FRET)
  • X 射线衍射分析仪X-ray Diffraction
slide54
6.3 用序列数据研究相互作用
  • 只有序列数据的情况下,如何研究蛋白质间相互作用?
  • 已经有一系列的理论算法:系统发育谱法、基因邻接法、基因融合法、突变关联法等
  • 我们实验室多年来主要利用肺癌相关蛋白质序列数据研究蛋白质相互作用
slide55
6.4 从文献信息中挖掘相互作用
  • 研究示例,酵母Saccharomyces cerevisiae
  • 文献摘要来自PubMed,分析了88921个Medline纪录,65807个含有摘要。其中,260个摘要被筛选为训练集。
  • 构建一个包含60000个酵母Medline摘要中常见词的字典。
slide56
定义概率
  • 对于训练数据集,p(n|N,f)表示一个词观察到次数为n的概率,其中,f是该词在字典中的频率,N是训练集字的总数。
  • 则该概率可以使用Poisson分布计算
slide59
7 途径数据库

相关资源简介

kegg kyoto encyclopedia of genes and genomes
KEGG(Kyoto Encyclopedia of Genes and Genomes)
  • 相互作用分子网络中更高级别的功能数据。
  • GENES 数据库有240 943条来自已发布的基因组记录,包括细菌、鼠和人。
  • 有 3 个数据库, GENES, PATHWAY 和 LIGAND databases
  • 每条记录的构成, database:entry 或organism:gene

例如:EC:6.3.2.3 : enzyme

genbank:DROALPC: gene

D.melanogaster:dpp (果蝇成形素分子) : organism specific gene

slide61
关于KEGG
  • 通过在途径中匹配基因组中的基因和基因产物,KEGG可以用于预测蛋白质相互作用网络和关联的细胞功能。
  • PATHWAY数据库中的数据通常被用于归纳出蛋白质相互作用网络,也是基因产物的网络,有三种类型:酶-酶关系(催化代谢途径中各个反应步骤)、直接的P-P相互作用和基因表达关系等。目前,只有酶-酶关系数据被维护。
  • PATHWAY数据库包含了5761条记录,包括 201 个途径图表,14,960 酶-酶关系。
slide63
类似数据库
  • WIT 数据库Oak Ridge National LaboratorySimilar to KEGG
  • Eco Cyc –E Coli Encyclopediathe genome and gene products of E Coli, its metabolic and signal transduction pathways and its RNAs. Contains 4391 genes, 904 metabolic reactions and 129 metabolic pathways
slide65
常见结构可视化软件
  • 100’s of visualization tools have been developed in bioinformatics.
  • Many are specific to hardware such as microarray devices.
  • Shareware utilities for PC’s
    • PDB Viewer, WebMol, RasMol, Protein Explorer, Cn3D
    • VMD, MolMol, MidasPlus, Pymol, Chime, Chimera
for protein interactions we need a metaphor that reveals dynamics
For Protein interactions, we need a metaphor that reveals dynamics
  • Haptic Joystick: Provides force feedback when user manipulates a molecule near another one.
  • 3D Goggles combined with haptic gloves to feel electrostatic potentials and see tertiary structure dynamics.
  • PyMol provides scripting that can produce a movie in 3D of the geometrical relationship between multiple proteins.

Stereo view of interaction of two proteins. Scripting allows for the movement of individual molecules creating a movie.

slide75
9 未来研究展望
  • 为确定蛋白质组中的特定相互作用,我们还需要更多的软件工具。
  • 我们需要新的复合工具管理复合体数据。
  • 我们需要软件展示蛋白质间相互作用的动态关系。
slide76
途径 (调节网络) 预测

计算比较基因组学

文本 (文献) 挖掘

Small RNA 和反义调节

选择性剪切预测

计算代谢组学

BI紧迫研究领域
slide77
基因组语义学(Genome semantics)

膜蛋白结构预测

RNA 三级结构预测

翻译后修饰

动态调节网络

虚拟细胞/生物体模型

… (nobody knows)

BI未来可能的研究方向
bi 10
BI应用的前10位计算方法
  • 动态规划
  • 神经网络
  • 隐马尔科夫模型(HMM)
  • 假设检验
  • Bayesian统计学
  • 聚类
  • 取样研究 (Gibbs, Monte Carlo, etc)
  • 极大似然法
  • 信息理论
  • 支持向量机(Support Vector Machine)
slide79
国际计算生物学主要研究中心
  • Institute of Systems Biology (ISB) (http://www.systemsbiology.org)
    • A new center led by Dr. Leroy Hood
  • Computational Biology Institute of Oak Ridge National Lab (http://compbio.ornl.gov)
    • One of the first computational biology center in the world
  • The Institute for Gonomic Research (TIGR, http://www.tigr.org/)
    • Developed many useful tools for microbial research
slide80
美国开展BI工作的主要大学
  • University of California at Santa Cruz
  • University of California at San Diego
  • Washington University
  • University of Southern California
  • Stanford University
  • Columbia University
  • Boston University
  • Harvard University
  • MIT
  • Virginia Tech
slide81
BI相关国外主要期刊
  • Bioinformatics
  • Nucleic Acids Research
  • Genome Research
  • Journal of Computational Biology
  • Journal of Bioinformatics and Computational Biology
  • In silico Biology
  • Briefings in bioinformatics
  • Applied Bioinformatics
  • IEEE/ACM Transactions on Computational Biology and Bioinformatics
  • Proteins: structure, function and bioinformatics
  • Journal of Computer Science and Technology
  • Genomics, Proteomics and Bioinformatics
slide82
重要的BI国际学术会议
  • Intelligent Systems for Molecular Biology (ISMB)
  • Annual Conference on Computational Biology (RECOMB)
  • IEEE/Computational Systems Bioinformatics Conference (CSB)
  • Pacific Symposium on Biocomputing (PSB)
  • European Conference on Computational Biology (ECCB)
  • IEEE Conference on Biotechnology and Bioinformatics (BIBE)
  • International Workshop on Genome Informatics (GIW)
  • Asia-Pacific Bioinformatics Conference (APBC)
slide83

教学内容简介

1. 绪论与教学安排(何淼,3学时)

2. 核酸与蛋白质数据库(何淼,3学时)

3. 成对序列比对与相似序列搜索技术(邓日强,3学时)

4. 基因组结构注释(邓日强,6学时)

5. 分子系统发育分析与多序列比对(邓日强,3学时)

6. WEB数据发布平台的实现基础(邓日强,3学时)

7. 蛋白质序列特征分析与功能预测(任间,3学时)

8. 蛋白质结构分析(任间,3学时)

9. Microarray基因表达数据分析(任间,3学时)

10. 生物信息学在疾病基因与药物发现中的应用(任间,3学时)

11. 比较基因组学(贺雄雷,3学时)

12. 系统生物学(贺雄雷,3学时)

13. 序列比对算法(何淼,3学时)

14. 基因发现算法的比较和分析(何淼,3学时)

15. 蛋白质相互作用网络(何淼,3学时)

slide84

Final Examination

  • 开卷考试
  • 生物信息学词汇解释
  • 简答题
  • 论述题
  • 在设定学习任务中的综合表现
slide85
基于任务的学习
  • 选题一:运用生物信息学方法揭示、研究中国人的起源。
  • 选题二:微生物比较基因组研究。
  • 选题三:疾病相关基因的发现和药物设计。
  • 选题四:运用生物信息学方法探索重大疾病相关序列的进化特征。
  • 选题五:运用蛋白质相互作用方法,探索植物休眠基因和萌发基因的作用机理。
  • 选题六:运用蛋白质相互作用方法,探索植物的抗虫机理。
  • 选题七:基因复杂性和基因重复
slide86
作业1
  • 调研生物信息学的最新研究热点。
  • 自行组合学习小组,选定课程任务的选题。
  • 第5周Email交题目和名单。
slide87
作业2
  • 请下载安装Bioperl
  • 自行学习使用Bioperl
  • PerlChina.org
slide88
建议阅读文献
  • Eric W. Sayers, et al. Database resources of the National Center for Biotechnology Information . Nucl. Acids Res. (2011) 39(suppl 1): D38-D51 first published online November 21, 2010 doi:10.1093/nar/gkq1172
slide89
课后作业(练习)3
  • 使用Entrez检索Cyp11a、G6PD
  • 利用BLASTn搜索Cyp11a、G6PD序列的同源序列