1.11k likes | 1.94k Views
高通量测序应用与进展. 报告纲要. 高通量测序简介 高通量测序平台的介绍 高通量测序的应用范围及案例分析 相关生物信息学分析软件介绍. 高通量测序简介. 高通量 测序 : 一次性对 几百万到十亿条 DNA 分子进行 并行测序 ,又称为 下一代测序技术 ,其使得可对一个物种的转录组和基因组进行深入、细致、全貌的分析,所以又被称为 深度测序 。 High-throughput Sequencing Next Generation Sequencing Deep Sequencing. 高通量测序流程. 无需建立文库, 两端加测序接头. 文库扩增.
E N D
报告纲要 • 高通量测序简介 • 高通量测序平台的介绍 • 高通量测序的应用范围及案例分析 • 相关生物信息学分析软件介绍
高通量测序简介 • 高通量测序:一次性对几百万到十亿条DNA分子进行并行测序,又称为下一代测序技术,其使得可对一个物种的转录组和基因组进行深入、细致、全貌的分析,所以又被称为深度测序。 • High-throughput Sequencing • Next Generation Sequencing • Deep Sequencing www.sangon.com
高通量测序流程 无需建立文库,两端加测序接头 文库扩增 PCR扩增 并行测序高通量 低通量 A Sanger测序 B 高通量测序
报告纲要 • 高通量测序简介 • 高通量测序平台的介绍 • 高通量测序的应用范围及案例分析 • 相关生物信息学分析软件介绍
高通量测序技术的起源与发展 • 1992年Lynx Therapeutics MPSS • 2003年Polony Sequencing(哈佛) • 2005年454 Pyrosequencing • 2006年Solexa Sequencing-by-Synthesis • 2007年ABI SOLiD • 2008年Helicos tSMS Sequencing • 2010年Ion torrent Semiconductor Sequensing • 2011年Pacific Biosciences SMRT Sequensing www.sangon.com
高通量测序技术的传承关系图 Lynx MPSS Polony Seq 454 Solexa Roche 454 ABI SOLiD IlluminaSolexa Helicos Ion Torrent ABI Ion Torrent SMRT
454 Pyrosequencing • 基于磁珠的焦磷酸测序: A 磁珠制备设备 C 454测序原理 B 454测序仪
454 的特点与主要应用 • 读长较长,400-600bp • 通量较低,1Run 1M 序列,400-600Mb • 相对成本较高 • 主要应用:de novo测序
Illumina Solexa简介 • 桥式PCR • 边合成边测序 • 可逆终止物 HiSeq 2000
diol diol diol diol diol diol 2nd cycle denaturation 1st cycle extension 1st cycle annealing n=35 total diol diol diol diol diol diol 2nd cycle annealing 2nd cycle extension Illumina Solexa 桥式PCR diol diol 1st cycle denaturation
TGCTACGAT … 1 2 5 8 9 6 7 3 4 T T T T T T TGT … Illumina Solexa Base Calling
Solexa 的特点与主要应用 • 读长较短,100-150bp • 通量高,25G每天,120-150G每Run • 主要应用:RNA测序、表观遗传学研究
ABI SOLiD 简介 • SOLiDSequencing by Oligo Ligation/Detection • Oligo连接测序:通过连接酶连接,再对oligo上荧光基团进行检测 SOLiD 5500xl
ABI SOLiD测序前期制备 A 样品片段化 磁珠连接 B 乳化PCR 3‘末端修饰 C 磁珠富集 转到测序玻片
ABI SOLiD荧光结合和结果示例 @SRR029969.1 VAB_5551_12_381_F3 length=35 T11.0203.3.1113211010332111302330201 +SRR029969.1 VAB_5551_12_381_F3 length=35 !36!8/8:!:!462>@6=(<8>8.<;2:*9748078 @SRR029969.2 VAB_5551_13_468_F3 length=35 T202312302.3333130131131322113203131 +SRR029969.2 VAB_5551_13_468_F3 length=35 !9),4/3)&$!(&(573(96,'7&91>)43),(95, B. SOLiD 测序结果示例(Color Space) A. SOLiD Oligo荧光基团模式图
SOLiD 的特点与主要应用 • 读长较短,50-75bp • 精度高,可达Q40 • 通量高, 20-30G每天,1Run 可达120G • 主要应用:基因组重测序、SNP检测等
报告纲要 • 高通量测序简介 • 高通量测序平台的介绍 • 高通量测序的应用范围及案例分析 • 相关生物信息学分析软件介绍
高通量测序应用范围 • DNA测序全基因组de novo测序基因组重测序宏基因组测序人类外显子组捕获测序 • RNA测序转录组测序小RNA测序电子表达谱测序 • 表观基因组研究ChIP-SeqDNA甲基化测序
基因组测序 • 基因组测序是对物种的基因组DNA打断后进行高通量测序,根据是否有已知基因组数据主要分为de novo全基因组测序和基因组重测序。 • De novo 基因组测序是对未知基因组序列的物种进行基因组从头测序,利用生物信息学分析手段对序列进行拼接、组装,从而获得该物种的基因组图谱。 • 全基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。
基因组测序策略 Mate-End Paired-End 基因组测序流程-两种测序策略
Paired-end 原理 100bps 100bps 3000bps www.sangon.com
Paired-end和测序深度对测序效果的影响 Jun Wang, et al. Nature 456, 60-65(6 November 2008)
基因组测序的生物信息学分析 • 数据产出处理:图像识别与Base Calling\去除接头序列、检测与去除污染序列等; • 基因组组装:原始数据统计、测序深度分析、组装结果统计等; • 基因组注释:Coding Gene注释、RNA分类注释、重复序列注释等; • 基因功能注释:GO功能分类、Interpro功能分类等; • 比较基因组及分子进化分析:SNP/InDel/CNV检测等。
References • 1、Erin D. Pleasance, Philip J. Stephens, Sarah O’ Meara, et al.. A small-cell lung cancer genome with complex signatures of tobacco exposure. Nature, 2010, 463:184-190. • 2、Michael James Clark, Nils Homer, Brain D. O’ Connor, et al.. U87MG Decoded: The Genomic Sequence of a Cytogenetically Aberrant Human Cancer Cell Line. PloS Genetics, 2010, 6(1):e1000832. • 3、Wei Chen, Reinhard Ullmann, Claudia Langnick, et al.. Breakpoint analysis of balanced chromosome rearrangements by next-generation paired-end sequencing. European Journal of Human Genetics, 2010, 18: 539-543. • 4、Van Tassell CP, Smith TP, Matukumalli LK, Taylor JF, Schnabel Rd, et al. Whole-genome sequencing and variant discovery in C. elegans. Nat Methods, 2008, 5(2): 183-188. • 5、Jun Wang, Wei Wang, Ruiqiang Li, et al.. The diploid genome sequence of an Asian individual. Nature 456, 60-65(6 November 2008) • 6、Huang SW, Li RQ, Wang J, et al. The Genome of the Cucumber (Cucumis sativus Linnaeus). Nature Genetics 2009; doi:10.1038/ng.475 • 7、David Hernandez, et al. De novo bacterial genome sequencing: Millions of very short reads assembled on a desktop computer. Genome Res. 2008.18: 802-809 www.sangon.com
基因组重测序案例分析 • Erin D. Pleasance, et al. The compendium of somatic mutations in a small-cell lung cancer genome. Nature, 2010, 463:184-190. • 此研究用高通量测序对一个小细胞肺癌细胞系NCI-H209基因组进行重测序,以探讨吸烟引发该细胞系基因组中特定碱基及其周围序列的突变及细胞损伤修复原理。
从头基因组测序案例 • David Hernandez, et al. De novo bacterial genome sequencing: Millions of very short reads assembled on a desktop computer. Genome Res. 2008.18: 802-809 • 此研究对Staphylococcus aureus strain MW2和Helicobacter acinonychis strain Sheeba两种细菌基因组进行从头测序,并比较了几种拼接方法的效果。
多种拼接软件拼接结果比较 五种拼接方法的拼接结果比对
宏基因组测序 • 宏基因组测序是对某一特定环境,如肠道、土壤、海水等中的所有微生物进行基因组测序。通过此方法可对该环境中的微生物种类和优势物种进行检测,揭示微生物群落多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系 。自然环境中很多微生物无法分离培养,而此方法无需对微生物进行分离培养。 • 宏基因组测序方法现在有全基因组的宏基因组测序和16S/18S rRNA宏基因组测序。
全基因组的宏基因组测序 • 通过高通量测序技术,对环境样品的总 DNA 直接进行全基因组的宏基因组测序,能够实现微生物群落的物种分类研究、群落结构、系统进化、功能注释以及物种间的代谢网络研究,挖掘具有应用价值的基因资源,开发新的微生物活性物质。与传统的 Sanger法相比,速度快,性价比高,周期短,单个样品的测序量可以接近饱和。
宏基因组测序信息分析主要内容 • 拼接组装 • 物种分类组成分析 • 基因预测和功能注释 • 生成Profiling table • 主成分分析(PCA) • 筛选与样品分组显著相关的因子 • 多样品间比较分析
16S/18S rRNA宏基因组测序 • 16S/18SrRNA是微生物群落分析和细菌进化研究以及分类研究最常用的靶分子,采用新一代测序技术,对16S/18S rDNA的可变区进行测序分析,不需进行克隆筛选,能全面的反映微生物群体的物种组成,真实的物种分布及丰度信息。
16S/18S rRNA测序信息分析内容 • 物种分类、物种丰度分析 • OTU(Operational Taxonomic Units )分析 • 多样性分析 • 系统进化分析 • 多样品间的比较分析
References • Meyer, F; Paarmann D, D'Souza M, Olson R, Glass EM, Kubal M, (2008). "The metagenomics RAST server - a public resource for the automatic phylogenetic and functional analysis of metagenomes". BMC Bioinformatics9: 0. doi:10.1186/1471-2105-9-386. • George I et al. (2010). "Application of Metagenomics to Bioremediation".Metagenomics: Theory, Methods and Applications. Caister Academic Press. • Wong D (2010). "Applications of Metagenomics for Industrial Bioproducts".Metagenomics: Theory, Methods and Applications. Caister Academic Press. • Nelson KE and White BA (2010). "Metagenomics and Its Applications to the Study of the Human Microbiome". Metagenomics: Theory, Methods and Applications. Caister Academic Press. • CharlesT (2010). "The Potential for Investigation of Plant-microbe Interactions Using Metagenomics Methods". Metagenomics: Theory, Methods and Applications. Caister Academic Press. • Allen, EE; Banfield, JF (2005). "Community genomics in microbial ecology and evolution". Nature Reviews Microbiology3 (6): 489–498. • Zheng, Hao; Wu, Hongwei (2010). "Short prokaryotic DNA fragment binning using a hierarchical classifier based on linear discriminant analysis and principal component analysis.". J Bioinform Comput Biol.8 (6): 995–1011.
人类外显子组捕获测序 • 外显子组是指全部外显子区域的集合,该区域包含合成蛋白质所需要的重要信息,涵盖了与个体表型相关的大部分功能性变异。与全基因组重测序相比,外显子组测序只需针对外显子区域的DNA,覆盖度更深、数据准确性更高,更加简便、经济、高效。 www.sangon.com
检测序列变异分析示例 检测到SNP数统计 序列InDel检测
References • 1、Wei X, Walia V, et al. Exome sequencing identifies GRIN2A as frequently mutated in melanoma. Nat Genet. 2011 Apr 15. [Epub ahead of print] • 2、Janel O. Johnson, J. Raphael Gibbs,et al. Exome Sequencing in Brown-Vialetto-Van Laere Syndrome. Am J Hum Genet. 2010 October 8; 87(4): 567–569. • 3、Teer JK, Mullikin JC.Exome sequencing: the sweet spot before whole genomes. Hum Mol Genet. 2010 Oct 15;19(R2):R145-51. Epub 2010 Aug 12. • 4、Ley TJ, Mardis ER, Ding L, et al. DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome. Nature 2008; 456(7218):66-72 • 5、Gnirke A, Melnikov A, Maguire J, et al. Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing. Nat Biotechnology 2009; 27(2):182-9. • 6、Murim Choia, Ute I. Scholla, Weizhen Jia, et al. (2010) Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. PNAS. 106: 19096-19101. • 7、Sarah B Ng, Kati J Buckingham, Choli Lee, et al. (2010) Exome sequencing identifies the cause of a mendelian disorder. Nature Genetics 42, 30 - 35. www.sangon.com