1 / 110

高通量测序技术在生命科学研究中的应用

高通量测序技术在生命科学研究中的应用. 岳 桂 东 2013 年 4 月. 内容提要. 二代测序技术简介 454 测序 Solexa 测序 SOLiD 测序 DNA 测序文章 介绍 全基因组测序 基因组重测序 简化基因组测序 RNA 测序文章解析 转录组测序 表达谱测序 小 RNA 测序. Single molecule real time(SMRT). Heliscope. PCR (1983). Solid System (2007). 遗传密码 (1966). Nanopore. DNA 测序技术的发展.

aurek
Download Presentation

高通量测序技术在生命科学研究中的应用

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 高通量测序技术在生命科学研究中的应用 岳 桂 东 2013年4月

  2. 内容提要 • 二代测序技术简介 • 454 测序 • Solexa测序 • SOLiD测序 • DNA测序文章介绍 • 全基因组测序 • 基因组重测序 • 简化基因组测序 • RNA测序文章解析 • 转录组测序 • 表达谱测序 • 小RNA测序

  3. Single molecule real time(SMRT) Heliscope PCR (1983) Solid System (2007) 遗传密码 (1966) Nanopore DNA测序技术的发展 毛细管电泳Sequencer (1996) 化学降解和Sanger (1977) DNA双螺旋 (1953) 荧光ddNTP 第一台商用全自动测序仪 (1987) 3700 (1998) Solexa (2006) 454 (2005) DNA重组技术 (1974) 第一台自动 测序仪 (1986) 2010 1950 1960 1970 1980 1990 2000 DNA是遗传物质(1952)

  4. 第二代测序技术 454:SBP(sequence-by-pyroseuencing)焦磷酸测序 Solexa:SBS(sequence-by-synthesis)边合成测序 SOLiD:SBL(sequence-by-ligation)连接法测序

  5. Illumina /Solexa/HiSeq测序简介 GA HiSeq2000 GA与Solexa: GA最早由Solexa研发,Illumina收购Solexa。 升级: 型号:GAI -> GAII -> GAIIx -> HiSeq2000 产量: 1G -> 35G -> 85G -> 200G -> 600G

  6. Flowcell 流动槽

  7. 测序簇的生长 Sequence 20 mnicros Attach single molecules to surface Amplify to form clusters Prepare DNA fragments Ligate adapters ~1000 molecules per ~ 1 µm cluster ~1000 clusters per 100 µm square ~40 million clusters per experiment

  8. 5’ T C A G C C A G T C A G G T T T T C A T A A C G C A G C G T A C 3’ 5’ 边合成边测序 Cycle 1: Add sequencing reagents First base incorporated Remove unincorporated bases Detect signal Cycle 2-n: Add sequencing reagents and repeat • All four labelled nucleotides in one reaction • High accuracy • Base-by-base sequencing • No problems with homopolymer repeats

  9. 三种方法比较

  10. 新一代测序 技术 第二代测序 技术 高通量测序技术给基因组学研究带来新的科研思路! 第一代测序 Sanger 以高通量为特征的新一代测序技术从2005年开始相继出现,分别为454(2005)、Solexa(2006)、Solid(2007);三种二代测序技术各具特色。 第三代测序 技术

  11. 研究内容: • 基因组组分分析:原始数据统计、覆盖度计算、组装结果统计、GC含量分析; • 基因注释及预测: 重复序列分析及注释、基因结构预测及功能注释、Non-coding RNA注释、转座子及串联重复序列注释; • 比较基因组学及进化分析:特有基因区段检测、特有基因检测、快速进化基因检测、共线性分析、基因家族分析 • 数据库网站的建立 不需要任何参考序列即可对某个物种进行测序。 1、De novo基因组测序 对物种进行测序,并用生物信息学方法进行拼接、组装,从而获得该物种的基因组序列图谱。

  12. 2001 2002 2004 2006 2007 2008 2009 2010 1998 2000 2011 2012

  13. 近年BGI参与发表动植物基因组文章

  14. 2. 全基因组重测序

  15. 个体基因组重测序 中国农大6 株玉米基因组重测序。 Nat Genet. 2010;42(11):1027-30. Genome-wide patterns of genetic variation among elite maize inbred lines. 首尔国立大学1株野生大豆基因组重测序。 Proc Natl Acad Sci U S A. 2010;107(51):22032-7 Whole-genome sequencing and intensive analysis of the undomesticated soybean (Glycine soja Sieb. and Zucc.) genome. 中科院植物所3 株高粱基因组重测序。 Genome Biol. 2011;12(11):R114. Genome-wide patterns of genetic variation in sweet and grain sorghum (Sorghum bicolor). 中国甜高粱, 美国甜高粱 , 中国籽实高粱;对比美国籽实高粱。 加拿大阿尔伯塔大学2头牛基因组重测序。 BMC Genomics. 2011;12:559. (黑安古斯牛+荷斯坦牛) Whole genome resequencing of black Angus and Holstein cattle for SNP and CNV discovery. 澳大利亚南十字星大学6株籼稻基因组重测序。 Plant Biotechnol J. 2012;10:623-34. (3株不育系+3株恢复系) Genome-wide DNA polymorphisms in elite indica rice inbreds discovered by whole-genome sequencing.

  16. 群体基因组学研究 BGI 参与29只家蚕和11只野蚕基因组重测序 Science, 2009, 326: 433-4. Complete resequencing of 40 genomes reveals domestication events and genes in silkworm (Bombyx). BGI 参与14株栽培大豆和17株野生大豆重测序 Nature genetics, 2010,42:1053-9. Resequencing of 31 wild and cultivated soybean genomes identifies patterns of genetic diversity and selection. BGI 参与40栽培稻和10野生稻基因组重测序 Nature Biotechnology, 2011,30:105-11. Resequencing 50 accessions of cultivated and wild rice yields markers for identifying agronomically important genes. 瑞典乌普萨拉大学37家猪和11野猪基因组重测序 Proc Natl Acad Sci USA. 2012,109:19529-36. Strong signatures of selection in the domestic pig genome.

  17. 全基因组甲基化测序 (Bisulfite处理+基因组重测序) WGBS • Bisulfite处理和高通量测序相结合; • C碱基的甲基化水平; • 单碱基分辨率DNA甲基化图谱; • 适合物种甲基化修饰模式的精细分析; • 差异性甲基化区域(DMR)分析; • DNA甲基化研究金标准。 样品量: 数据量:推荐30x,至少基因组大小的20x

  18. 研究目的 绘制全基因组甲基化图谱 拟南芥Whole genome Bisulfite-seq文章 Shotgun bisulphite sequencing of the Arabidopsis genome reveals DNA methylation patterning. Nature, 2008, 452, 215-219. 有参考基因组 研究成果 实验设计 芝加哥大学 1、野生型拟南芥经过数据过滤后得到2.6 billion clean data,覆盖度达到93%。其中拟南芥基因组中约43 million C中的92%的测序深度达到31*,全基因组平均深度20*。这与常规Bisulfite-seq用于研究特定区域DNA甲基化所得的结果一致; 2、全基因组范围内甲基化情况:24% CG, 6.7% CHG and 1.7% CHH;且三种类型的甲基化水平分布不同:CG类型或者不发生甲基化或者甲基化水平为80-100%;CHG或者不发生甲基化或者甲基化水平为10%;CHH甲基化水平在20-100%之间均匀分布; 3、对于突变型,每种突变型得到90 million 数据;分别分析了甲基化转移酶对全基因组甲基化状态的影响; 4、Bisulfite-seq比传统基于芯片的研究方法灵敏度高;且能用于研究芯片所不能研究的重复序列; 研究材料: 1个野生拟南芥和6个甲基化转移酶突变拟南芥(均为持续光照下生长五周) 测序策略: Bisulfite-seq illumina genome analyzer 91 PE 第一篇Bisulfite-seq的文章; 第一次绘制拟南芥的甲基化图谱。

  19. 研究目的 研究拟南芥胚乳基因印记与DNA去甲基化之间的关系 拟南芥胚胎Bisulfite-seq文章 Genome-wide demethylation of Arabidopsis endosperm. Science. 2009, 324: 1451. 加利福尼亚大学 研究成果 1、与胚胎相比,胚乳中CG、CHG、CHH 甲基化水平均降低。 2、 DME活性对通过RNA干扰调控的非CG甲基化有上调作用。 3、胚乳中母源基因组CG的去甲基化现象同时伴随着胚胎中CHH的高甲基化 4、与胚胎相比,胚乳CHG、CHH高甲基化区域基本富集在siRNA靶序列区域。 实验设计 研究材料: 授粉7-9d 后野生型拟南芥胚乳组织、缺失DME(DNA糖基化酶)拟南芥胚乳组织 对照:授粉7-9d 后野生型拟南芥胚胎组织、四周龄野生型拟南芥aerial 组织 测序策略: WGBS、 Illumina GA 绘制全基因组甲基化图谱

  20. 研究目的 家蚕全基因组甲基化图谱 家蚕全基因组甲基化图谱 Single base-resolution methylome of the silkworm reveals a sparse epigenomic map. Nat Biotechnol, 2010, 28(5):516-20. 实验设计 研究成果 研究材料: 家蚕丝腺组织 测序策略: WGBS 1、家蚕基因组中约0.11%胞嘧啶是甲基化的,主要发生在CG二核苷酸区域。 2、与先前报道的拟南芥和人相比,昆虫甲基化水平较低。 3、甲基化的CG富集在基因区,并且和基因表达水平呈正相关。 4 WGBS可以用来对甲基化水平比较低的物种进行甲基化研究。 中科院昆明动物所 华大基因 绘制全基因组甲基化图谱

  21. 研究目的 蚂蚁全基因组甲基化图谱 蚂蚁全基因组甲基化图谱 Genome-wide and Caste-Specific DNA Methylomes of the Ants Camponotus floridanus and Harpegnathos saltator. Current Biology. 2012, 22(19):1755-1764. 研究成果 1、在蚂蚁不同发育阶段,非CpG位点也发生了甲基化,之前仅在具有很高甲基转移酶活性的小鼠和人胚胎干细胞中发现过 2、蚂蚁的DNA甲基化多发生在转录活跃基因的外显子区域,可能与可变剪切相关 3、某些基因位点发生了单等位基因甲基化,哪个等位基因发生甲基化取决于蚂蚁的社会等级 纽约大学医学院 华大基因 实验设计 研究材料: 佛罗里达弓背蚁(Camponotus floridanus)和印度跳蚁(Harpegnathos saltator) 测序策略: WGBS、RNA-seq、small RNA sequencing 绘制全基因组甲基化图谱

  22. 研究目的 对线虫基因组中的DNA甲基化现象进行研究和证实。 绘制旋毛线虫甲基化图谱 Differential DNA methylation in discrete developmental stages of the parasitic nematode Trichinella spiralis. Genome Biology. 2012,13:R100. 实验设计 吉林大学 华大基因 研究材料:新生虫(NBL ),幼虫(ML)和成虫(Ad) 策略:DNA甲基化试剂盒处理基因组DNA后利用Hiseq测序Ad、ML、NBL分别获得61.65、23.52 和55.77 M的 raw reads;RNA-seq测序Ad、ML、NBL分别获得28.66、 26.13和28.96M raw reads ;RT-PCR验证。 研究成果 1. 首次证实了在旋毛线虫中存在DNA甲基化。 2. 在旋毛线虫中存在dnmt3酶,而这种酶在其他线虫种类中则未曾发现。 3. 旋毛形线虫从出生到成熟的转变期间,DNA甲基化出现了显著上调,且偏重于调控寄生状态的基因。 4.旋毛线虫中DNA甲基化水平与基因表达量没有线性相关性,但可能与基因的可变剪切有关系。 首次在旋毛线虫中证实了DNA甲基化的存在。

  23. 研究目的 番茄成熟过程中的表观调控机制研究 番茄全基因组甲基化图谱 Single-base resolution methylomes of tomato fruit development reveal epigenome modifications associated with ripening. Nature biotechnology. 2013, 31:154-159. 研究成果 1、确定了52,095个差异甲基化的区域(相当于1%的基因组) 2、重要的成熟转录因子之一RIN的结合位点常位于众多番茄成熟基因启动子的去甲基化区域 3、在果实发育过程中,表观基因组不是一成不变的,极有可能是通过选择确保诸如成熟等发育过程的精确度 美国康奈尔大学 实验设计 研究材料: 不同发育阶段野生型番茄;cnr、rin敲除突变体 测序策略:WGBS、 Strand-specific RNA sequencing、 small RNA sequencing、ChIP-seq Illumina GAIIx HiSeq2000 绘制全基因组甲基化图谱

  24. 3. 酶切位点相关DNA 标签测序技术 (RAD tag sequencing, RAD-seq)

  25. RAD-seq文章 PLoS One. 2008;3(10):e3376 Rapid SNP discovery and genetic mapping using sequenced RAD markers. 研究成果 Institute of Molecular Biology, University of Oregon, United States of America. 发现三刺鱼13,000多个SNPs。 选择不同限制性内切酶获得不同密度的分子标记。 建立一套用于混样的barcoding标签体系。 应用于三刺鱼F2群体(96个F2子代+亲本)构建遗传图谱。 对决定三刺鱼外侧板甲丢失和骨盆结构减少的QTL分别进行定位。 实验设计 研究材料: 三刺鱼 测序策略: Solexa 半个run(GA) Sbf I/EcoR I

  26. RAD-seq构建遗传图谱和QTL定位 • Baxter等(PLoS one,2011)通过对小菜蛾的22个BC1个体(回交1代群体)和2个亲本进行RAD-Seq测序将小菜蛾多杀菌耐药性(孟德尔性状)定位到W/Z性染色体上,并利用2,878个RAD alleles构建连锁图谱,获得31个连锁群。 • Chutimanitsakun等(BMC genomics,2011 )利用RAD标签测序技术对93株大麦DH(双单倍体)群体进行研究,获得530个SNP markers,应用其中的445个SNP,结合之前的marker构建了大麦连锁图谱,并对生殖适度形状进行了QTL定位分析。 • Pfender等(Theor Appl Genet,2011)对一个多年生黑麦草F1群体的193个体进行RAD标签测序,并结合SSR和STS分子标记,利用双假测交原理进行连锁分析,构建了遗传连锁图谱并检测到三个黑麦草抗杆锈病QTL。 • Andolfatto等(Genome Rearch,2011)和Elshire等(PLoS one,2011)分别对RAD标签测序进行了技术改进,并分别在线虫F1回交群体、玉米重组自交系群体、和大麦DH群体中得以成功应用。

  27. 研究目的 开发羽扇豆分子标记,找到抗性基因近距离标记以用于抗病分子遗传育种。 羽扇豆RAD-Seq鉴定抗炭疽病连锁标记 Application of next-generation sequencing for rapid marker development in molecular plant breeding: a case study on anthracnose disease resistance in Lupinus angustifolius L. BMCGenomics. 2012 Jul 17;13:318. 研究成果 1.发现了8207个SNP分子标记; 2.得到与Lanr1连锁共显性标记38个; 3.从38个标记中随机挑选5个候选标记转化为共显性PCR标记。 4、用新PCR标记对186个F8后代分型,与表型数据相结合,发现五个标记均与Lanr1连锁,比先前发现的Lanr1基因连锁标记要近很多。 实验设计 澳大利亚农业与食品部 华大基因 研究材料: 94 个RIL群体 (2个亲本+ 92个子代) 测序策略: illumina PE91 RAD 测序 每个个体0.8X左右

  28. 4、转录组测序(RNA-seq) 转录组:指细胞中含有poly-A的mRNA片段的集合;即真核生物细胞中的mRNA。 • 新转录本分析 • 基因结构优化 • 鉴定可变剪切 • 基因表达定量 基因功能注释 基因GO分类 基因代谢通路分析

  29. Ref RNA-seq:家蚕转录组测序文章 PLoS One. 2012;7(8):e43713. Epub 2012 Aug 23. Transcriptome Analysis of the Silkworm (Bombyx mori) by High-Throughput RNA Sequencing. 中国农科院张志芳研究员 家蚕 (秀丰X白羽):卵、幼虫、一龄虫到四龄虫、中期虫、蜕皮虫。 分别提取total RNA,每样10ug RNA混合,mRNA分离,250bp文库。 RNA-seq:PE100,3.3Gb;7X基因组(432Mb);100X转录组。 RNA-seq所得reads Map到参考基因组数据,得23461个转录本,其中5428个新转录本。 SlikDB中14623个注释基因,11884个(81.3%)在本测序中被发现表达。 GenBank的 ESTdb中收录的家蚕ESTs中,86.8%序列在RNA-seq中出现;但RNA-seq所得转录本中39.6% 不存在家蚕ESTdb中。

  30. 直系同源基因簇(COG)数据库分类注释 在NCBI上,BLASTX搜索,共发现16740条unigenes匹配上已知蛋白序列。 将unigenes 在Cluster of Orthologous Groups (COG) 数据库中进行同源基因簇归类, “general function prediction”分类簇[R]最大( 19.6%), “replication, recombina-tion and repair’’分类簇[L]次之( 12.2%的unigenes )。

  31. 新外显子的发现 6个候选外显子 1个候选外显子 总计鉴定出62084个剪切位点,97.6%的位点为 Class I type (GT-AG/CT-AC)。 共发现13159个新外显子,其中5911个存在于已有注释的基因( SilkDB )中, 这些基因中可能含有家蚕基因组注释过程时所遗漏的外显子。

  32. 可变剪切分析:发现3247个基因具有可变剪切体。可变剪切分析:发现3247个基因具有可变剪切体。 Fig 4. Examples of alternative splicing detected in the silkworm transcriptome displayed using GBrowse in the SilkTransDB database. (A) Alternative first exon of the CUFF.6110. (B) Multiple skipped exons of CUFF.13107. (C) Retained intron of the CUFF.12626. (D) Single skipped exon of CUFF.5585. (A):第一外显子选择。(C):内含子保留。 (B)与(D)外显子跳跃。

  33. 新基因的不同组织不同发育时期表达模式分析 头部,后部丝腺,中肠,翅膀,复眼,3天大5龄幼虫脂肪体,蛹期脂肪体,精巢,卵等等。 7个基因,定量RT-PCR实验, BmActin3为内参基因,3次生物重复。

  34. 家蚕转录组数据库的构建 http://124.17.27.136/gbrowse2/ • 为了便于数据分析,作者建立了一个整合了本研究所得转录组数据和家蚕基因组数据的转录组数据库,并对公共开放,网址为:http://124.17.27.136/gbrowse2/。 • 第一次使用高通量RNA测序技术来阐述家蚕的转录组。 • 本工作数据暗示家蚕的转录组比先前料想的要复杂得多。 • 本研究为鉴定新功能成分提供了工具和资源,并为将来的功能基因组研究做出了铺垫。 Figure 6. Screen shot of the interface of the SilkTransDB.

  35. Ref RNA-seq: 白菜转录组测序分析 Genomics. 2012 May;99(5):299-307.  研究材料:中国”福山包头”大白菜。 RL:莲座期 (Rosette stage) ,植株有8-10片展开叶,茎尖以下5mm取样; FL:结球期 (Folding stage) ,有23-24片展开叶,开始折叠的幼叶,茎尖以下5mm取样。 每个发育时期,从15株植株取样后,混合,液氮冷冻。 提取RNA,构建300bp文库,Illumina HiSeq™ 2000 90PE测序。

  36. Reads的mapping分析 SOAP2 软件(容许2个碱基错配);70.6%的reads可比对上reference genome; 约60% 可比对上unique genes (Annotated exons from of cabbage genome) 。

  37. DEGs的GO分析 两个发育时期有2255个差异表达基因 (FDR≤ 0.001 且log2 Ratio≥ 1)

  38. 植物发育相关基因

  39. 转录本的可变剪切分析 A3SS: Alternative 3‘ splice site,形成不同的转录本,5’端剪接位点一致但3‘端位点不同。 A5SS: Alternative 5‘ splice site,形成不同的转录本,3’端剪接位点一致但5‘端位点不同。 SE: Exon Skipping,外显子跳跃。 RI: Intron retention,内含子保留。 可变剪接在真核生物中普遍存在,可使一个基因产生多个mRNA转录本,翻译成不同蛋白,增加了蛋白多样性。

  40. RT-PCR证实RL与FL中Bra039214的可变剪切体 内含子保留 1682 bp 选择3’端剪切位点 1542 bp 组成性表达 1011 bp

  41. Real-time quantitative PCR 验证

  42. De novo RNA-seq: 中华绒螯蟹附性腺与精巢比较转录组研究 中华绒螯蟹(大闸蟹): 上海金山区漕泾镇商业蟹场,购买健康、性成熟、处于附性腺(ASG)快速发育期的雄性个体(150-200g),3个池子各取3只,共9只蟹剥取9对ASG(Accessory Sex Gland),液氮冷冻。 ASGs样本混合,提取RNA,Illumina HiSeq 2000 PE90测序,方法同前文: He L, Wang Q, Jin X, Wang Y, Chen L, et al. (2012) Transcriptome Profiling of Testis during Sexual Maturation Stages in Eriocheir sinensis Using Illumina Sequencing. PLoS ONE 7: e33735.

  43. De novo组装流程图( SOAPdenovo-v1.03)

  44. 组装结果一览 本次ASG测序 2.66 G(上次T组织测序2.32G),组装得37955个unigenes。

  45. Unigenes长度分布

  46. Unigenes的GO基因本体分类分析

  47. Unigenes的COG同源基因簇分类分析

  48. Unigenes的KEGG注释(225个中前30个代谢途径)

  49. 两种组织Unigenes中的生殖相关基因

  50. 两种组织Unigenes的表达差异分析 DEG分析,其中, 26653条unigenes在testis中特异表达; 631 条unigenes特异在ASG中表达。

More Related