610 likes | 1.3k Views
DNA 测序技术 DNA Sequencing. 三峡大学医学院 盛 德 乔 shengdq@ctgu.edu.cn.
E N D
DNA测序技术DNA Sequencing 三峡大学医学院 盛 德 乔 shengdq@ctgu.edu.cn
人类基因组计划(Human genome project, HGP)用了大约10年的时间,各国政府相继投入了几十亿美元,才完成了人类个体全基因组序列的测序工作。而2005年以来,出现的新一代测序技术,却可在1个月内,花费十几万美元就可完成一个人类个体全基因组序列的测序工作。现在,美国、欧洲等各大生物技术公司、大型生物医药研究机构等投入大量的人力物力开始了新一轮的下一代测序技术的技术竞赛,力争实现1000美元完成一个人的全基因组序列的测序,加速个人基因组时代的到来。
一、DNA测序技术概述 • DNA测序——核酸DNA分子一级结构的测定,是现代分子生物学一项重要的技术。 • 核苷酸的排列顺序 • 碱基的排列顺序
1963年,Sanger和Thompson等人第一次完成胰岛素51个氨基酸的序列测定。1963年,Sanger和Thompson等人第一次完成胰岛素51个氨基酸的序列测定。 • 70年代后期,Sanger和Maxam----Gilbert等人又建立了核酸序列测定的方法,Sanger双脱氧末端终止法和Maxam----Gilbert化学裂解法将核酸序列测定技术推进到“直读”阶段,使核酸序列测定变得远比蛋白质氨基酸序列测定容易,这样人们可以通过核酸序列和遗传密码推导出蛋白质氨基酸的序列。
测序技术的发展历史 • 双脱氧末端终止法 (Sanger 测序法) • 1970s 同位素标记,手工 • 1980s 荧光标记,自动 • 1990s 毛细管电泳 • 合成测序法(第二代测序) • 焦磷酸测序(Pyrosequencing, Roche/454) • 合成测序(Sequencing-By-Synthesis, Illumina/Solexa) • 连接测序(Sequencing-By-Ligation, ABI/SOLiD) • 单分子测序技术(第三代测序) • Helicos • Pacific Biosciences • Oxford Nanopore
测序的基本过程 • 制备待测DNA序列模板; • 酶促或化学反应将其转变“等差数列”(n=1); • 电泳PAGE; • 读序。
第一代测序 computer analysis 高灵敏度相机 成象透镜 旋光镜/棱镜组件 聚焦透镜 样品槽 凝胶中DNA移动方向 输入光学系统 激光器
Maxam-Gilbert化学裂解法 化学裂解是Maxam和Gilbert等人1977年创建的,用来测定DNA序列。化学法是用化学试剂在A、G、C、T处特定地裂解DNA片段,产生一簇各种长度的短链(等差数列 n=1),经过PAGE和放射自显影后,可以直接读出DNA的顺序。 某些试剂能修饰或破坏DNA链上特定核苷酸的碱基进而使N-糖苷键断裂,暴露出的糖环以β-消除反应,在3’和5’位上断裂磷酸二酯键。使戊糖脱落,用于嘌呤环的试剂是硫酸二甲酯,而联氨可用于肼解嘧啶环。4种核苷酸的特异裂解和鉴别方法如下:
原 理 • 用放射性核素标记待测DNA一侧末端 • 将标记DNA分为G、A+G、C+T、C 4个反应体系 • 用不同的化学试剂处理不同反应体系,随机断裂DNA片段某种碱基中的任何一个,产生一组一端为放射线标记的末端,另一端为不同大小的DNA片段的混合物 • 电泳分离,放射自显影得到互相错落的梯形图谱,即可读出DNA序列
反应产物电泳 • 放射自显影 • 阅读
Sanger双脱氧末端终止法 • 原理 • DNA链的合成反应,只不过反应体系中加入了四种双脱氧核糖核苷酸(ddNTP)中的一种。 • 在DNA链合成过程中ddNTP会代替部分dNTP作为底物进行DNA合成反应。 • 一旦ddNTP掺入到合成DNA链中,正在延伸的DNA链将终止。 • 经电泳分离,放射自显影,直接读出DNA的核苷酸序列
反应体系 • 引物 • 模板:纯单链DNA和经过热变性或碱变性的双链DNA • DNA聚合酶:Klenow大片段 • 放射性同位素标记的dNTP:32P-dNTP、α-32S-dNTP • ddNTP • 用于测序的变性凝胶电泳: • 胶长40cm
ddATP ddCTP ddTTP ddGTP ddG ddG ddG ddG A C T G 凝胶电泳 5´ 3´ CTGACTTCGACAA GACTGAAGCTGTT 较大片段 读出模板互补序列 读出待测序列 3´ 较小片段 5´ 未知序列的单链DNA 3´ 5´ CTGACTTCGACAAAGAA Klenow酶 dNTP Sanger双脱氧末端终止法 反应混合物
化学降解法程序复杂 后来逐渐被Sanger法代替 这2种方法都需要放射性同位素标记 操作繁琐 不能自动化不能满足大规模测序的要求。 • 到了20世纪80年代末 研究人员逐渐利用荧光标记代替同位素标记测序 产物,经过平板电泳分离 荧光分子在激光的激发下可以发射出不同波长的荧 光 ,根 据 荧 光 信 号 可 以 确 定DNA序 列。
目前所用自动测序技术的改进同位素标记到荧光标记,平板电泳到毛细管电泳目前所用自动测序技术的改进同位素标记到荧光标记,平板电泳到毛细管电泳 A C G T 同位素标记 平板电泳 单色荧光标记 平板电泳 多色荧光标记 毛细管电泳 A C G T 测序图谱 T ATTG CAT TG TCTGCATTG TCT
毛细管电泳 • 基本原理: • 与链终止法测序原理相同,只是用不同的荧光色彩标记ddNTP,如ddATP标记红色荧光,,ddTTP标记绿色荧光,ddCTP标记蓝色荧光,ddGTP标记黄色荧光,由于每种ddNTP带有各自特定的荧光颜色,而简化为由1个泳道同时判读4种碱基。
DNA自动测序结果举例 目前商品化生产的最先进测序仪ABI3730测序仪,最长可以测1200个碱基
DNA测序技术的应用 分析基因组核苷酸排列序列 寻找致病基因 基因定点诱变的基础 基础研究(基因表达、突变) 临床应用(基因诊断、基因治疗)
目前所用测序技术的缺点 • 测序的原理是DNA链终止法,这注定了一个反应所测序列不可能太长,目前为1000个核苷酸左右。 • 测序反应费时费力 科学家们完成第一个人类基因组测序整整花了13年的时间,耗费了30亿美元的费用。 • 测序准确度不高 DNA聚合酶造成的碱基错配,DNA序列判读错误。 • 测序基于PCR反应,需要引物,并且有些些结构复杂的难于进行PCR反应的片段不能测序。
三、 第二代测序技术 • 第二代测序技术——循环阵列合成测序法 • 新一代测序技术(Next Generation Gequencing,NGS) • 代表技术为 • 罗氏公司(Roche)的454测序仪(Roche GS FLX sequencer) (2005) • Illumina公司的Solexa基因组分析仪(Illumina Genome Analyzer) • ABI的SOLiD测序仪(ABI SOLiD sequencer)(2007)
Next-generation sequencing technology Birthday Principle 2005 Pyrosequencing Sequencing-by-Synthesis 2006 2007 Sequencing-by-Ligation
1. ROCH-454的优势 454平台的突出优势是读长。目前454系统的序列读长已超过400 bp。虽然454平台的测序成本比其他平台要高很多,不过对于那些需要长读长的应用,如从头拼接和环境微生物组学,它仍是最理想的选择。
2. Illumina GA的特性 可扩展的超高通量Genome Analyzer系统目前每次运行后可获得超过20 GB的高品质过滤数据。经优化后通量还有望上升到95 GB,相当于人类基因组的30倍覆盖度。 需要样品量少Genome Analyzer系统需要的样品量低至100ng,能应用在很多样品有限的实验(比如免疫沉淀、显微切割等)中。 简单、快速、自动化Genome Analyzer系统提供了最简单和简洁的工作流程。制备样品文库可以在几小时内完成,一个星期内就能得到高精确度的数据。自动化的流程不减少了手工操作误差和污染可能性,也不需要机器人操作或洁净室。
3. ABI SOLID的特性 无以伦比的通量 目前SOLiD 3系统单次运行能产生50 GB的人基因组序列数据,相当于基因组的17倍覆盖度,这显然是其他任一台新一代测序系统都无法达到的 准确性 新的超精确检测模块(ECC模块)将提供高达99.99%的精确性;多达98%的可定位碱基的质量值高于45;更多标签以提高灵敏度和动态范围;高准确性的原始读序,支持无参考序列的数据分析。
第二代测序技术最显著的特征是高通量, 一次能对几十万到几百万条 D NA 分子进行序列测序, 使得对一个物种的转录组测序或基因组深度测序变得方便易行。
共同特点: • 成了生物医学、计算机、微电子学、光学、材料科学和精密加工等多学科技术。例如,Roche GS FLX sequencer的图像采集技术就借鉴现代天文望远镜的光学系统技术,即超高分辨率的CCD集成光纤束技术。 • 测序策略主要基于循环芯片测序法(Cyclic-array sequencing),即制备DNA文库,单分子扩增,在固相载体上形成DNA簇阵列,并行地利用DNA聚合酶或者连接酶进行酶促反应(模板变性、引物退火杂交、延伸或连接),同时读取反应产生的特异性荧光信号,最终得到超大量的DNA序列信息。
高通量并行测序。例如,Roche GS FLX sequencer一次就可对上百万条DNA分子同时进行序列测定,一次运行通量达到400Mb以上,而传统测序(一代测序)一轮测序的通量仅为80Kb左右。
第二代测序技术的应用 • 从头测序 ( de-novo sequencing) 对于基因组未被测序过的生物, 其基因组测序需要从头测序。 • 重测序 • SNP (Single Nucleotide Polymorphism)研究 • 转录 组及表达 谱分析 • RNA测序 ( miRNA ) • 转录调控研究 (ChIP-Seq)
目前使用最广泛的三大第二代测序平台测序能力统计信息(2010年年初数据)目前使用最广泛的三大第二代测序平台测序能力统计信息(2010年年初数据) 3个水稻基因组/天 12个水稻基因组/天 10个水稻基因组/天 Solexa和SOLiD配对末端测序所需时间和产出是单末端的两倍,454的配对末端和单末端差异在于建库方法,所需时间和测序量不变。 ABI SOLiD包含两张芯片,这里的数据是一张芯片的量。 http://www.politigenomics.com
第二代测序技术采用了高通量测序技术,使测序通量大大提高,从Sanger测序法一次读取一条序列到毛细管测序的一次读取96条序列再到现在的一次读取几百万条序列的实现,不得不说这是对第一代测序技术的一次革命性的变革。第二代测序技术采用了高通量测序技术,使测序通量大大提高,从Sanger测序法一次读取一条序列到毛细管测序的一次读取96条序列再到现在的一次读取几百万条序列的实现,不得不说这是对第一代测序技术的一次革命性的变革。 然而第二代测序技术并不完美,由于其在测序前要通过PCR手段对待测片段进行扩增,因此增加了测序的错误率。并且其测序结果比较短,更适合重测序,而不太适用于没有基因组序列的全新测序。
四、 第三代测序技术 • 虽然第二代测序技术已经取得广泛应用,但是其必须基于PCR扩增,成本、准确性等关键问题仍然存在,科学家正在致力于新的测序解决方案。目前,以单分子测序为主要特征的第三代测序技术,也称为next-next-generation sequencing已经初现端 倪 。
生物科学公司BioScience Corporation的HeliScope单分子测序技术 (2008) • 斯坦福大学的科学家最 近利用 Heliscope单分子测序仪, 用了 48000 美元的试剂和 4 个星期的时间, 对一名白人男子的基因组进行了测序。 • 太平洋生物科学公司PacBio的SMRT(single cell real time)技术 • 目标:1000美元测定一个人类基因组 • 牛津纳米孔技术公司Oxford Nanopore technologies的蛋白纳米孔测序技术 (流行趋势)
Pacific Biosciences公司发明了一种直径只有几十纳米的纳米孔[zero-mode waveguides (ZMWs)],单分子的DNA聚合酶被固定在这个孔内。在这么小的孔内,DNA链周围的荧光标记的脱氧核苷酸有限,而且由于A,T,C,G这四种荧光标记的脱氧核苷酸非常快速地从外面进入到孔内又出去,它们形成了非常稳定的背景荧光信号。而当某一种荧光标记的脱氧核苷酸被掺入到DNA链时,这种特定颜色的荧光会持续一小段时间,直到新的化学键形成,荧光基团被DNA聚合酶切除为止。
新型纳米孔测序法(nanopore sequencing)是采用电泳技术,借助电泳驱动单个分子逐一通过纳米孔来实现测序的。由于纳米孔的直径非常细小,仅允许单个核酸聚合物通过,因而可以在此基础上使用多种方 法来进行高通量检测。
纳米孔测序技术— 链测序(strand sequencing)
Oxford Nanopore Technologies与牛津大学合作, 已设计另外一种基因工程蛋白质纳米孔. 通过遗传工程改造, 他们已经可以构建一种将氨基化环糊精(Aminocyclodextrin)配体共价连接到位于脂双层膜中的α-溶血蛋白内生物纳米孔。 • 驱动4种核苷酸单磷酸(dNMPs)通过生物孔, 通过纳米孔的电流将分别减少到4种不同的状态, 每种状态都与一种核苷酸单磷酸相对应。 • 核酸外切酶将DNA链切成单个核苷酸。 • GridION(2011) • MinION (2012)即插即用、一次性
英国Oxford Nanopore Technologies公司2012年2月的发布了一款便携式的基因组测序仪MinION,约摸只有U盘大小,价格低于900美元,立即引发市场轰动。
HiSeq X Ten测序仪 • HiSeq X Ten是Illumina于2014年推出的最新测序系统,其功能定位为工厂规模的测序系统。 • HiSeq X Ten系统,全球首台也是唯一一台可以1000美元完成人类基因组30X测序深度的系统。 • HiSeq X Ten系统由10台以上的HiSeq X组成。
HiSeq X Ten测序仪 • 功能强大 • 价格昂贵
第三代测序技术优点 • 它实现了DNA聚合酶内在自身的反应速度,一秒可以测10个碱基,测序速度是化学法测序的2万倍。 • 它实现了DNA聚合酶内在自身的processivity(延续性,也就是DNA聚合酶一次可以合成很长的片段),一个反应就可以测非常长的序列。 这为基因组的重复序列的拼接提供了非常好的条件。 • 它的精度非常高,达到99.9999%。
直接测RNA的序列(类似RT-PCR) • 直接测甲基化的DNA序列:正常的C或者甲基化的C为模板,DNA聚合酶停顿的时间不同。根据这个不同的时间,可以判断模板的C是否甲基化。