1.56k likes | 2.35k Views
SNP 分析原理方法及其应用. 卢大儒 复旦大学生命科学学院 遗传工程国家重点实验室. 遗传分析内容. 基因组 : 染色体水平 DNA 水平 基因突变 重复 , 缺失 , 倒位 , 重排 甲基化 基因组不稳定 多态性 : SNP STR, CNV. SNPs ( single nucleotide polymorphisms). 概念:指在基因组水平由 单个核苷酸的变异 所引起的 DNA 序列多态性 。它是人类可遗传的变异中 最常见的一种 ,占所有已知多态性的 90% 以上。
E N D
SNP分析原理方法及其应用 卢大儒 复旦大学生命科学学院 遗传工程国家重点实验室
遗传分析内容 • 基因组: 染色体水平 DNA水平 基因突变 重复, 缺失, 倒位,重排 甲基化 基因组不稳定 多态性: SNP STR, CNV
SNPs(single nucleotide polymorphisms) • 概念:指在基因组水平由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种,占所有已知多态性的90%以上。 • SNP在人类基因组中广泛存在,平均每500-1000个碱基对中即有1个,人类30亿碱基中大约有1000万个SNPs。 • 人类一般为二等位基因(Biallelic)。二等位基因有四种不同类型,包括一种转换C>T (G>A)和三种颠换C>A (G>T)、C>G(G>C)、T>A(A>T)。
...C C AT T G A C... …G G TA A C T G... wt/wt ...C C AT T G A C... …G G T A A C T G... ...C C AT T G A C... …G G TA A C T G... wt/m ...C C GT T G A C... …G G CA A C T G... ...C C GT T G A C... …G G C A A C T G... m/m ...C C GT T G A C... …G G CA A C T G...
DNA序列上单个碱基对的置换、插入或缺失而引起可以遗传的基因结构的变化DNA序列上单个碱基对的置换、插入或缺失而引起可以遗传的基因结构的变化 突变(Gene Mutation) 单核苷酸多态(SNP) • <0.1% • 生殖细胞或体细胞 • 1-50% • 生殖细胞
SNPs的研究意义 1. SNPs作为第三代遗传标记(已知性、可遗传性、可检测性),用于疾病基因的定位、克隆和鉴定。___ 路标的作用 传统研究策略(表征、蛋白、基因) 逆向遗传学 (表型、基因、蛋白) 基因定位:从400个STR到500KSNP芯片 连锁分析基因诊断
2.基因多态性与性状表型研究 研究SNPs 本身对机体的影响 生理特征、病理外界环境条件下的千差万别 个体识别,疾病易感; 能力; 性格; 喜好 药物治疗; 环境适应 生物进化,民族区分
SNP的特征 • 1 单核苷酸变异; • 2 常见 2 等位基因变化; • 3 很稳定, 回复突变极低; • 4 普遍存在, 分布广泛, 均匀 • 5 存在SNP高变区域和热点 • 6 功能相关, 温和变; 联合作用 • 7 SNP连锁单倍型, 标签SNP
2002年人类基因组计划(HGP草图绘制已经成功,功能基因组研究将为疾病的预防,诊断和治疗奠定基础。2002年人类基因组计划(HGP草图绘制已经成功,功能基因组研究将为疾病的预防,诊断和治疗奠定基础。
从HGP 到HapMap • HapMap计划通过对亚、非、欧裔共269个个体全基因组中基因组序列上常见的多态位点(SNP)进行筛查和分析,构建出整合了人类遗传多态信息的“单体型图”,将为疾病易感性、药物敏感性和人类进化研究提供最基本的信息与分析工具。 HGP让我们有了认识人类的参考图. • HapMap 是我们区别彼此差异的参考图; SNP数量剧增, 150-300-600-1000万; SNP- CNV
如何筛查和检索SNP? SNP的筛查: 人群的基因组测序 24-50-100人 SNP检索与选择: 数据库检索; 根据目标选择
拥有自己的基因组图谱 • 随着高通量SNP检测技术和DNA测序技术的发展,拥有个人基因组图谱不是梦! 1 全基因组测序全基因组 30亿-1万-1000 USD 2 SNP芯片 Affymetrix; Illumina 1000 USD 如何解读是今后长时期问题
SNPs related databases • http://egp.gs.washington.edu/ (NIEHS SNPs Program) • http://snp500cancer.nci.nih.gov/home_1.cfm?CFID=264728&CFTOKEN=86045010 (SNP500Cancer) • http://www.hapmap.org/(HapMap project) • http://www.ncbi.nlm.nih.gov/SNP (National Center for Biotechnology Information) • http://snp.ims.u-tokyo.ac.jp/index.html (SNPs database from Japan) • http://www.ornl.gov/sci/techresources/Human_Genome/faq/snps.shtml ……
SNPs: computational candidates where both alleles were seen in multiple chromosomes • genotypes: high-accuracy assays from various platforms; fast public data release 人类单倍型图谱计划(HapMap) • reference samples: 4 world populations • Nigeria 30 sets of trios(30 both-parent-and-adult- • child trios ) • Japan 45 unrelated individuals • China 45 unrelated individuals • U.S. 30 sets of trios http://www.hapmap.org
SNP selection for Disease-gene Association Studies • Approximately 10 million common variants exist in genome • Testing all for association is impractical today • Can the list be reduced with loss of power? • SNPs in Coding (Amino Acid Changes) • SNPs in other functional regions, i.e. regulatory elements • tagSNPs
TagSNPs • Alleles of SNPs that are close together tend to be inherited together. • A set of associated SNP alleles in a region of a chromosome is called a "haplotype". • Most chromosome regions have only a few common haplotypes (each with a frequency of at least 5%), which account for most of the variation from person to person in a population. • A chromosome region may contain many SNPs, but only a few "tag" SNPs can provide most of the information on the pattern of genetic variation in the region. Haplotype 1 Haplotype 2 Haplotype 3 . The two SNPs in color are sufficient to identify (tag) each of the three haplotyes. For example, if a chromosome has alleles A and T at these two tag SNPs, then it has the first haplotype.
SNPs检测方法 1.理想的检测SNPs的方法 ——发现未知的SNPs,或检测已知的SNPs (1) 灵敏度和准确度的要求 (2) 快速、简便、高通量、自动化 (3) 费用低廉 动脑筋的技术活,有意思,有趣,形式万变; 掌握基本原理,本质不离其中
SNP和突变部分筛选和检测方法 • Denaturing High Performance Liquid Chromatography (DHPLC) • Single-Strand Conformation Polymorphism (SSCP) • Restriction Endonuclease Fingerprinting (REF) • Dideoxy Fingerprinting (DDF) • Cleavase Fragment Length Polymorphism (CFLP™) • Denaturing Gradient Gel Electrophoresis (DGGE) • Heteroduplex Gel Electrophoresis (HTX) • Chemical Cleavage of Mismatches (CCM) • Enzymatic Cleavage of Mismatches (ECM) • RNase Cleavage Assay (NIRCA™) • Direct Sequencing • Chip Technology • Real-time PCR • Mass Spectrometer
SNPs检测方法:原理区分 • 基于杂交方法:ASO, 基因芯片,LNA, HRM, 液相芯片 • 结构,构象:PCR-SSCP, DGGE, CFLP DHPLC, DASH,HRM • 基于酶法: DNA聚合酶,连接酶, RNaseH, • 测 序: 化学识别,酶法 • FRET: Taqman,分子信标,循环探针
SNPs检测方法:检测区分 • 凝胶电泳分析技术 • HPLC分析技术 • 质谱检测技术 • 荧光检测技术:流式,板式 • 固相芯片检测技术 • 试纸条显色
Hybridisation Primer Extension Oligonucleotide Ligation Nuclease Cleavage Taqman SNPlex RFLP Affimetrix Amplifluor Sequencing minisequencing Illumina Massy Assay Gel separation DNA Array Mass spectrometry Plate reader 基因分型原理和方法关系简图 DHPLC
Illumina 1536-plex SNPlex SNPstream TaqMan/ Mass Array Throughout Comparation Illumina Affymetrix 550/500 kSNP
基于杂交的方法 • 原理: 短的核苷酸探针在和互补的目的片段进行杂交时,完全匹配和有错配两种情况下,根据杂交复合体稳定性的不同而将SNPs 位点检测出来。 差异越大,检测的特异性就越好
寡核苷酸探针特异杂交(ASO) • 设计中包含SNP位置的特异的寡核苷酸顺序, 通过严格控制杂交和洗脱条件, 同时设置对照,进行杂交时将SNP通过ASO杂交区分出来. • 缺点: 杂交条件的严谨; 严格的对照 • 导致: 假阳性,阴性
提高△Tm • 等位基因特异核苷酸探针 (Allele-specific oligonucleotide,ASO) 。 修饰过的探针:引入一个错配的碱基、PNA、 LNAs等设计中包含SNP位置的特异的寡核苷酸顺序. 通常20bp中一个碱基的差异会导致Tm值下降5~7.5度,修饰后的Tm值会相差2倍. Tm=2(A+T)+4(G+C) (15-20个bp)
PNA是一种核酸类似物,与核酸最主要的区别为其骨架是肽键,而不是核酸的磷酸二酯键骨架,在肽键骨架上连有相应碱基,从而具有以下特征:PNA是一种核酸类似物,与核酸最主要的区别为其骨架是肽键,而不是核酸的磷酸二酯键骨架,在肽键骨架上连有相应碱基,从而具有以下特征: 1、热稳定性 一个PNA碱基杂交体的Tm值的贡献平均高1摄氏度,受盐浓度影响很小。 2、与靶分子高特异性地结合 因为其杂合体Tm值高,受盐浓度很小,因此在低盐浓度的体系中会极大的降低非特异的结合。另外因为一个PNA碱基的错配平均会使其Tm值降低15度,非特异结合很好排除。 3、链挤入 PNA能和挤入含有互补配对碱基区的双链DNA形成三链复合结构,这一特性为其在表达调控以及反义治疗方面提供了较大的应用空间。 4、对核酸酶和蛋白酶均不敏感 这对于在体外应用来说有较大的价值。
与靶分子高特异性地结合 • Tm值高 • 受盐浓度影响小(低盐浓度的体系) • △Tm更大(一个PNA碱基的错配会使其Tm值降低8-20度) PNA/DNA的非特异结合能很好排除。
LNA(locked nucleic acids) • 其结构是在RNA分子的2′羟基和核糖环的4′碳原子间连入一个亚甲基的“桥”。 • 特点: 1.能以很高的亲和性和互补的DNA、RNA 或LNA 结合 (构象更利于杂交的稳定) 2.匹配和不匹配的△Tm增加
LNAs是一种合成的核酸类似物,其结构是在RNA分子的2′羟基和核糖环的4′碳原子间连入一个亚甲基的“桥”,由于“桥”的作用使核糖环处于更利于杂交的稳定构象,所以能以很高的亲和性和互补的DNA、RNA 或LNA 结合,而这种高的亲和性甚至在有一个错配碱基都会大大降低,因此用此作为探针来检测单核苷酸多态性。
双链DNA检测 • 高分辨率融解曲线(HRM) • 动态等位基因特异杂交 (dynamic allele-specific hybridization,DASH)