1 / 69

疾病相关常见多态与罕见变异的比较分析

疾病相关常见多态与罕见变异的比较分析. 徐良德 副教授 哈医大生物信息学院. 复杂疾病的复杂性. 复杂疾病的分子遗传特征 多基因 (polygenic) 微效性 (minor effect) 多效性 (pleiotropy) 异质性 (heterogenity) 上位效应 (epistasis) 复杂疾病与生物信息学 高通量、数量化、系统性. SNP 与 SNV. 量度指标. 等位 (Allele) 最小等位频率 (Minor Allele Frequency, MAF) >5%, <5%&>1%, <1% 基因型 (Genotype)

glynn
Download Presentation

疾病相关常见多态与罕见变异的比较分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 疾病相关常见多态与罕见变异的比较分析 徐良德 副教授 哈医大生物信息学院

  2. 复杂疾病的复杂性 • 复杂疾病的分子遗传特征 • 多基因 (polygenic) • 微效性 (minor effect) • 多效性 (pleiotropy) • 异质性 (heterogenity) • 上位效应 (epistasis) • 复杂疾病与生物信息学 • 高通量、数量化、系统性

  3. SNP与SNV

  4. 量度指标 • 等位(Allele) • 最小等位频率(Minor Allele Frequency, MAF) • >5%, <5%&>1%, <1% • 基因型(Genotype) • 基因型频率 • Hardy-Weinberg平衡 • 连锁不平衡(Linkage Disequilirium) • D’, r2, LOD

  5. SNP的特点 • 人类基因组中有1000万个常见SNP,不同人群的SNP存在异质性 • SNP分布均匀,是一种2态多态,易于分型 • SNP与附近的DNA处于连锁不平衡状态,可以特异的代表某个区段 • 将SNP作为分子标记可以用于识别疾病相关染色体区段或作为疾病诊断分子标志物 • 常见变异常见疾病假说是定位研究的基础

  6. SNV的特点 • SNV的最小等位频率小于1%,数量巨大 • 很多SNV是Singleton,在人群中出现频率极低,与某些孟德尔遗传病直接相关 • 一个世代传递会发生约200个新突变位点,体细胞DNA也可能产生SNV • SNV与常见疾病发生有关,可能被常见SNP俘获,也可能独立行使功能

  7. 统计遗传学实验设计

  8. 临床样本积累原则

  9. 记录年龄、性别、民族、BMI、吸烟史、饮酒史等记录年龄、性别、民族、BMI、吸烟史、饮酒史等 • 检测血压、血糖、血脂值及其他与诊断有关的重要生理、病理指标 • 存档特定疾病的特殊生化、血液指标信息 • 保存外周血样 • 条件允许时记录随访信息 • 样本量要求:参考研究经费,越多越好

  10. 候选疾病基因 基因与疾病潜在的相关性 作用机理 功能类 分子实验 群体移植 高通量计算 候选基因的筛选

  11. SNP的筛选原则

  12. 利用HapMap筛选TagSNP • http://hapmap.ncbi.nlm.nih.gov/ • http://hapmap.ncbi.nlm.nih.gov/biomart/martview/50fe71de2801008a858746a71f63bbf0

  13. 利用dbSNP筛选功能性SNP • http://www.ncbi.nlm.nih.gov/projects/SNP/

  14. 关联分析的一般方法回顾

  15. 以SNP为起点的疾病基因识别流程

  16. Alu I 内切酶位点 500bp 200bp AGCT 样品A 内切酶位点突变 X ATCT 样品B G/G G/T T/T 700bp 片段长度 500bp 200bp SNP的实验室分型:限制性内切酶法

  17. 限制性内切酶方法获得的SNP数据

  18. PLA2G7与冠心病分析实例

  19. 研究对象:PLA2G7 • 研究样本:947个对照样本,827个冠心病样本,512个心肌梗死样本 • 研究SNP:3个TagSNP,4个非同义SNP(改变三联密码子编码)

  20. 生理指标采集与统计分析

  21. 单位点关联分析

  22. 多位点单体型关联分析

  23. 生理指标与疾病发生的相关性

  24. 常用的分析工具 • Plink • Merlin • SNPtest

  25. 基因组范围关联分析回顾

  26. 基因组范围关联分析流程

  27. 基因组范围关联分析特点 • 研究SNP数量大(数十万计) • 研究样本量大(case-control数据各大于1000) • 研究的统计显著性水平要求高(p<10-7) • 研究花费大,研究结果意义重大,研究效率不高

  28. 基因组范围关联研究方法

  29. 关联分析结果注释

  30. 肺癌的基因组范围关联研究案例

  31. 实验一:Texas I (1154 case:1173 control) • 315450个SNP • 实验二:Texas II (711 case:632 control) • 实验三:UK (2013 case:3062 control)

  32. 样本信息

  33. 显著关联的肺癌风险SNP

  34. 肺癌基因定位15q25.1 • PSMA4\CHRNA5\CHRNA3\CHRNB4

  35. GWAS研究成果

  36. Nature Genetics中的GWAs (2005-2011)

  37. 基因型与表型数据存储dbGap

  38. 多数据层面的meta分析

  39. Meta分析的基本流程

  40. Meta分析中的数据整合

  41. Meta分析研究2型糖尿病案例

  42. 实验平台一:1924 case:2938 control • 393 143个SNP • 实验平台二:1464 case:1467 control • 378 860个SNP • 实验平台三:1161 case:1174 control • 44 750个SNP

  43. SNP的测序识别

  44. 测序数据SNP识别的流程

  45. 免费的测序数据SNP识别工具

  46. 重点推荐 • SNP识别工具日新月异,基本的提取和质量控制工具应经过大量应用的方法,支持多样本整合 • 单个位点质量估计推荐使用GATK或SOAPsnp • 短读长与参考基因组比对推荐使用较为敏感的工具,如Novoalign或Stampy • 基因型提取方法最好支持多样本贝叶斯推断,并考虑到LD的作用,以提高准确率

More Related