350 likes | 567 Views
基因组时代的 动物遗传评估技术. 张 勤 刘剑锋 中国农业大学 2009.8.25 哈尔滨. 遗传评估. 评估和比较动物个体在遗传上的优劣 为选择优秀种用个体提供依据 动物育种的中心工作. 表现型=基因型+环境. 选择. 常规遗传评估技术. 基因 (黑箱). 表型. 遗传评估. BLUP. 亲属的表型. 环境. 特点:利用表型进行遗传评估. 常规遗传评估技术. BLUP 方法是常规遗传评估技术的核心. y :表型信息 A :系谱信息. 美国荷斯坦奶牛产奶量表型及遗传进展. 常规遗传评估技术. 加拿大猪 100kg 体重日龄遗传进展.
E N D
基因组时代的动物遗传评估技术 张 勤 刘剑锋中国农业大学2009.8.25哈尔滨
遗传评估 • 评估和比较动物个体在遗传上的优劣 • 为选择优秀种用个体提供依据 • 动物育种的中心工作 表现型=基因型+环境
选择 常规遗传评估技术 基因 (黑箱) 表型 遗传评估 BLUP 亲属的表型 环境 特点:利用表型进行遗传评估
常规遗传评估技术 • BLUP方法是常规遗传评估技术的核心 • y:表型信息 • A:系谱信息
美国荷斯坦奶牛产奶量表型及遗传进展 常规遗传评估技术 加拿大猪100kg体重日龄遗传进展 • 对很多重要经济性状十分有效
常规遗传评估技术 • 局限性 • 当性状表型难以获取或遗传力低时,遗传评估可靠性不高 • 不能进行早期遗传评估
选择 标记辅助选择(MAS) 基因 (黑箱) 表型数据 遗传评估 分子遗传学 主效基因/QTL 基因信息 特点:利用表型和部分基因的信息进行遗传评估
标记辅助选择(MAS) 遗传评估技术 - MA-BLUP: • y:表型信息 • A:系谱信息 • M: 标记信息
标记辅助选择(MAS) • 应用现状 • 实际应用不多 • 应用效果不显著 • 主要原因: • 已被证实具有显著效应的基因或标记有限 • (发现并证实一个有效的基因需要很长的时间和很高的成本) • 这些基因或标记仅能解释有限的遗传变异 • (10 QTL ~50% 遗传变异)
基因组选择 • 利用覆盖全基因组的高密度标记(SNP)进行个体遗传评估 • 可以捕获所有的遗传变异 • 无需表型信息即可进行遗传评估 • 利用SNP芯片技术进行标记测定 基因 (黑箱) 遗传评估 标记信息
用于遗传评估的数据 1000111220020012111011112111101111001121100020122002220111 1202101200211122110021112001111001011011010220011002201101 1200201101020222121122102010011100011220221222112021120120 2010020220200002110001120201122111211102201111000021220200 0221012020002211220111012100111211102112110020102100022000 2201000201100002202211022112101121110122220012112122200200 0200202020122211002222222002212111121002111120011011101120 0202220001112011010211121211102022100211201211001111102111 2110211122000101101110202200221110102011121111011202102102 1211011022122001211011211012022011002220021002110001110021 1021101110002220020221212110002220102002222121221121112002 0110202001222222112212021211210110012110110200220002001002 0001111011001211021212111201010121202210101011111021102112 2111111212111210110120011111021111011111220121012121101022 202021211222120222002121210121210201100111222121101
基因组选择 • 基本步骤 1. 利用一个参考群体估计每个SNP的效应 • 参考群体:每个个体都有性状表型记录和所有SNP基因型 2. 利用SNP效应估计值计算候选群体的个体基因组育种值 • 候选群体:每个个体都有所有SNP基因型
基因组选择 性状表型 估计所有SNP的遗传效应 参考群体 SNP基因型 估计基因组育种值 SNP基因型 候选群体 估计基因组育种值 SNP基因型
设计矩阵 估计标记效应 在参考群中估计标记效应gi 染色体片断遗传效应
4× 设计矩阵 计算基因组育种值(gEBV) 在候选群体中计算个体gEBV 全部基因组染色体片断 染色体片断效应 =
基因组育种值 ...... Chr 2 Chr 1 Chr 3 Chr n + 40 + 20 SNPeffect Known SNPs - 00 - 20 Number of SNPs - 40 SNP allele effect 1 + 1 - 1 - 1 + 1 + 25 - 1 + 1 - 1 - 1 - 1 + 42 + 1 - 1 - 1 - 1 - 1 - 22 - 1 + 1 - 1 - 1 = +38
标记效应的估计方法 • 最小二乘法 • 岭回归和BLUP • 贝叶斯方法BayesA, B, C 和压缩 • 其他方法 半参数、非参数 机器学习、主成份分析
最小二乘法 对标记效应分布无任何假设 1: 对每个标记作单点回归分析 2: 选择效应值最大的m个点放入模型中,同时对其进行估计 不足: 1. 难以确定模型选择的阈值 2. 容易高估标记效应
sym. 最佳线性无偏预测和岭回归 BLUP: 岭回归: 人为选定 假定全部标记有相同的方差
数据模型 方差模型 图片来自Hayes,2001 贝叶斯方法-A 允许不同标记有不同的方差且服从一定分布 使用Gibbs sampling! u , gi,Ve ,Vgi
Bayesian shrinkage 贝叶斯方法-B,压缩 允许标记方差为0 概率为 q 概率为 1-q 标记效应越大, 压缩越弱 标记效应越小,压缩越强
数据来自 Meuwissen al et., 2001 不同方法的准确性 准确性:估计育种值和真实育种值间的相关
模型的扩展 SNP Add. Polygenic SNP Dom. • y:表型信息 • X: 遗传标记信息 • A:系谱信息 a: additive SNP d: dominance SNP u: polygenic e: residue
基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)基因组选择和常规遗传估计技术的育种效益比较(以奶业为例) • 后裔测验 (数据来自加拿大) • 每年参加后测的公牛数量: 500头 • 每头后测公牛的育种成本: 5万美元 • 后测的总成本: 2500万美元 • 中选公牛数目: 20头 • 每头中选公牛的育种成本: 125万美元 • 年遗传进展: 0.215遗传标准差 • 单位遗传标准差遗传进展的育种成本: 1.16亿美元
基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)基因组选择和常规遗传估计技术的育种效益比较(以奶业为例) • 基因组选择 • 每个个体基因组标记信息测定成本:500美元 • 基因组单倍型效应估计 • 孙女试验设计: 50个公牛家系, 每头公牛50个儿子,每个儿子100个女儿 • 效应估计成本:125万美元 • 公牛母亲选择 • 进行 2000头母牛的预选择 • 全部个体进行基因组标记信息测定,根据GEBV选择1000母牛 • 评估成本:100万美元
基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)基因组选择和常规遗传估计技术的育种效益比较(以奶业为例) • 基因组选择(续) • 公牛选择 • 从1000头公牛母亲中获得500头预选公牛 • 对所有公牛进行基因组标记测定,根据GEBV选择20头公牛 • 评估成本: 25万美元 • 20头公牛的购买成本:10万美元 • 每头公牛连续3年的维持费用: 3万美元 • 每年的总育种成本:195万美元 • 每年的遗传进展: 0.467遗传标准差 • 单位遗传标准差遗传进展的育种成本:417万美元
基因组选择的另一策略 • 利用参考群体估计SNP效应 • 选择效应显著的SNP • 利用选择SNP的信息构建的参考群体和候选群体个体间的加性遗传相关矩阵(具有性状特异性) • 用BLUP方法估计候选群体(无表型信息)的个体育种值
原理: 参考群体及候选群体的个体育种值 利用SNP的信息构建的加性遗传相关矩阵
基因型系谱 0 = homozygous for first allele (alphabetically) 1 = heterozygous 2 = homozygous for second allele (alphabetically)
两种基因组选择策略的比较 准确性 标记效应估计方法
Questions • 如何估计和分析基因间的互作效应? • 基因组SNP标记测定数目的确定? • SNP效应的估计周期? • 长期选择优化的方案问题? • 多性状选择问题? • 畜禽育种中基因定位的必要性?