1 / 31

第五章 种群历史和动态

第五章 种群历史和动态. 统计量. Statistic is anything that can be calculated from the data. 溯祖模拟和置信区间. 除了估计参数外,还需要给出置信区间。. A 95% confidence interval is an interval that contains the true value of the parameter With 95% probability. 进化树. 最大简约法 距离法 最大似然法和贝叶斯法. 最大简约法. 能够用最小突变来解释 DNA 序列差异。. 距离法.

riona
Download Presentation

第五章 种群历史和动态

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第五章 种群历史和动态

  2. 统计量 Statistic is anything that can be calculated from the data.

  3. 溯祖模拟和置信区间 除了估计参数外,还需要给出置信区间。

  4. A 95% confidence interval is an interval that contains the true value of the parameter With 95% probability.

  5. 进化树 最大简约法 距离法 最大似然法和贝叶斯法

  6. 最大简约法 能够用最小突变来解释DNA序列差异。

  7. 距离法 不需要推出所有的树,然后找到最好的树。

  8. 最大似然法 给定模型参数的条件下,得到数据的概率。 如果数据量够大,且模型正确,似然法可首选。

  9. 假设:无限位点模型,两条序列,三个核苷酸变异假设:无限位点模型,两条序列,三个核苷酸变异 θ似然方程?

  10. 贝叶斯法 目标:估测某一个溯祖树是正确的概率。 似然方程和先验分布 The probability of the parameter given the data 贝叶斯系统发育,最好的树一般是后验概率最高的树。

  11. 贝叶斯原理 贝叶斯定理由英国数学家贝叶斯 ( Thomas Bayes 1702-1763 ) 发展,用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则:P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B),可以立刻导出:P(B|A)=P(A|B)*P(B)/P(A) Pr(A)是A的先验概率或边缘概率。之所以称为"先验"是因为它不考虑任何B方面的因素。 Pr(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。 Pr(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。 Pr(B)是B的先验概率或边缘概率,也作标准化常量(normalized constant)。

  12. 实例1 如果一个人的基因型是A1A2,那么他把A1基因传给后代的概率? 如果一个人向后代传递A1,那么他的基因型是A1A2的概率?

  13. 实例2 溯祖模型,无限位点模型,如果两条基因序列相同,共祖时间的后验分布?

  14. 基因树和物种树

  15. Reciprocal monophyly 如果分化时间很长,祖先有效群体较小 分化时间约等于共祖时间 Incomplete lineage sorting 如果分化时间很短,祖先有效群体较大 分化时间小于共祖时间

  16. 如果内部支系小于祖先有效群体大小,基因树与物种树不等。如果内部支系小于祖先有效群体大小,基因树与物种树不等。

  17. 基因树≠物种树 Incomplete lineage sorting Estimation uncertainty Horizontal gene transfer Gene duplication or loss

  18. 解读树

  19. 似然值和Felsenstein equation Coalescence trees The distribution of coalescence trees Given the parameters. the probability of the data given a particular tree

  20. MCMC和Bayesian 法 模拟的方法评价所有的树,前提是这些树穷尽了所有可能性。 似然方程的求解:直接 Ewens sampling formula; 贝叶斯法。 Approximate Bayesian computation: 只利用一部分数据信息。

  21. 重组 不同位点之间发生重组,不同位点间的溯祖树会不同。 意味着目前的理论和方法是不适合核基因的任何区段,但线粒体和Y染色体除外。 以建树为基础的分析方法不适合诸如SNP等数据,可以利用一些不用假设“所有位点共有一个溯祖树”的方法,如SFS.

  22. Population assignment, clustering and admixture Match probability 如果一个体在某位点的基因型AA,种群1中match probability ,种群2中 计算这个个体来自种群1或种群2的概率?

  23. 当有多个位点参与,即便位点间等位基因频率差别很小,也可以很准确的对个体分组。当有多个位点参与,即便位点间等位基因频率差别很小,也可以很准确的对个体分组。 如果个体的遗传组成来源多个种群,称为admixed.

  24. 主成分分析(Principle Component Analysis)

More Related