1 / 31

Jukes-Cantor Obecně použitelné odvození

Jukes-Cantor Obecně použitelné odvození. G. C. T. A. -u. u/3. u/3. u/3. A. u/3. G. u/3. -u. u/3. C. -u. u/3. u/3. u/3. -u. u/3. u/3. u/3. T. 4 /3 u t. 4 /3 u t. JC. K2P. D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q).

Download Presentation

Jukes-Cantor Obecně použitelné odvození

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Jukes-Cantor Obecně použitelné odvození G C T A -u u/3 u/3 u/3 A u/3 G u/3 -u u/3 C -u u/3 u/3 u/3 -u u/3 u/3 u/3 T 4/3 ut 4/3 ut JC K2P D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q) D =ut = -3/4 ln(1- 4/3 p)

  2. DALŠÍ MODELY GTR General time reversible + ζ A G Rovnovážné frekvence nukleotidů πA πC πGπT Parametry: frekvence(rychlost) záměn (αβγδεζ) a frekvencenukleotidů (πA πC πGπT) se odvozují z analyzovaných sekvencí zároveň s výpočtem D metodou maximum likelihood (přednáška 4. 4.). β ε δ γ C T α P(t)=eQt, celková rychlost=1 pak D=t

  3. SITE HETEROGENEITY r1 r2 r3 r4 r5 r6 P(t)= eQt P(t)= erQt Taxon A C C C T G GTaxon B A C T T G A ∞ -u u/3 u/3 u/3 P(t)= ∫0 f(r) erQt u/3 u/3 -u u/3 Jin a Nei model D =-3/4 α[1-(1- 4/3 p)-1/α] -u u/3 u/3 u/3 -u u/3 u/3 u/3 α=0,5 p=0,5 pak D=3 α=10 p=0,5 pak D=0,87

  4. SITE HETEROGENEITY r1 r2 r3 r4 r5 r6 P(t)= eQt P(t)= erQt Taxon A C C C T G GTaxon B A C T T G A ∞ P(t)= ∫0 f(r) erQt P(t)= 1/4 er1Qt+ 1/4 er2Qt + 1/4 er3Qt+ 1/4 er4Qt P(t)= 1/4 e0,0334Qt+ 1/4 e0,2519Qt + 1/4 e0,8203Qt+ 1/4 e2,8994Qt

  5. JAK NAJÍT NEJLEPŠÍ STROM

  6. Jak se pozná nejlepší strom? Strom, který nejlépe „vysvětlí“ alignment našich sekvencí. • Prohledávání stromového prostoru– heuristické hledání, Marcov chain Monte Carlo – a skórování stromů podle různých kritérií. • Algoritmus – najde jen jeden strom postupným přidáváním sekvencí, klastrovací analýza (distanční metody).

  7. SKÓROVÁNÍ STROMŮ

  8. NEJMENŠÍ ČTVERCE A B A C A D B C B D C D B D A C n n Q = ∑ ∑wij (Dij- dij)2 Skóre i=1j=1

  9. KOLIK JE MOŽNÝCH STROMŮ? Počet možných topologií strmě roste

  10. POČET TOPOLOGIÍ STRMNĚ ROSTE Pro zakořeněné topologie (2n-3)!! nezakořeněné topologie (2n-5)!! (2*5-3) = 3*5*7 = 105 Faktoriál lichých čísel Stáří vesmíru 4,7*1017 sekund, procesor 3,4*109 operací/s 1027 operací za dobu trvání vesmíru Počet zakořeněných topologií pro různé množství taxonů

  11. JAK PROHLEDÁVAT STROMOVÝ PROSTOR Vztahuje se nejen na maximální parsimonii, ale na téměř všechny nealgoritmické metody (nejmenší čtverce, minimální evoluce, maximum likelihood...)

  12. HEURISTICKÉ HLEDÁNÍ

  13. JAK KRÁČET? NNI Nearest-Neighbour Interchange

  14. JAK KRÁČET? SPR Subtree Pruning and Regrafting

  15. JAK KRÁČET? TBR Tree Bisection and Reconnection

  16. Heuristické hledání 11 10 8

  17. KDE ZAČÍT A NEBÝT ÚPLNĚ MIMO? Taxon addition Pořadí v jakém jsou taxony přidávány ovlivní výsledek

  18. GLOBÁLNÍ A LOKÁLNÍ MAXIMA Globální maximum je zde Skončí zde Začne zde

  19. GLOBÁLNÍ A LOKÁLNÍ MAXIMA Globální maximum je zde

  20. BRANCH AND BOUND SEARCH

  21. BRANCH AND BOUND SEARCH

  22. Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGCACTTGAATGCACTTCGATGGACTTCAAGGG

  23. Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGCACTTGAATGCACTTCGATGGACTTCAAGGG G G G G C C C C G C G C

  24. Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGCACTTGAATGCACTTCGATGGACTTCAAGGG 2 2 G G G G G G G G C C C C 1 G C G C G C

  25. Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGCACTTGAATGCACTTCGATGGACTTCAAGGG 1 2 G A G A G A G G G A A G 2 G A A A A G

  26. MAXIMÁLNÍ PARSIMONIE Fitchův algoritmus {C} {A} {C} {C} {A} {G} {C, A}* {C} {A, G}* {C, A, G}* {C, A}

  27. MAXIMÁLNÍ PARSIMONIE Fitchův algoritmus {T} {G} {T} {T} {G} {C} {T, G}* {T} {G, C}* {T, G, C}* {T, G} XYXXYZ= 3 změny YXXXXX = 1 změna

  28. MAXIMÁLNÍ PARSIMONIE Varianty parsimonie • Camin-Sokal parsimonie – známe původní stav, změny možné jen jedním směrem, reverze se nedějí (SINE elementy) • Dollo parsimonie – daný (komplexní) znak může vzniknou jen jednou, ztrácet se může opakovaně v různých liniích • Vážená parsimonie – různým typům záměn přisuzuje různou váhu

  29. MAXIMÁLNÍ PARSIMONIE • Parsimonie je znaková metoda – vychází přímo ze znaků (např. pozic alignmentu). • Skóre stromu nám říká, jaký je nejmenší počet změn ve všech znacích, ke kterému muselo dojít, pokud by evoluce proběhla podle dané topologie. • Parsimonie nebere v úvahu substituční saturaci. Pravděpodobnost záměny nezávisí na délce větve. • Základní varianta parsimonie považuje všechny typy změn za stejně pravděpodobné.

  30. INCONSISTENCE PARSIMONIE C A Uvažujme, že evoluce proběhla podle stromu vlevo. Na stromu se vyskytovaly větve dvou různých délek, kterým odpovídají pravděpodobnosti změny p a q. p p q q q B D

  31. LONG BRANCH ATTRACTION A p B q q q D p C A C p p q q q B D

More Related