1 / 55

Podobnosť fylogenetických stromov

Podobnosť fylogenetických stromov. Jana Lukešová. O čom to bude. fylogenetické stromy metódy fylogenetickej analýzy tvorba fylogenetických stromov porovnávanie fylogenetických stromov. Základné pojmy. Fylogenéza vývoj druhov v evolučnom procese (vzťahy) Fylogenetická analýza

Download Presentation

Podobnosť fylogenetických stromov

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Podobnosť fylogenetických stromov Jana Lukešová

  2. O čom to bude • fylogenetické stromy • metódy fylogenetickej analýzy • tvorba fylogenetických stromov • porovnávanie fylogenetických stromov

  3. Základné pojmy • Fylogenéza • vývoj druhov v evolučnom procese (vzťahy) • Fylogenetická analýza • hľadá vzťahy medzi sekvenciami génov, proteínov • Fylogenetický strom • zobrazuje výsledky fylogenetickej analýzy, možný priebeh evolúcie

  4. Z biológie • Proteín (bielkovina) • organická zlúčenina zložená z aminokyselín • Gén • pomenovaný úsek DNA so špecifickou funkciou • kóduje bielkovinu • Genóm • kompletná genetická informácia

  5. Evolúcia • Gény • polymorfné -> alely • frekvencia génu/alely • mení sa v priebehu evolúcie v dôsledku prirodzeného výberu • Mutácie • pozitívne / negatívne / neutrálne • somatické / zárodočné

  6. Fylogenetickéstromy • oblasť analýzy Systému • popisuje vzťahy medzi taxónmi (systematická jednotka) • najlepší prostriedok na vizuálnu reprezentáciu evolučných vzťahov medzi organizmami

  7. Fylogenetické stromy-pojmy • Vetva - vzťah medzi taxónmi (predok-potomok) • Dĺžka vetvy – počet zmien v rámci danej vetvy • Uzol – vyhynutý alebo žijúci druh • Clade (klád) – skupina dvoch alebo viac taxónov / sekvencií proteínov / sekvencií DNA • Vzdialenosť – počet zmien medzi organizmami / sekvenciami • Topológia – usporiadanie vetiev

  8. Fylogenetické stromy - typy • škálované • počet evolučných zmien, čas (molekulárne hodiny)

  9. Fylogenetické stromy - typy • neškálované • nezohľadňujú počet evolučných zmien, udávajú len “dátum“, kedy vznikla daná vetva / taxón

  10. Fylogenetické stromy - typy • bez roota

  11. Fylogenetická analýza • Genómy sa menili mutáciami. • Počet zmien nukleotidov medzi genómami rôznych organizmov môže udávať vývoj rozdielov v čase. (timing of genome divergence) • Porovnávaním rôznych genómov môžeme odhaliť evolučné vzťahy.

  12. Fylogenetická analýza - predpoklady • Sekvencie • neobsahujú chyby • pochádzajú od známeho zdroja • sú homologické (spoločný predok, rôzna funkcia) • každá sekvencia má spoločnú fylogentickú históriu s ostatnými

  13. Hypotéza molekulárnych hodín • zmeny v sekvenciách sa objavujú v pravidelných intervaloch • intervaly sú u rôznych druhov a génov rozdielne • kalibrujú sa pomocou fosílií, aby sa určila doba vzniku kládu

  14. Fylogenetická analýza - metódy • Maximálna parsimónia • strom s najmenším možným počtom evolučných zmien • Metódy založené na vzdialenostiach • Bayesovský prístup • Metóda maximálnej pravdepodobnosti (Maximum likelihood) • najpravdepopodobnejší priebeh evolúcie

  15. Fylogenetická analýza -kroky • Zarovnanie - Multiple Sequence Alignment (MSA) • Určiť substitučný model • Postavenie stromu • Ohodnotenie stromu

  16. MSA

  17. MSA – metódy výpočtu • Dynamické programovanie • Heuristiky • Iteratívne metódy • Hidden Markove modely (pravdepodobnostná metóda) • Genetické algoritmy

  18. Maximálna parsimónia • strom s najmenším možným počtom evolučných zmien • vyžaduje MSA • vhodná pre malý počet podobných sekvencií • náročné na výpočet aj čas • software: PHYLIP, PAUP

  19. Metóda maximálnej pravdepodobnosti (ML) • používa pravdepodobnostné metódy • skúša všetky možné stromy (topológia, dĺžka vetiev) • časovo náročná • vyžaduje substitučný model • umožňuje zohľadniť viac evolučných ukazovateľov v rodokmeňoch

  20. Metódy založené na vzdialenostiach • používa počet zmien v každom páre sekvencií • “susedné“ sekvencie predstavujú najmenší počet zmien • Metódy • Fitch and Margoliash • UPGMA (Unweighted Pair Group Method With Arithmetic Mean)

  21. Matica vzdialeností

  22. Metóda Fitch and Margoliash • Porovnáva “najbližšie“ taxóny s priemerom ostatných taxónov, potom počíta hodnoty medzi menej príbuznými taxónmi, až kým nenájde všetky vzdialenosti. • Neberie v úvahu molekulárne hodiny, výsledkom sú rôzne dĺžky vetiev.

  23. Konštrukcia stromu(1) • Nakreslíme tri možné usporiadania nezakoreneného stromu

  24. Konštrukcia stromu(2) • Na základe najmenej vzdialených sekvencií v tabuľke vyberieme najpravdepodob-nejšie usporiadanie stromu

  25. Konštrukcia stromu(3) • Označíme vetvy stromu

  26. Konštrukcia stromu(4) – výpočet vzdialeností • d(O,P)= o + p = 12 • d(O,avgMN)= o + [q + (m + n)/2] = 27.5 • d(P,avgMN)= p + [q + (m + n)/2] = 29.5 • odpočítame d(O,avgMN) od d(P,avgMN):

  27. Konštrukcia stromu(4) – výpočet vzdialeností • {p + [q + (m + n)/2]} -{o + [q + (m + n)/2]} = 29.5 -27.5 p -o = 29.5 -27.5 = 2 p = o + 2 • d(O,P)= o + p = 12 o + (o + 2) = 12 2o = 10 o = 5 • Teda máme o = 5, p = o+2 = 7 • To isté pre M a N, dostaneme m = 6, n = 9.

  28. Konštrukcia stromu(4) – výpočet vzdialeností • Máme o=5, p=7, m=6, n=9, chceme q. Dosadíme do jednej z rovníc: • d(P,avgMN)= p + [q + (m + n)/2] = 29.5 d(P,avgMN)= 7 + [q + 15/2] = 29.5 q + 7.5 = 22.5 q = 15

  29. Metóda UPGMA(1) • Predpokladá, že • rýchlosť zmien je konštantná (Hypotéza molekulárnych hodín) a • vzdialenosti spĺňajú podmienku: d(x, z) ≤ max{d(x, y), d(y, z)} (silnátrojuholníkováalebo ultrametrickánerovnosť).

  30. Metóda UPGMA(2) • o + p = 12 o = p= 12/2 = 6 • m + n = 15 m = n= 15/2 = 7.5 • Vypočítame priemernú vzdialenosť q od všetkých sekvencií: • (MO + MP + NO + NP)/4 = (26 + 28 + 29 + 31)/4 = 28.5 • q1 + 7.5 = 14.25 q1 = 6.75 • q2 + 6.0 = 14.25 q2 = 8.25 • Therefore, q = q1 + q2 = 15

  31. Metóda UPGMA(3)

  32. Ďalšie metódy tvorby stromov • Presné metódy • Vyčerpávajúce hľadanie (exhaustive search, implicit enumeration) • Branch-and-bound (ohraničovanie vetiev) • Heuristické algoritmy • Pridávanie po krokoch • Približné metódy, ktoré však nezaručujú nájdenie najkratšieho stromu • Úpravy počiatočných stromov • Výmena vetiev (branch swapping)

  33. Vyčerpávajúce hľadanie (1)

  34. Vyčerpávajúce hľadanie (2) • Má zmysel cca do 11 taxónov

  35. Vyčerpávajúce hľadanie (3)

  36. Branch-and-bound (ohraničovanie vetiev) • heuristickou metódou sa nájde suboptimálny strom, ktorý slúži ako východiskové kritérium • pri počte taxónov do 25

  37. A B C Heuristické algoritmy – Pridávanie po krokoch • Najprv sa spoja tri objekty • Potom sa náhodne vyberie štvrtý a postupne sa pridáva k trom existujúcim vetvám • Jednotlivé stromy sa posudzujú podľa optimalizačného kritéria a jeden alebo viaceré najkratšie sa ponechajú do ďalšieho kola, kde sa pridáva piaty objekt, atď.

  38. Výmena vetiev(1) • Výmena susedných objektov (nearest neighbour interchange - NNI)

  39. Výmena vetiev(2) • Prerezávanie vetiev (podstromov) a vrúbľovanie (roubování) – subtree pruning and regrafting (SPR)

  40. Výmena vetiev(3) • Delenie a znovuspájanie stromov – tree bisection and reconnection (TBR)

  41. Porovnávanie fylogen. stromov – pojmy (1) • Konsenzuálny strom (consensus tree) • zobrazuje mieru zhodnosti stromov • väčšinové stromy (majority-rule) • striktné stromy (strict consensus)

  42. Porovnávanie fylogen. stromov – pojmy (2) • Agreement subtree • podstrom rovnaký pre 2 a viac stromov • Greatest Agreement subtree (GAS) • AS s najväčším počtom listov

  43. Porovnávanie fylogen. stromov – pojmy (3) • Triplet • podstrom o troch listoch • štruktúra zakoreneného stromu sa dá vyjadriť výčtom tripletov

  44. Porovnávanie fylogen. stromov – pojmy (4) • Triplety – využitie • môže slúžiť ako báza na výpočet rozdielu medzi zakorenenými stromami • rozdiel štruktúry stromov je počet rozdielnych tripletov • Structural triplet difference(Tree1, Tree2) = 2

  45. Porovnávanie fylogen. stromov – pojmy (4) • Výmena susedných objektov (nearest neighbour interchange - NNI) • používa sa pre výpočet rozdielu medzi nezakorenenými stromami, dá sa previesť na zakorenené stromy • NNI difference je minimálny počet zmien potrebných na prevedenie jedného stromu na strom druhý

  46. Porovnávanie fylogen. stromov – pojmy (5) • Najbližší sused vetvy Dog je Bat a Cow • Najbližší sused vetvy Ant je vetva Dog a vetva predka Bat/Cow • Po 1 NNI kroku dostaneme aj strom rovnaký s Tree 2, teda • NNI difference = 1

  47. Porovnávanie fylogen. stromov - predpoklad • Strom z neusporiadanými vetvami môže byť nakreslený s vetvami v rôznom poradí (vo fylogenetických stromoch to ale nevadí, dôležitá je štruktúra). • To je výhodné na zobrazovanie spoločných a rozdielnych častí. • Cieľom je nájsť také usporiadanie, aby taxóny dvoch stromov boli face-to-face.

  48. Porovnávanie fylogen. stromov - metódy • Minimum Triplet Difference (MTD) • využíva Triplet difference • Maximum Branch Similarity (MBS) • All-But-n • využíva GAS

  49. MTD(1) – vzory Tripletov • Keď ohodnotíme listy hodnotami (–,0,+) dostaneme 12 vzorov Tripletov. • Triplet difference je počet tripletov, ktoré majú rôzne tripletové vzory medzi dvomi stromami.

More Related