1 / 38

В.В. Алёшин 30 сентября 2014 года

Молекулярная филогенетика (лекция 1) Принципы построения филогенетических деревьев по молекулярным данным. В.В. Алёшин 30 сентября 2014 года.

Download Presentation

В.В. Алёшин 30 сентября 2014 года

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Молекулярная филогенетика (лекция 1) Принципы построения филогенетических деревьев по молекулярным данным В.В. Алёшин 30 сентября 2014 года

  2. Истинное филогенетическое дерево – объективные родственные связи всех существующих и существовавших на Земле живых форм; дерево, сконструированное на основании нуклеотидных (аминокислотных) последовательностей современных форм с помощью правил вывода, основанных на теоретических положениях.

  3. Сконструированное дерево – это математический объект – связный граф без циклов. Он состоит из вершин (узлов) и соединяющих их ребер. Узлы бывают внутренние – с ним соединено три ребра (или более) и висячие («листья» дерева) – с ними соединено одно ребро. Неформально, висячая вершина – это нуклеотидная (аминокислотная) последовательность современного вида, определенная экспериментально. Ей дают имя и она ОТЕ (англ. OTU). Внутренние узлы дерева можно интерпретировать как гипотетического предка. Дерево – связный граф. Это значит, что из любого узла в любой другой узел существует путь (последовательность соединенных ребер). Это отражает факт, что все нынешние и вымершие виды родственны между собой. Дерево – граф без циклов. Это значит, что путь в дереве между двумя узлами всегда единственный. Таким образом, степень родства каждой пары видов (вершин графа) не произвольная, а строго определенная – определяемая путем между ними по дереву. В частности, любая пара узлов, соединенная в дереве непосредственно, соединена единственным ребром: если ребро соединяет два рассматриваемых узла, то такое ребро единственное. Это отражает эволюционную трансформацию любого вида из вида-предка, причем как единственное событие.

  4. Эквивалентные изображения одного и того же немасштабированного бескорневого дерева ((А, В), (С, D)); из четырех ОТЕ Два дерева имеют одинаковую топологию, если они состоят из одинаковых ОТЕ, соединенных в том же самом порядке (т. е. их внутренние вершины можно занумеровать так, чтобы любому пути в одном дереве был такой же точно путь в другом).

  5. Примеры текстовой и графической записи одного и того же масштабированного дерева:

  6. Willi Hennig

  7. Филогенетическая система Филогеномика Кладистика

  8. 150000 100000 50000 2010 2000 1990 Кумулятивный рост числа публикаций со словами ‘molecular’AND ‘phylogeny’в резюме, согласно базе данных ISI

  9. % СВЯЗАВШИХСЯ ФРАГМЕНТОВ ДНК % НУКЛЕОТИДНЫХ ЗАМЕН В ГИБРИДНЫХ ДНК

  10. матрицы: ... матрица попарных расстояний выравнивание (матрица) ДНК-матрица

  11. Выравнивание. Насколько схожи между собой первичные структуры? Основания (биохимические и генетические) гипотезы молекулярных часов.

  12. |s| < 1/2Ne ; => скорость эволюции = скорости мутирования(независимо от размера популяции) tфикс.=4Ne Выравнивание. Насколько схожи между собой первичные структуры? Основания (биохимические и генетические) гипотезы молекулярных часов.

  13. Идентичность 100% 50 0 время Выравнивание. Насколько схожи между собой первичные структуры? Основания (биохимические и генетические) гипотезы молекулярных часов. p-дистанции и почему это не всегда хорошая мера сходства.

  14. ОТЕ1 ОТЕ2 ОТЕ3 T A G †T †T A 1 †A T †C †A †C †C †A A †G C †G †G †T G †T T Неравноценность различий между близкими и далекими видам

  15. Возникает вопрос: насколько сконструированное дерево соответствует исходным данным (даже не истинному дереву, а данным!). Аддитивные (по отношению к матрице) деревья. Свойство аддитивности проявляет и матрица: в этом случае для любых четверок ОТЕ A, B, C, D выполняется условие, что из трех сумм дистанций dAB + dCD, dAC + dBD, dAD + dBC две суммы должны быть равны и больше третьей. Доказано, что если матрица дистанций может быть отображена аддитивным деревом, то такое дерево единственное. Другими словами, для аддитивного дерева матричная и масштабированная графическая форма представления эквивалентны, а для неаддитивного дерева нет. Для большинства природных ОТЕ деревья получаются неаддитивные.

  16. 0.1 Locusta migratoria 98% Gryllus bimaculatus 100% Hodotermopsis sjoestedti 70% Nilaparvata lugens 98% Apis mellifera 95% Парафилия Crustacea относительно Hexapoda Tribolium castaneum 100% Pediculus humanus 90% Hexapoda Diaphorina citri 98% Acyrthosiphon pisum 100% Aedes aegypti 100% Phlebotomus papatasi 98% Drosophila melanogaster 98% Onychiurus arcticus 69% “Entomostraca” Collembola Folsomia candida 42% Daphnia pulex 97% Artemia franciscana 99% Lepeophtheirus salmonis 44% Homarus americanus 81% Malacostraca Litopenaeus vannamei 92% Peracarida 31% Mesobuthus gibbosus 31% Acanthoscurria gomesiana 70% Chelicerata Ixodes scapularis 97% Carcinoscorpius rotundicauda 13% Anoplodactylus eroticus 98% Myriapoda Scutigera coleoptrata 85% 0.50 Onychophora 84% Caenorhabditis elegans 100% Toxocara canis 82% 0.59 Xiphinema index 90% Hypsibius dujardini 86% Ecdysozoa без Arthropoda Richtersius coronifer 60% 0.50 Spinochordodes tellinii 19% 0.50 Echinoderes horni 85% Priapulus caudatus 55% outgroup

  17. Hexapoda Hexapoda Maxillopoda а б в Branchiopoda Maxillopoda Branchiopoda Hexapoda Branchiopoda Maxillopoda Malacostraca Malacostraca Malacostraca outgroup outgroup outgroup Myriapoda Myriapoda Myriapoda Chelicerata Chelicerata Chelicerata Hexapoda Hexapoda Maxillopoda г д е Branchiopoda Branchiopoda Maxillopoda Hexapoda Maxillopoda Branchiopoda Malacostraca Malacostraca Malacostraca Myriapoda Myriapoda Myriapoda outgroup outgroup outgroup Chelicerata Chelicerata Chelicerata Hexapoda Hexapoda Maxillopoda ж з и Branchiopoda Maxillopoda Branchiopoda Hexapoda Maxillopoda Branchiopoda Malacostraca Malacostraca Malacostraca Chelicerata Chelicerata Chelicerata outgroup outgroup outgroup Myriapoda Myriapoda Myriapoda к # rank item obs au np | bp pp kh sh wkh wsh | # 1 а -9.1 0.861 0.616 | 0.612 1.000 0.806 0.994 0.806 0.999 | # 2 б 9.1 0.312 0.118 | 0.115 1e-004 0.194 0.912 0.194 0.761 | # 3 в 9.6 0.298 0.109 | 0.109 7e-005 0.178 0.902 0.178 0.726 | # 4 г 19.2 0.271 0.086 | 0.086 5e-009 0.152 0.830 0.152 0.697 | # 5 д 25.0 0.191 0.038 | 0.040 1e-011 0.117 0.771 0.117 0.644 | # 6 е 25.2 0.172 0.034 | 0.035 1e-011 0.115 0.765 0.115 0.622 | # 7 ж 35.1 0.021 0.002 | 0.002 6e-016 0.016 0.636 0.016 0.126 | # 8 з 40.9 0.014 0.001 | 0.001 2e-018 0.016 0.574 0.016 0.151 | # 9 и 41.4 0.017 0.001 | 0.001 1e-018 0.015 0.569 0.015 0.144 | # 10 - 140.0 1e-007 2e-007 | 0 2e-061 0 0.054 0 6e-005 |

  18. MP минимальная длина ветви BP Длина Число деревьев деревьев 2689 1 2690 4 2691 4 2692 10 2693 27 2694 51 2695 113 2696 189 2697 344 2698 517 2699 933 2700 1448 2701 2260 2702 >2850

  19. Ecdysozoa “Scolecida” 133 белоккодирующих генов (31 089 позиций аминокислотного выравнивания)

  20. 133 белок-кодирующих генов (31,089 позиций аминокислотного выравнивания) 133 protein-coding genes (31,089 amino acid positions) Baurain et al. Lack of resolution in the animal phylogeny: Closely spaced cladogenesesor undetected systematic errors? Mol. Biol. Evol. 24(1):6–9. (2007)

  21. Условия притяжения длинных ветвей(Long Branch Attraction) Felsenstein J. 1978. Cases in which parsimony or compatibility methods will be positively misleading. Syst. Zool. V. 27. № 4. P. 401-410. Эффект притяжения длинных ветвей (по: Felsenstein, 1978). (а) Схема возникновения неправильного объединения на бескорневом дереве. При вероятности мутации p, меньшей q2, метод максимальной экономии дает устойчивое объединение неродственных длинных ветвей (1 и 3). (b) На корневом дереве внешняя группа 1 притягивает к себе длинную ветвь 3, маскируя её длину и затрудняя распознавание. При этом нарушается топология дерева. Joe Felsenstein Число признаков не является параметром!

  22. 0.1 Locusta migratoria 98% Gryllus bimaculatus 100% Hodotermopsis sjoestedti 70% Nilaparvata lugens 98% Apis mellifera 95% Парафилия Crustacea относительно Hexapoda Tribolium castaneum 100% Pediculus humanus 90% Hexapoda Diaphorina citri 98% Acyrthosiphon pisum 100% Aedes aegypti 100% Phlebotomus papatasi 98% Drosophila melanogaster 98% Onychiurus arcticus 69% “Entomostraca” Collembola Folsomia candida 42% Daphnia pulex 97% Artemia franciscana 99% Lepeophtheirus salmonis 44% Homarus americanus 81% Malacostraca Litopenaeus vannamei 92% Peracarida 31% Mesobuthus gibbosus 31% Acanthoscurria gomesiana 70% Chelicerata Ixodes scapularis 97% Carcinoscorpius rotundicauda 13% Anoplodactylus eroticus 98% Myriapoda Scutigera coleoptrata 85% 0.50 Onychophora 84% Caenorhabditis elegans 100% Toxocara canis 82% 0.59 Xiphinema index 90% Hypsibius dujardini 86% Ecdysozoa без Arthropoda Richtersius coronifer 60% 0.50 Spinochordodes tellinii 19% 0.50 Echinoderes horni 85% Priapulus caudatus 55% outgroup

  23. Huelsenbeck et al. (1996: Figs 2 and 3)

  24. Монофилию многоклеточных и воротничковых жгутиконосцев выявить ТРУДНО Монофилию Holozoa выявить ЛЕГКО

  25. Ctenophora Cnidaria Bilateria Bilateria Cnidaria Cnidaria Porifera Placozoa Porifera Placozoa Porifera Ctenophora Bilateria outgroup outgroup outgroup 51 генов (РНК- и белоккодирующие гены) 104 белоккодирующих гена 150 белоккодирующих генов Sierwater et al., PLoS Biol, 7:1, (2009) Srivastava et al., Nature, 454, (2008) Dunn et al. Nature, 452, (2008) Bilateria Bilateria Cnidaria Placozoa Porifera: Homoscleromorpha Cnidaria Placozoa Ctenophora Porifera: Demospongia Porifera Ctenophora outgroup outgroup 1487 белоккодирующих генов 150 белоккодирующих генов Hejnol et al. Proc. R. Soc. B, (2009) Pick et al., Mol. Biol. Evol., 27:1983-1987, (2010)

  26. UPGMA – Uweighted Pair Group Method using Arithmetic averages (невзвешенный парно-групповой метод с арифметическим усреднением)

  27. Если гипотеза молекулярных часов правильно описывает эволюцию, то правильно построенное дерево будет не только аддитивным, но будет выполнено дополнительное, более строгое условие: в дереве будет точка (корень), равноудаленная от всех висячих вершин. Такое дерево называют ультраметрическим. Все пути по ультраметрическому дереву (ориентированному графу) к любым висячим вершинам, выходящие из любого внутреннего узла, также будут равны (все современные виды прошли в точности одинаковое расстояние от их общего предка). Если в таком дереве взять за точку отсчета вид (висячую вершину), не принадлежащую к некоторой подгруппе (поддереву), то расстояние от него до всех видов подгруппы должно быть в точности одинаковым (тест относительной скорости (Sarich, Wilson, 1973). Понятие ультраметричности относится не только к дереву, но и к данным. Если для любой тройки ОТЕ расстояния в матрице либо все равны, либо два равны, а третье меньше, то матрица ультраметрическая. Доказано, что по ультраметрической матрице всегда можно построить ультраметрическое дерево.

  28. Тест относительной скорости на соотвествие эволюции гипотезе молекулярных часов

  29. 0,1 A C a c x d b B D d d d d d d d d + = + + < + AD AC BD AB CD AC BD BC d d d d + < + AB CD AD BC Условие «четырех точек» Условие «четырех точек» позволяет находить соседние ОТЕ на дереве, несмотря на то, что расстояние между ними не минимальное. Расстояния между ОТЕ известны из матрицы, но заранее не известно, какие ОТЕ соседние. Длина пути между ОТЕ в аддитивном дереве равна значениям в матрице парных расстояний. Сравним суммы расстояний между двумя парами ОТЕ, согласно правилу, понятному из приведенной записи. Следуя этому правилу, из четырех ОТЕ (и шести парных дистанций в матрице) можно составить три пары для суммирования. Пусть А и В соседние (см. рис.), тогда известное расстояние dAB между ними в дереве представлено в виде суммы отрезков a и b. Аналогично, известное расстояние dAC между видами A и C – это в дереве сумма отрезков a, x, c. Если в сумму войдет дистанция между А и В – парой соседних ОТЕ, то, согласно выбранному правилу, другим слагаемым (dCD) автоматически окажется тоже дистанция между парой (другой) соседних между собой ОТЕ. Такая сумма будет меньше, чем сумма расстояний между ОТЕ, не являющихся соседними, так как в последнюю, к сумме длин ребер, ведущих в висячим вершинам, добавляется удвоенная длина внутреннего ребра x. Сумма двух пар дистаниций между ОТЕ, не являющимися соседними, будет, как легко в этом убедиться, одинаковая. Метод UPGMA объединил бы ОТЕ A и C, поскольку между ними минимальное расстояние, но такая топология не удовлетворяет условию «четырех точек». Применяя это условие, можно не только найти правильную топологию, но и, при условии аддитивности, однозначно вычислить длины всех ребер дерева. Поскольку получаемое при этой процедуре дерево бескорневое, из него нельзя сделать вывод, что, например, соседние ОТЕ A и B сестринские. Для такой филогенетической интерпретации недостаточно данных, именно, не указано положение корня, которое необходимо установить дополнительными методами. Если корень не попадет на отрезки a и b, то A и B будут сестринскими. При любом из 5 возможных положений корня (по числу ребер на дереве) OTE, например, A и C сестринскими не будут (по: Li, 1997).

  30. C F A B E D F A A B E F B D E C D C б в а A A D F F C B E B E C D г е д A C F D B E Деревья с мультифуркациями: примеры совместимых и несовместимых деревьев. Дерево а совместимо с любым из деревеьев б, в, г, д; из последних совместимы только б и в; дерево г совместимо с тремя не изображенными бинарными деревьями, а дерево е не совместимо ни с каким другим на рис. 6.

  31. A F A F A C F E D G D D B E H E H H а б в Расширение понятия совместимости на деревья с частично несовпадающим набором ОТЕ. После исключения специфических ОТЕ B, C, G деревья, производные от а и б, приобретут идентичную топологию; с деревом, производным от в, этого не произойдет.

More Related