1 / 79

Para construir un árbol filogenético se necesitan tres ingredientes básicos:

Para construir un árbol filogenético se necesitan tres ingredientes básicos:. 1.- Un alineamiento múltiple de secuencias bien hecho. 2.- Un modelo evolutivo que explique las diferencias observadas. 3.- Uno de los muchos métodos que existen para construir el árbol. Materiales de partida.

napua
Download Presentation

Para construir un árbol filogenético se necesitan tres ingredientes básicos:

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Para construir un árbol filogenético se necesitan tres ingredientes básicos: 1.- Un alineamiento múltiple de secuencias bien hecho 2.- Un modelo evolutivo que explique las diferencias observadas 3.- Uno de los muchos métodos que existen para construir el árbol Materiales de partida

  2. Hay que saber seleccionar las secuencias del AMS

  3. 1.- Es importante escoger bien las secuencias (ortólogas o parálogas) 2.- Es importante que las secuencias tengan el grado de diversidad adecuado: ni poca ni mucha. 3.- Una vez hecho el AMS, se considera que cada posición ha evolucionado de forma independiente y, normalmente, a la misma velocidad. Si se pueden evitar los huecos, mejor. 4.- Para construir el árbol filogenético, en vez de cuantificar el grado de similitud, se cuantifican las diferencias. El alineamiento múltiple de secuencias

  4. 1.- El más sencillo: Todas las secuencias evolucionan a la misma velocidad y la divergencia es moderada (cada posición ha mutado, como mucho, una vez). Es un modelo poco realista, que puede valer si se aplican correcciones. 2.- Corrección de Poisson: La velocidad de mutación es uniforme (la misma para cada sitio y por unidad de tiempo).En cada posición, la probabilidad de que se produzcan mutaciones se ajusta a una distribución de Poisson. 3.- Corrección Gamma (G): Considera que la probabilidad de que se produzcan mutaciones no es la misma en todas las posiciones (esto es lo que se suele observar en las secuencias funcionales o en las que codifican proteínas) Modelos evolutivos (1)

  5. 4.- Jukes-Cantor (JC): Cada posición es independiente y evoluciona a la misma velocidad. Todas las bases son igual de abundantes y todas las sustituciones de nucleótidos son equiprobables y ocurren a la misma velocidad (aunque se puede aplicar la corrección Gamma). La suma de cada fila es cero: el número de posiciones (la longitud de las secuencias) permanece constante La suma de cada columna es cero: el número de bases de cada tipo permanece constante Modelos evolutivos (2)

  6. 5.- Kimura con 2 parámetros (K2P): Diferencia entre transiciones y transversiones. Las transiciones ocurren a una velocidad a y las transversiones a una velocidad b. R es el cociente entre la velocidad de transiciones y transversiones (R=a/2b). Si fuesen equiprobables, R valdría ½, pero es frecuente observar valores de 4 o mayores (la presión evolutiva parece favorecer las transiciones). Todas las bases son igual de abundantes. Modelos evolutivos (3)

  7. b Transiciones (a) C G Purina ↔ Purina Pirimidina ↔ Pirimidina b a b a Transversiones (b) Purina ↔ Pirimidina T A b R = relación transiciones/transversiones Aunque el número de transversiones es el doble que el de transiciones, las transiciones son dos veces más frecuentes que las transversiones Transiciones vs. transversiones

  8. Sustituciones de nucleótidos observadas en un conjunto de secuencias alineadas del gen para la subunidad II de la citocromo c oxidasa mitocondrial bovina. Nº total de mutaciones transversiones Nº de transiciones >> nº de transversiones

  9. 6.- HKY85 (Hasegawa, Kishino, Yano): Es una modificación del modelo de Kimura en la que se tiene en cuenta la composición real de las bases, que no tienen por qué ser igual de abundantes. La composición de las bases es pA:pC:pG:pT. Se cumple que pA+pC+pG+pT = 1 Modelos evolutivos (4)

  10. 7.- Modelos complejos: Se tiene en cuenta la composición real de las bases y cada tipo de sustitución se da con una frecuencia distinta. Cada posición muta de forma independiente y con igual probabilidad. Modelos evolutivos (5)

  11. Sólo utilizan el modelo evolutivo para calcular las distancias Métodos que utilizan la distancia evolutiva UPGMA Fitch - Margoliash Métodos para construir árboles filogenéticos Neighbor - joining Hacen uso del modelo evolutivo durante todo el proceso de creación del árbol filogenético Métodos que utilizan directamente el AMS Máxima parsimonia Máxima probabilidad Métodos para construir árboles filogenéticos

  12. Criterios óptimos: Distancias, longitud de las ramas, etc. Algoritmos: UPGMA, neighbour-joining, F-M, etc. Etapas en la construcción de árboles filogenéticos

  13. Para construir el árbol filogenético, en vez de cuantificar el grado de similitud, se cuantifican las diferencias, es decir, el número de posiciones que presentan un nucleótido o un aminoácido distinto. Es preferible ignorar los indels porque no existe un sistema de puntuación fiable para ellos. Métodos basados en la distancia evolutiva

  14. Cálculo de las distancias evolutivas

  15. Cambios producidos entre dos secuencias

  16. Un nucleótido se convierte en otro en un único paso. Para que un aminoácido se convierta en otro, se necesitan uno, dos o tres pasos, según el número de bases del codón que deban cambiar. En la Tabla se indica el número mínimo de cambios que se necesitan. Matriz de distancias evolutivas

  17. Distancia-p (Distancia de Hamming)

  18. La distancia evolutiva entre dos secuencias alineadas se puede calcular mediante la expresión: D = número de posiciones que contienen residuos distintos L = número total de posiciones alineadas (excluyendo indels) p también puede considerarse como la probabilidad de que se produzca una mutación en una determinada posición Este método es impreciso: Cuando la tasa de mutación es baja o el periodo evolutivo es corto, se observan pocos cambios y hay una elevada variabilidad estadística entre las secuencias. Cuando el periodo evolutivo es largo, muchos sitios habrán mutado más de una vez, con lo cual se está subestimando el número real de mutaciones que han tenido lugar, que es lo que queremos calcular. Además, no todas las especies (ni todos los genes de una misma especie) evolucionan a la misma velocidad, pues se encuentran sometidos a diversas presiones evolutivas a lo largo del tiempo. Distancia-p

  19. Se considera que: La tasa de mutación es uniforme (r) para cada posición y por unidad de tiempo. Por tanto, al cabo de un tiempo t, el promedio de mutaciones en cada posición es rt. En cada posición, la probabilidad de que se produzcan n mutaciones se ajusta a una distribución de Poisson. Consideremos dos secuencias que divergieron hace un tiempo t. Como han evolucionado de forma independiente, en cada secuencia se habrán producido rt mutaciones y, por tanto, la distancia evolutiva (d) entre ellas será de 2rt. En cada una de ellas, la probabilidad de que se hayan producido n cambios en una posición determinada es, según la distribución de Poisson,  Corrección de Poisson (1)

  20. La probabilidad de que no se hayan producido cambios en una misma posición de las dos secuencias es: donde p es la distancia p (D/L). A partir de la expresión anterior se obtiene que: Corrección de Poisson (2)

  21. Se considera que: La tasa de mutación varía en función de la posición en la secuencia (lo que parece ser cierto en el caso de secuencias funcionales o que codifican proteínas). El parámetro a determina la variación. En el caso de secuencias de proteínas se ha estimado que el valor del parámetro a puede variar entre 0,2 y 3,5. Cuanto más elevado sea el valor de a, más se acerca al caso en que la tasa de mutación es constante. Corrección Gamma (G)

  22. Se considera que: Todas las posiciones se comportan de forma independiente, con la misma tasa de mutación. Todas las sustituciones de nucleótidos se producen con la misma velocidad por unidad de tiempo. Todas las bases están presentes en igual proporción. Jukes – Cantor (JC)

  23. Se considera que: Todas las posiciones se comportan de forma independiente, pero con distinta tasa de mutación. Todas las bases están presentes en igual proporción. Jukes – Cantor (JC) corregido por Gamma

  24. Se considera que: Las transiciones y las transversiones tienen lugar con distinta probabilidad. Todas las bases están presentes en igual proporción. P = fracción de sitios alineados que presenta una transición Q = fracción de sitios alineados que presenta una transversión P + Q = distancia p Kimura (K2P)

  25. ¿Qué método utilizo para calcular distancias?

  26. En un árbol, si las distancias son aditivas, también son ultramétricas, pero lo contrario no siempre se cumple: en un árbol, las distancias pueden ser ultramétricas pero no aditivas (porque no todas las OTU tienen por qué haber evolucionado a la misma velocidad). Distancias aditivas y distancias ultramétricas

  27. Unweighted pair group method using arithmetic averages

  28. UPGMA

  29. Unweighted pair group method using arithmetic averages Algoritmo de UPGMA

  30. Cálculo de las distancias

  31. Métodos para representar las distancias entre las secuencias Matriz de distancias Método gráfico menor distancia 1.- Calcular las distancias entre los taxa

  32. La menor distancia es dAB. A y B se agrupan. Las dos ramas tienen igual longitud (dAB/2), de modo que su suma sea dAB (el árbol es aditivo). 1 y 2 se agrupan. Se crea un nuevo nodo (6) 2.- Identificar los grupos menos separados

  33. A y B están agrupadas (AB). Se calcula la distancia entre (AB) y las secuencias C y D. Ahora la menor distancia es d(AB)C. Ahora, la menor distancia es d45. Se agrupan para formar (4,5) y se crea el nodo 7. 3.- Recalcular las distancias

  34. Ahora, tenemos dos grupos distintos: (1,2) y (4,5). (AB) se agrupa con C y forman (ABC). El nuevo nodo se coloca a una longitud d(AB)C/2 de los nodos terminales. 4.- Agrupar los menos separados

  35. Ahora, la menor distancia es d(45)3. Se agrupa (4,5) con 3 para formar (3,4,5). Por último, se agrupa (ABC) con D. El nuevo nodo se coloca a una longitud d(ABC)D/2 de los nodos terminales. 5.- Recalcular las distancias

  36. Por último, se agrupa (3,4,5) con (1,2). Se crea el nodo 9, que es la raíz del árbol de la cual descienden todos los taxa 6.- Agrupar los menos separados

  37. * Es un método rápido y sencillo * Genera un único árbol con raíz, ultramétrico * Es adecuado si se cumple la “molecular clock hypothesis” * Se puede aplicar a un gran número de taxa * Si no se cumple la premisa de una velocidad constante de mutación, se pueden generar topologías incorrectas. Esto se puede corregir mediante la introducción de un taxón externo (outgroup) que no está relacionado con los demás taxa y que permite corregir las distintas tasas de evolución. Se usa poco, principalmente con fines educativos. Ventajas e inconvenientes

  38. Science 155(760):279-284 (1967)

  39. El método de Fitch – Margoliash

  40. Fitch – Margoliash (1)

  41. a = 10 c = 29 b = 12 Fitch – Margoliash (2)

  42. B b2 b1 A b3 C Fitch – Margoliash (3)

  43. Fitch – Margoliash (3)

  44. D d (ABC) m e E Fitch – Margoliash (4)

  45. C c = 9 (DE) g = 10 h = 21 (AB) Fitch – Margoliash (5)

  46. * Es un método rápido y sencillo * Genera un único árbol sin raíz, aditivo * No asume la hipótesis del “molecular clock”. * Se puede aplicar a un gran número de taxa * Depende del método utilizado para calcular las distancias: van bien si las distancias son pequeñas y las secuencias largas. Si las secuencias son cortas, el cálculo de las distancias puede incluir errores estadísticos apreciables. Ventajas e inconvenientes

  47. Mol. Biol. Evol. 4 (4):406-425 (1987)

  48. The Neighbor – Joining method (1)

More Related