1 / 99

Marcadores moleculares: más allá de la reconstrucción filogenética

Laboratorio de BioSistemas del Departamento de Ingeniería Genética del CINVESTAV Unidad Irapuato. Marcadores moleculares: más allá de la reconstrucción filogenética. AAAAAAAAAAAAAAA CCCCCCCCCCCCCCCCCC GGGGGGGGGGGGGGGG TTTTTTTTTTTTTTTT. Dra. Amanda Castillo Cobián

primo
Download Presentation

Marcadores moleculares: más allá de la reconstrucción filogenética

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Laboratorio de BioSistemas del Departamento de Ingeniería Genética del CINVESTAV Unidad Irapuato Marcadores moleculares: más allá de la reconstrucción filogenética AAAAAAAAAAAAAAA CCCCCCCCCCCCCCCCCC GGGGGGGGGGGGGGGG TTTTTTTTTTTTTTTT Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN

  2. Objetivos 1) Dar a conocer los fundamentos teórico-prácticos de las técnicas más comúnmente utilizadas en el estudio de evolución molecular. Desde la selección de un buen marcador hasta la fechación molecular, pasando por la reconstrucción filogenética como fundamento de todos los estudios en biología evolutiva moderna. 2) Demostrar el tipo de preguntas que pueden resolverse mediante los estudios de evolución molecular y el alcance que pueden tener. 3) Que los participantes adquieran un panorama general sobre los análisis estadísticos y el software disponible para el análisis de datos moleculares. 4) Demostrar el impacto que los estudios evolutivos pueden tener en trabajos aplicados y como han creado un puente de análisis para entender los procesos macro y microevolutivos.

  3. “ DNA: that registry of chance, that tone-deaf conservatory where the noise is preserved with the music” -Jaques Monod Procesos estocásticos Procesos demográficos Historia

  4. Análisis de datos moleculares • * Proteínas • *DNA • Puede cubrir varios aspectos como : • Estudios a nivel genética de poblaciones • (estructura de poblaciones naturales) • Estudios de selección natural • (Adaptación molecular) • Cálculos de tiempos de divergencia • (Relojes moleculares)

  5. A partir de la teoría Darwin-Wallace: • Se generaron dos campos de estudio: • la historia evolutiva de los organismos • elucidación de las fuerzas evolutivas • que moldean la biodiversidad y sus adaptaciones Wallace Darwin

  6. La representación de relaciones evolutivas…… es ancestral…...

  7. Evolución = Cambio "Evolution is the idea that all existing animals and plants are descended from some one ancestor many millions of years ago or at least a small number of ancestors many millions of years ago” John Maynard Smith

  8. Darwin defined evolution as "descent with modification" and the word 'descent' refers to the way evolutionary modification takes place in a series of populations that are descended from one another.

  9. Fuerzas Evolutivas Selección Natural Mutación Deriva Génica Migración Endogamia

  10. Tasa ¿ Porqué es importante la reconstrucción de las relaciones de ancestría-descendencia/ reconstruir la filogenia de los organismos?

  11. FILOGENIA Hipótesis estadística de relaciones evolutivas Nos habla no sólo de las relaciones sino del proceso…..

  12. Reconstrucción filogenética Metodología que seguimos para estimar relaciones evolutivas… Mirada al pasado…….

  13. HOMOLOGÍA: • Relación entre dos especies que han descendido a partir • de un origen en común, comparten un mismo ancestro, divergencia • evolutiva. • ANALOGÍA: • Relación entre características comúnes, pero no a partir de un • ancestro común, no de origen, relación convergente. • Datos curiosos: • La homología no es una cantidad, se es o no homólogo, no hay tal • cosa como un porcentaje de homología. • 2) Se dice que dos secuencias poseen un 95% de SIMILITUD!!!!! • o identidad. • 3) Sólo podemos hacer reconstrucción filogenética con caracteres • homólogos!!!

  14. Las relaciones entre los genes homólogos pueden ser del tipo: • Ortólogos – relacionados a un evento de especiación. • Parálogos – relacionados a un evento de duplicación génica. • Xenólogos – producto de un evento de transferencia horizontal.

  15. Se pueden obtener distintos arboles filogenéticos donde las relaciones descritas entre las especies sean: monofiléticas, polifiléticas o parafiléticas.

  16. Monofilético Polifilético

  17. Un árbol filogenético es un diagrama compuesto por nodos y ramas. nodo terminal nodo interno A B C D E (OTU) Rama Enraizado Por lo tanto un árbol filogenético es una hipótesis de relaciones evolutivas. Posee dos componentes: tasa y tiempo (la que se acerca más a la descripción real de tiempo evolutivo)

  18. Árbol de especies Árboles de especies: contiene un representativo de cada especie, los nodos se refieren a eventos de especiación.

  19. Árboles de genes (genealogías):representan la historia de un gen en particular, los nodos pueden ser relacionados con eventos de especiación o de duplicación génica. Árbol de genes

  20. * Los árboles se construyen en base a las similitudes entre los distintos OTUs (Unidades taxonómicas). * Estas diferencias o similitudes son cuantificadas con diferentes métodos para generar la topología del árbol basado en las distancias existentes en los organismos. * En las filogenias moleculares la base de la comparación son sustituciones en nucleótidos cuando se trata de DNA o amino ácidos para las proteínas.

  21. Ser o no ser un marcador molecular……. Ese es el dilema……. O mejor dicho….. ¿Qué es un marcador molecular?

  22. Un marcador molecular es un indicador de la historia evolutiva, es lo que vamos a analizar para poder dilucidar historia, así como, diferentes procesos evolutivos. Posee información genética y/o fenotípica y sobre todo estadística acerca del proceso evolutivo. • Marcadores moleculares utilizados para análisis filogenético: • RFLP´S. • Fingerprints genómicos (AFLP´s, RAPDS, SNP´s,). • Análisis de enzimas multilocus. • Secuencias DNA y proteínas.

  23. Características ideales de un marcador molecular: • Suficiente información (estadísticamente hablando) • +/- de 500 pb • 2) Que posea resolución (dependerá del nivel taxonómico) • 3) Que nos relate la historia de la especie (ortólogos, • dependiendo del tipo de estudio).

  24. Los marcadores moleculares, al ser marcadores del proceso evolutivo, • poseen restricciones de diversos tipos: • Sitios catalíticos (función) • Exones • Intrones • Secuencias reguladoras • Estructura • Posiciones • Pseudogenes • Diferencias en tasas de sustitución (cambio)

  25. Un árbol filogenético es un diagrama compuesto por nodos y ramas. nodo terminal nodo interno A B C D E (OTU) Rama Enraizado Por lo tanto un árbol filogenético es una hipótesis de relaciones evolutivas. Posee dos componentes: tasa y tiempo (la que se acerca más a la descripción real de tiempo evolutivo)

  26. Topología con longitudes de ramas (aditiva) Clados resueltos politomía

  27. La reconstrucción filogenética requiere de la estimación • de las relaciones evolutivas, y dependiendo del método • de reconstrucción se tendrá también la estimación de • la diferencia o divergencia genética. • Se estima: • Topología • Distancia genética • Mediante el uso de algoritmos o métodos de optimización. • (NJ/UPGMA)(Parsimonia/Verosimilitud) 1) Los algoritmos hacen estimación de topología y distancia, al mismo tiempo. Por lo mismo son muy rápidos. 2) Los métodos basados en un criterio de optimización, hacen una separación y escogen en un espacio de óptimos los mejores, para posteriormente describir el proceso evolutivo como un espacio de probabilidades. Por lo mismo son computacionalmente intensivos y lentos.

  28. Pero, ¿cómo se determina la homología en los caracteres moleculares? • * Alineación de secuencias (aa ó nucleótidos) • -Cada sitio es un caracter con origen compartido (homólogo). • Equivale a una característica morfológica. • Estadísticamente es más robusto. • Para mantener la correspondencia en • sitios homólogos es necesario la • introducción de ‘gaps’. • Indeles • Gaps e indeles NO se introducen de • manera aleatoria. • No interrumpen el marco de • lectura y respetan estructura (loops)

  29. Existen diversos programas que realizan alineaciones de secuencias: • ClustalW (y sus variaciones) • Muscle • T-Coffe Estos programas realizan una alineación global, es decir, fuerzan el alineamiento de las secuencias en su longitud total.

  30. Otros algoritmos de alineación: • FASTA • BLAST • Son programas de alineación local sólo buscan segmentos con • la puntuación más alta. • (por ejemplo, localizan dominios de proteínas)

  31. A mayor distancia genética es mayor la acumulación de mutaciones. Dependiendo del tiempo de acumulación de estos cambios puede llegar a ser muy difícil o imposible la alineación en algunas regiones de las secuencias. (Saturación) Las regiones que no son alineables o de homología dudosa deben de ser excluidas de cualquier análisis filogenético, pues meten ruido y generan hipótesis de relaciones falsas.

  32. Para los métodos que utilizan un CO, es necesario el desarrollo de un modelo de sustitución (nucleótidos, aa o codones). Estos modelos son aproximaciones a los procesos naturales de sustitución en el tiempo. Debido a que los métodos con CO ajustan los datos observados a un determinado modelo de sustitución y de acuerdo a esto modelan las diferentes topologías y les brindan un soporte estadístico, es de suma importancia la determinación del modelo de sustitución que más se ajuste a los datos. Los modelos de sustitución describen las probabilidades de cambio ya sea de un nucleótido por otro (A-G, A-C), de un aa por otro Ala-Try, de un codon por otro AGT-GGG, por ejemplo.

  33. La reconstrucción filogenética requiere de estimaciones de: • Topología • Proceso evolutivo (requiere de un modelo de sustitución o cambio) • Estos modelos de sustitución nos describen las probabilidades en que • se dan las sustituciones. • 4) Los métodos que determinan una distancia genética o usan un criterio • de optimización ocupan un modelo explícito de sustitución. • 5) Los métodos de distancia estiman un parámetro (Número de sust. por sitio) • 6) Los métodos con criterio de optimización estiman el valor de cada uno • de los parámetros del modelo dada una topología y un grupo de datos. • 7) Es necesario usar una prueba estadística para seleccionar el modelo de • sustitución que posea un mayor ajuste a nuestros datos.

  34. Modelos de sustitución A <=> G T <=> C

  35. Existen dos aproximaciones para la construcción de modelos • de sustitución: • Modelos empíricos = Calculados a partir de la comparación de • numerosas alineaciones y que resultan en valores fijos de los • parámetros de sustitución. Se utilizan principalmente para AA´s. • (Matrices Dayhoff, BLOSUM,etc) • 2) Modelos paramétricos = Se basan en el modelado de ciertas • propiedades químicas (AA´s) o composicionales, inferidos a partir • de cada base de datos. Se utilizan principalmente para nucleótidos • y codones (Uso diferencial de codones). • Ambos resultan en modelos de procesos Markovianos, definidos por • matrices que contienen tasas relativas de ocurrencia de todos los • tipos de sustituciones.

  36. Ambos métodos describen las tasas relativas, ocurrencia de todos los tipos de cambio en el tiempo. Se asume que esta matriz es reversible no existe dirección en el tiempo evolutivo, árboles no enraizados, el proceso puede fluir en ambas direcciones. Las sustituciones se describen como resultado de un proceso de mutación al azar, es decir, las mutaciones futuras ocurren al azar y son independientes del estado anterior, dependen únicamente del estado actual (proceso Markoviano). La probabilidad de intercambio de un carácter (mutación) por otro está modelada por una distribución de Poisson.

  37. Se manejan tres tipos de parámetros en el modelado del • proceso de sustitución: • Frecuencia (proporción de cada nucleótido en la muestra) • Tasas de cambio (transiciones, transversiones, • uso de codones) • Heterogeneidad en tasas de sustitución (entre posiciones, • regiones codificantes VS no codificantes, etc) • (Distribución gamma)

  38. Los diferentes modelos se distinguen por algunos factores básicos: • Frecuencias de nucleótidos • = Frecuencia ΠA= ΠG =ΠT= ΠC (JC69, K2P,K3P..) • ≠ Frecuencia ΠA ≠ ΠG ≠ ΠT ≠ ΠC (F81, HKY85, Tr93, GTR…) • 2) Tasas de transición VS. transversión • ti/tv ≠ 0.5 existe un sesgo en algún tipo de sustituciones • Generalmente las transiciones son mayores a las transversiones.

  39. Los diversos modelos de sustitución se distinguen por su • parametrización: • Frecuencia nucleótidos • = o ≠ • 2) Tasas de sustitución (ti/tv) • Tasa 1 Modelo Jukes-Cantor, 1969 • Tasa 2 Modelo Kimura-2, F84 • Tasa 3 Modelo TrN (2 ti, 1tv) • Tasa 6 Modelo GTR (cada sustitución su tasa)

  40. Jukes-Cantor (JC) (Jukes-Cantor, 1969) Equal base frequencies, all substitutions are equally likely. Equal base frequencies Rate matrix

  41. Jukes-Cantor (un parámetro) a A G a a a a C T a

  42. Kimura 2-parameters (K80) (Kimura, 1980) Equal base frequencies, variable transition and transversion frequencies. Equal base frequencies Rate matrix

  43. Kimura-dos parámetros a A G b b b b C T a

  44. Felsenstein (F81) (Felsenstein, 1981) Variable base frequencies, all substitutions equally likely. Variable base frequencies Rate matrix

  45. Hasegawa-Kishino-Yano (HKY85) (Hasegawa,Kishino,Yano, 1985) Variable base frequencies, variable transition and transversion frequencies. Variable base frequencies Rate matrix

  46. Tamura-Nei (TN93) (Tamura and Nei, 1993) Distinguish between two different types of transition (A<=>G) is different to (C <=> T), equal transversion frequencies. Variable base frequencies Rate matrix

  47. Kimura 3-parameter (K3P) Variable base frequencies, distinguish between two different types of transvesions (A<=>T) is different to (G <=>C), equal transition frequencies. Variable base frequencies

More Related