1 / 22

Alix Boc Université du Québec à Montréal Bif7002 – Séminaire de Bioinformatique

La détection des transferts latéraux de gènes : les méthodes et leur application en biolinguistique. Alix Boc Université du Québec à Montréal Bif7002 – Séminaire de Bioinformatique. BIF7002 – Séminaire de Bioinformatique Alix Boc. Sommaire.

alamea
Download Presentation

Alix Boc Université du Québec à Montréal Bif7002 – Séminaire de Bioinformatique

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. La détection des transferts latéraux de gènes : les méthodes et leur application en biolinguistique Alix Boc Université du Québec à Montréal Bif7002 – Séminaire de Bioinformatique BIF7002 – Séminaire de Bioinformatique Alix Boc

  2. Sommaire • Détection des transferts latéraux de gènes • Description • Méthode • Exemple • Application à la Biolinguistique • Références BIF7002 – Séminaire de Bioinformatique2 Alix Boc

  3. Inf7212 - Introduction aux systèmes informatiques Les arbres phylogénétiques Bif7002 - Séminaire Bioinformatique 3 Alix Boc

  4. L’arbre phylogénétique Inf7212 - Introduction aux systèmes informatiques espèces branches ancêtres virtuels racine Bif7002 - Séminaire Bioinformatique 4 Alix Boc

  5. Définitions : reconstruction d’un arbre phylogénétique • Alignement de séquences AAATGATCTGCGTCAATATTATAA GCCTGATCCTCACTACTGTCATCTTAA ATAGGGCCCGTATTTACCCTATAG AACTGGTCCACCCTTATACTAAAAGACGCCTCACTAGGAAGCTAA AACTGATCTGCTTCAATAATTTAA • ClustalW (Higgins et ali., 1994)) • DiAlign (Morgenstern, 1999) • …. • Distance • Maximum de parcimonie • Maximum de vraisemblance • Approche Bayesienne AAATGATCTGCGTCAATATTA---------------------TAA GCCTGATCCTCACTA------------------CTGTCATCTTAA ATA---------------------GGGCCCGTATTTACCCTATAG AACTGGTCCACCCTTATACTAAAAGACGCCTCACTAGGAAGCTAA AACTGATCTGCTTCAATAATT---------------------TAA Projet de thèse 5 Alix Boc

  6. Définitions : reconstruction d’un arbre phylogénétique • Application d’un modèle d’évolution (méthodes de distances) • Uncorrected Distances • Jukes Cantor • Tajima Nei • Kimura 2 parameters • Tamura • Jin-Nei Gamma • …. • Application d’une méthode de reconstruction (méthodes de distances) • Neighbor Joining • ADDTREE • Unweighted Neighbor Joining • Circular order reconstruction • Weighted Least-squares • BioNJ • …. Projet de thèse 6 Alix Boc

  7. Les modèles en réseau Bif7002 - Séminaire de Bioinformatique 7 Alix Boc

  8. Définition : Les modèles en réseau 1 2 3 4 5 Certains mécanismes d’évolution ne peuvent être représentés que par des modèles en réseau. • Le transfert horizontal de gènes (Hallett et Lagergren, 2001, Boc et Makarenkov, 2003) • L’hybridation (Huson, 1998, Bryant et Moulton, 2004) • L’homoplasie et la convergence de gènes (Legendre et Makarenkov, 2002) • La duplication et la perte de gènes (Delwiche et Palmer, 1996) BIF7002 – Séminaire de Bioinformatique8 Alix Boc

  9. Définition : Le transfert horizontal de gène BIF7002 – Séminaire de Bioinformatique9 Alix Boc

  10. Quelques méthodes pour la detection de transferts horizontaux de gène Hein (1990) and Hein et al. (1995, 1996) Haseler and Churchill (1993) Page (1994); Page and Charleston (1998) Charleston (1998) Hallet and Lagergren (2001) Mirkin, Fenner, Galperin and Koonin (2003) V’yugin, Gelfand and Lyubetsky (2003) Boc and Makarenkov (2003); Makarenkov et al. (2006) C. Than, D. Ruths, and L. Nakhleh (2008) BIF7002 – Séminaire de Bioinformatique10 Alix Boc

  11. Notre modèle Makarenkov et al. (2006) BIF7002 – Séminaire de Bioinformatique11 Alix Boc

  12. Détection des transferts complets Arbre d’espèces Arbre de gène (rbcL) Données : arbres phylogénétiques d’espèces et de gène sur le même ensemble d’espèces. Trouver : nombre minimal de déplacements de sous-arbres dans l’arbre d’espèces permettant de le transformer en l’arbre de gène (=> scénario de réconciliation). Contraintes : incorporer des règles biologiques et maintenir la complexité algorithmique polynomiale (le problème STP a été montré NP-complet par Hein et al., 1996). BIF7002 – Séminaire de Bioinformatique12 Alix Boc

  13. Exemples de règles biologiques Les transferts sur la même lignée sont interdits. Les transferts croisés sont interdits. BIF7002 – Séminaire de Bioinformatique13 Alix Boc

  14. Règles biologiques : contrainte temporelle Le transfert entre les branches (z,w) et (x,y) de l’arbre d’espèces T sera permis si et seulement si le sous-arbre regroupant les deux sous-arbres affectés et enraciné par la branche (z,b) dans T1 est présent dans l’arbre de gène. BIF7002 – Séminaire de Bioinformatique14 Alix Boc

  15. Critères d’optimisation La distance topologique de Robinson et Foulds (1981) entre deux arbres phylogénétiques est égale au nombre d’opérations élémentaires de fusion et de séparation de noeuds pour transformer un arbre en un autre. Ex : la distance de Robinson et Foulds entre les arbres T et T1 est égale à 2. Robinson et Foulds d(i,j) - distance entre i et j dans l’arbre d’espèces. (i,j) - distance entre i et j dans l’arbre de gène. Moindres carrés (Least-squares) Cette distance mesure la différence topologique entre deux tables de bipartition décrivant deux arbres et elle peut être définit comme suit  : où d(a,b) est la distance de Hamming entre les vecteurs de bipartition a et b ex: bd(T,T’)= ((2 + 1 + 2) + (2 + 1 + 1))/2 = 4.5. Distance de bipartition BIF7002 – Séminaire de Bioinformatique15 Alix Boc

  16. Transfert partiel versus transfert complet BIF7002 – Séminaire de Bioinformatique16 Alix Boc

  17. Algorithme BIF7002 – Séminaire de Bioinformatique17 Alix Boc

  18. Algorithme Begin Reconstruction of the species tree T and the gene tree T1 Reestimate the length of each branch in T While Optimization criterion > 0 loop Test all possible HGTs Compute the value of the optimization criterion Add the best HGT Reestimate the length of each branch in T Compute the value of the optimization criterion EndLoop End BIF7002 – Séminaire de Bioinformatique18 Alix Boc

  19. Algorithme : exemple L’exemple ci-dessous montre comment l’arbre d’espèces T et transformé en l’arbre de gène T1. 1 2 3 Scénario trouvé : 1 - transfert de A vers D 2 - transfert de E vers B 3 - transfert de C vers F À chaque transfert est associé la nouvelle valeur des moindres carrés, nouvelle distance de Robinson et Foulds et la nouvelle distance de bipartition. BIF7002 – Séminaire de Bioinformatique19 Alix Boc

  20. Résultat de HGT-Detection dans la version Web de T-Rex BIF7002 – Séminaire de Bioinformatique20 Alix Boc

  21. Validation Déterminer le pourcentage d’apparition de chaque THG pour plusieurs réplicats de l’arbre de gène. Les réplicats sont générés à partir des séquences. Le premier arbre de gène est la référence. … … arbre d’espèces Chaque transfert est pondéré par le nombre d’apparitions. n-1 réplicats de l’arbre de gène. n scénarios de réconciliation. BIF7002 – Séminaire de Bioinformatique21 Alix Boc

  22. RÉFÉRENCES • Boc, A. and Makarenkov, V. (2003), New Efficient Algorithm for Detection of Horizontal Gene Transfer Events, Algorithms in Bioinformatics, G. Benson and R. Page (Eds.), 3rd Workshop on Algorithms in Bioinformatics, Springer-Verlag, pp. 190-201. • Delwiche, C.F., and J. D. Palmer (1996). Rampant Horizontal Transfer and Duplication of Rubisco Genes in Eubacteria and Plastids. Mol. Biol. Evol. 13:873-882. • I. Dyen, I., Kruskal, J.B. and Black, P. (1997) Comparative IE Database Collected by Isidore Dyen, http://www.ntu.edu.au/education/langs/ielex/IE-RATE1. • Gray, R.D. and Atkinson, Q.D. (2003) Language-tree divergence times support the Anatolian theory of Indo-European origin. Nature, 426:435-439. • Levenshtein, V. I. (1966). Binary codes capable of correcting deletions, insertions, and reversals. Soviet Physics Doklady 10:707–710. • Makarenkov,V. (2001), T-Rex: reconstructing and visualizing phylogenetic trees and reticulation networks. Bioinformatics, 17, 664-668. • Makarenkov, V., Boc, A., Delwiche, C.F. and Philippe, H. (2006). New efficient algorithm for modeling partial and complete gene transfer scenarios. In V. Batagelj, H.-H. Bock, A. Ferligoj, and A. Ziberna, editors, IFCS 2006, Series: Studies in Classification, Data Analysis, and Knowledge Organization, Springer Verlag, pages 341--349. • Matte-Tailliez O., Brochier C., Forterre P. & Philippe H. (2002). Archaeal phylogeny based on ribosomal proteins. Mol. Biol. Evol. 19, 631-639. • Robinson, D.R. and Foulds L.R. (1981), Comparison of phylogenetic trees, Mathematical Biosciences 53, 131-147. • Than, C. Ruths, D. and Nakhleh, L. (2008), PhyloNet: A Software Package for Analyzing and Reconstructing Reticulate Evolutionary Relationships. BMC Bioinformatics, 9:322. • Woese, C. R., G. Olsen, M. Ibba, and D. Söll. 2000. Aminoacyl-tRNA synthetases, the genetic code, and the evolutionary process. Microbiol. Mol. Biol. Rev. 64:202-236. BIF7002 – Séminaire de Bioinformatique22 Alix Boc

More Related