1 / 30

Human and mouse genomic sequences reveal extensive breakpoint reuse in mammalian evolution

Human and mouse genomic sequences reveal extensive breakpoint reuse in mammalian evolution. Pavel Pevzner – Glenn Tesler University of California, San Diego PNAS , Vol. 100, 7672-7677. Plan. Introduction. Introduction ( Abstract ).

lois-mullen
Download Presentation

Human and mouse genomic sequences reveal extensive breakpoint reuse in mammalian evolution

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Human and mouse genomic sequences reveal extensive breakpoint reuse in mammalian evolution Pavel Pevzner – Glenn Tesler University of California, San Diego PNAS, Vol. 100, 7672-7677

  2. Plan • Introduction

  3. Introduction (Abstract) • Les séquences génomiques de l'être humain et de la souris fournissent des évidences d’un plus grand nombre de réarrangements que précédemment pensée et révèlent le réemploi étendu de points de cassure des mêmes régions courtes, établis comme fragiles. • Cette agglutination révèle des limitations de la théorie de la rupture aléatoire largement acceptée depuis les années 1980s. L'analyse du réarrangement implique l'existence d'un grand nombre de très courts blocks de syntenie cachés, définis par les points de cassure localisés très près l’un de l’autre, qui étaient invisibles dans les données comparatives antérieures et ont été ignorés dans le modèle de la rupture aléatoire. • Pevzner et Tesler suggèrent un nouveau modèle d'évolution du chromosome qui postule que les génomes du mammifère sont mosaïques de régions fragiles avec haute propension aux réarrangements et régions solides avec faible propension pour les réarrangements.

  4. Plan • Introduction • Anomalies Chromosomiques

  5. Anomalies chromosomiques • On appelle anomalie chromosomique tout remaniement du nombre ou de la structure des chromosomes. • Les remaniements résultent d’un accident survenant soit au cours de la méiose, soit au cours d’une mitose. Ils peuvent impliquer un ou plusieurs chromosomes. • On reconnaît par ailleurs les anomalies dites homogènes (quand toutes les cellules portent l’anomalie) et les anomalies en mosaïque (quand une fraction seulement des cellules est anormale). • Conséquences variables: les remaniements ditséquilibrés (ni perte ni gain de matériel génétique) n’ont habituellement pas de conséquence pour le sujet porteur alors que les remaniements déséquilibrés se traduisent par des manifestations cliniques d’autant plus graves que la perte ou le gain de matériel est plus important.

  6. Anomalies du nombre • Mauvaise ségrégation des chromosomes au cours de la division cellulaire, les deux chromosomes d’une même paire migrant tous les deux vers la même cellule fille. Ces malségrégation peuvent s’observer aussi bien au cours de la mitose que de l’une des deux divisions de la méiose. Dans ce dernier cas, les gamètes formées auront deux copies d’un chromosome. • Ces remaniements sont toujours déséquilibrés mais certaines sont viables. - La plupart des anomalies des gonosomes. - Pour les autosomes, les trisomies 21,13,18, homogènes ou en mosaïque et les trisomies 8 et 9 en mosaïque.

  7. Anomalies de structure Réarrangements touchant un chromosome • Inversion paracentrique: deux cassures sur le même bras chromosomique et recollement après inversion du fragment. Pas de modification de l’indice centromérique. pericentrique: deux cassures sur le chromosome, une de chaque cote du centromère. Recollement après inversion du fragment centromérique. Modification de l’indice centromérique du chromosome le plus souvent. • Délétions: perte d’un fragment (Microdélétions: délétions de petite taille). • Duplication: présence en double exemplaire d’une région chromosomique –directe ou inversée. • Transpositions: déplacement d’un segment chromosomique d’une région à une autre d’un chromosome. Réarrangements touchant un chromosome • Translocation (réciproque): échange de matériel entre deux chromosomes non homologues après cassure sur chacun des chromosomes impliqués. • Insertion: un fragment de chromosome est inséré au sein d’un autre.

  8. Plan • Introduction • Anomalies Chromosomiques • Théorie de la rupture aléatoire

  9. Segments conservés • Segments (blocks) conservés: un segment chromosomique dont l’ordre et l’orientation des gènes sont conservés (syntenie). Ces segments sont délimités par des points de cassures. • Point (ou région) de cassure: position (ou région) de rupture entre blocks de gènes conservés. • Nadeau-Taylor (1984) identifient 180 blocks de gènes conservés entre l’homme et la souris. La longueur des segments apporte des arguments convaincants en faveur de la théorie de rupture aléatoire.

  10. Le support Approximation à une distribution statistique exponentielle de densité L étant la longueur moyenne de tous les segments. Problème En 1984 ils n’avaient pas l’information complète des génomes Random breakage model (modèle de cassures aléatoires)

  11. Nadeau-Taylor ont introduit les premières approches statistiques à l’étude de l’évolution et de la dynamique des génomes. • Avec le traitement statistique, on peut étudier les relations actuelles entre les différents génomes. Mais, pour inférer et comprendre l’histoire du réarrangement (scénario de réarrangements),des approches combinatoires sont nécessaires (Sankoff). • Pevzner et Tesler présentent une méthode qui combine l’approximation statistique et l’approximation combinatoire. Grâce à cette méthode, on obtient des données à meilleure résolution pour les séquences génomiques de l’homme et de la souris.

  12. Plan Introduction Anomalies Chromosomiques Théorie de la rupture aléatoire Génération des segments de syntenie

  13. Lessegments de syntenie • Un grand nombre de segments dits conservés (par des anciennes méthodes) se sont avérés ne pas être entièrement conservés avec les nouvelles techniques et la venue des séquences complètes des deux génomes. • Cause:des micro-réarrangements multiples (3170) dans ces segments. • Distinction entre segments conservés courts engendrés par des micro-réarrangements et ceux induits par des erreurs d’assemblage. • GRIMM-Synteny: permet de détecter des segments de syntenie: des fragments qui peuvent être reconstruit par des micro-réarrangements en segments conservés. Les segments sont construits à partir de gènes orthologues (ancres) - régions codantes et non-codantes.

  14. Résultats • 281 blocks de syntenie > 1Mb (Fig. 1a) entre l’homme et la souris (281-23 = 258 régions de cassure). Ces segments ont été reconstruit à partir de 558,678 gènes orthologues (distribution exponentielle). • 190 blocks de syntenie < 1Mb (Fig. 1b). Ces blocks sont courts et donc les points de cassures flanquants sont difficilement séparables. On estime, par analyse du rearrangement, que le nombre de reutlisation de points de cassure est au moins 190 (Nr=1.9). • La majorité des régions de cassure sont < 1Mb (Fig. 1c) avec une moyenne de 1.9 (Nr) points de cassure par région. La longueur globale des régions de cassure est de 172.5Mb (5.7%) chez l’homme et 119 Mb (4.7%) chez la souris. • n = Nb – Nc + Nr = 281-23+190 = 448 points de cassure • Réutilisation des points de cassure? La réutilisation des points de cassure ne signifie pas que les mêmes points sont réutilisés mais qu’il existe des régions restreintes (hotspots) regroupant des cassures et susceptibles aux réarrangements.

  15. a) Histogramme de la longueur des blocks de syntenie > 1Mb dans le génome humain b) Le même histogramme que a) superposé avec les 190 blocks cachés (< 1Mb), révélés après l’analyse du réarrangement c) Histogramme de la longueur des régions de cassure dans le génome humain

  16. Plan Introduction Anomalies Chromosomiques Théorie de la rupture aléatoire Génération des segments de syntenie Principe de Reconstruction et Scenarios

  17. Reconstruction • But: Reconstruire de manière parcimonieuse un génome G en G’ par une série de transformations (réarrangements). • Opérations tolérées:inversions, translocations, fissions, fusions. Pondérer les opérations? • Distance génomique: le nombre minimal de réarrangements pour transformer G en G’. Corrélation entre la distance génomique et le nombre de points de cassure. • Limitations des premières méthodes de reconstruction (Hannenhalli et Pevzner): • Les points de cassures sont considérés indépendants entre-eux mais une dépendance évidente existe entre points de cassure (ex. la dépendance des 2 points de cassure dans une inversion). • Avec l’algorithme GRIMM-Synteny, il a été estimé qu’au moins 245 réarrangements sur 281 blocks de syntenie (> 1Mb) ont eu lieu depuis la divergence entre la souris et l’homme. Donc au minimum 45 blocks de syntenie ont été réarrangés dus à la réutilisation des points de cassure.

  18. Ancres BLAST / PatternHunter / VISTA / PipMaker Anchors (ancres) : Les meilleures ressemblances locales bidirectionnelles. On suppose avoir un ensemble d’ ancres non superposés. Construction de blocks de syntenie à partir d'eux.

  19. Agroupement des ancres en grappes d’ancres (clusters of anchors) GRIMM

  20. Rectification des agroupements, pour les observer plus facilement. Il y en a 15.

  21. On réduit le nombre des agroupements a 11 en collant ceux-ci qui sont très près et avec la même orientation

  22. Pour remarquer les agroupements plus petits et tracer les graphiques suivants qui ne dépendent de la longueur des agroupements, on divise chaque agroupement pour sa longueur.

  23. Représentation en deux dimensions des réarrangements, montrant les points de cassure

  24. La même représentation omettant les blocks de syntenie

  25. Deux scénarios possibles de réarrangements parcimonieux qui transforment l’ordre des 11 blocks de syntenie du chromosome X de la souris dans l’ordre du chromosome X de l’homme. Les points de cassure sont caractérisés par des traits jaunes verticaux, et la réutilisation des points de cassure est représentée par des double traits jaunes verticaux. Les scénarios de réarrangement basés sur les 11 blocks de syntenie contiennent au moins trois réutilisations de régions de cassures.

  26. Les blocks de syntenie “cachés” • Comment détecter ces segments caches? En réduisant le seuil des détection de blocks de syntenie dans l’algorithme GRIMM-Synteny mais on est confronté à certains problèmes: • Identifier les positions exacts de ces segments rapprochés (à moins de 10 nucléotides). • Les blocks courts de syntenie échappent à la détection car la similarité entre-eux est insignifiant en relation à la taille du génome. • Les plus longs blocks de syntenie cachés peuvent contenir (ou être) des parties non-codantes et donc il est difficile de les identifier car la similarité a pu être réduite au cours de l’évolution sous l’effet de la mutation. • On peut néanmoins identifier quelques blocks courts de syntenie car ils ont un score de similarité assez élevé et ne débordent pas sur les régions adjacentes. • 111 blocks de syntenie cachés détectés et 81 gènes orthologues qui traversent des régions de cassure(spanning genes).

  27. Plan Introduction Anomalies Chromosomiques Théorie de la rupture aléatoire Génération des segments de syntenie Principe de Reconstruction et Scenarios Modèle de rupture fragile

  28. Modèle de rupture fragile (fragile breakage model) • L'analyse du réarrangement implique l'existence d'un grand nombre de très courts blocks de syntenie cachés, définis par les points de cassure localisés très près l’un de l’autre. Ces blocks étaient invisibles dans les données comparatives antérieures et ont été ignorés dans le modèle de la rupture aléatoire. • La fonction exponentielle de densité 1/L ex-a/L explique les résultats pour a =1Mb. Cependant, un modèle alternatif est nécessaire pour rendre compte de la distribution des blocks courts. • Pevzner et Tesler suggèrent un nouveau modèle d'évolution du chromosome qui postule que les génomes du mammifère sont des mosaïques de régions fragiles avec haute propension aux réarrangements et de régions solides avec faible propension pour les réarrangements.

  29. Plan Introduction Anomalies Chromosomiques Théorie de la rupture aléatoire Génération des segments de syntenie Principe de Reconstruction et Scenarios Modèle de rupture fragile Conclusion

  30. Conclusion • Il existe des hotspots ou régions fragiles dans les chromosomes qui ont une forte tendance à se réarranger au cours de l’évolution. • Pevzner et Tesler suggère que des réarrangements répétés ont réduit l’homologie dans les régions entre les segments conservés. • Est-ce que le manque d’homologie entre les segments conservés est vraiment dus à des microréarrangements? • D’autres hypothèses pour expliquer la nature des fragments courts entre les segments conservés et le manque d’homologie.

More Related