1 / 35

1. L’ADN et l’information génétique

1. L’ADN et l’information génétique. l’information génétique est contenue dans l’ADN. l’ADN. (ADN). (ARN). A G T C U. traduction. l’information génétique est organisée par triplets (codons). le code génétique.

stacie
Download Presentation

1. L’ADN et l’information génétique

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 1. L’ADN et l’information génétique

  2. l’information génétique est contenue dans l’ADN l’ADN (ADN) (ARN) A G T C U

  3. traduction l’information génétique est organisée par triplets (codons)

  4. le code génétique 1 triplet= 1 codon = 3 lettres= 1 acide aminé le code génétique est dégénéré : 43 = 64 > 20 !

  5. introns : non codants exons : codants unité de l’information génétique le gène gène

  6. unité de l’information génétique le gène gène

  7. le génome organisation de l’information génétique chez la bactérie : Escherichia Coli 4938920 bps4732 gènes

  8. le génome organisation de l’information génétique • chez l’homme : • 3 milliards de pbs • ~20000 gènes • < 2 % d’ADN codant ! codant non codant séquences répétées pseudogènes

  9. le génome quantité d’ADN codant en fonction de la taille du génome

  10. ADN codant et non codant en résumé : ADN « poubelle » exons introns pourquoi autant d’ADN non codant ?peut-on en comprendre le rôle ?

  11. 2. étudier les séquences d’ADN

  12. analyse des séquences approche « déterministe » : • comparaison entre séquences / alignement de séquences : • recherche de gènes, comparaison d’espèces, de motifs répétés • recherche de caractéristiques « globales » : • rechercher des régularités, un « ordre » dans le désordre apparent… approche statistique : information mutuelle fonction de corrélation / densité spectrale de puissance techniques basées sur la « marche ADN » …

  13. A T G C double liaisonhydrogène triple liaisonhydrogène ou purinespyrimidines on peut donc étudier la variable numérique binaire n =  1 où n = positionon obtient : +1 -1 n=1 2 3 4 5 6 7 8 9 10… A T C G G T C A T A…          n= +1 +1 -1 -1 -1 +1 -1 +1 +1 +1… A G T C +1 -1 de la séquence symbolique à une séquence numérique choisir un code binaire : par exemple

  14. le signal n (ADN) signal aléatoire signal déterministe signal corrélé

  15. T  xx() 1/T Sxx( f ) 3. fonction de corrélation et densité spectrale de puissance (DSP)

  16. fonction de corrélation (t)signal aléatoire fonction du temps t, stationnaire : ici sinus + bruit jxx(t) fonction de corrélation de (t) : périodicité « cachée » / oscillations dans la corrélation

  17. fonction de corrélation mesure de la persistance (mémoire) d’un signal : Signal temporel fonction de corrélation Une mesure de la « mémoire » du signal

  18. (bruit blanc) Signal « sans mémoire » : chaque valeur est indépendante de la précédente b(t) • b(t) signal stationnaire, • b(t) = 0 (centré),  • bb() = () d’où b2 = bb() = + fonction de corrélation 

  19. moyennes temporelles fonction de corrélation de (t) ? si « ergodique » : on peut remplacer la moyenne d’ensemble par une moyenne sur le temps : chaque t0 initial considéré comme une nouvelle réalisation

  20. densité spectrale de puissance (DSP) Densité spectrale de puissance Théorème de Wiener-Khintchine : oùlimitéeàl’intérvalle[0, T] Estimateur de la DSP d’un signal réel :

  21. 1. périodicité « cachée » = T  pic à la fréquence 1/T T  f xx() 1/T Sxx( f ) 2. échelle de « mémoire » = a largeur de bande 1/a largeur de bande f   ()~ exp(- /a) exponentielle S ( f ) ~ 1/( 1+(2  af )2 )lorentzienne Fonction de corrélation et DSP

  22. 4. corrélation à longue portée dans l’ADN http://www.scholarpedia.org/article/1/f_noise

  23. corrélation à longue portée si l’échelle de mémoire est infinie (xx()n’est pas intégrable) on parle de corrélation à longue portée. Typiquement, loi de puissance :  j(t) (échelle log) pente 1/b pente 1/a t(échelle log) S(f) (échelle log) f (échelle log)

  24. le résultatsembleplutôt général… (non codant) résultat 1 : pic à f = 1/3 résultat 2 : DSP  1/f dans l’ADN (variation de la méthode :construction de 4 sous-séquences0/1 pour A, T, C, G) cytomégalovirus, 230000 pbs (codant)  f=1/3 R. F. Voss, PRL, 1992 échelle log-log : log(DSP)  - log(f)

  25. pour l’ADN codant des résultats controversés : pas de corrélation ?(Stanley group, 1992-1995) L’ADN codant est sans doute moins corrélé que le non codant…

  26. ADN : un filament hautement compacté pourquoi une mémoire étendue ? procaryotes (bactéries et archea) 4 600 000 bps  2 cm d’ADNtaille de la cellule 1 m ratio = 5 10-5

  27. fibre de chromatine DNA noyau cellulaire nucléosomes nucléosomes DNA fibre de chromatine chromatine histones boucles Goodsell pourquoi une mémoire étendue ? eucaryotes : CHROMATINE ! parties verrouilléesparties transcrites une structure fonctionnelle hautement organisée

  28. d’autres images

  29. un rôle pour les séquences non codantes la corrélation à longue portée indique la présence d’un ordre global ; les séquences non codantes montrent toujoursune corrélation à longue portée l’ADN « poubelle » participe à l’établissement d’un arrangement fonctionnel de l’ADN dans le noyau/la cellule ! et l’ADN codant ? il a aussi un autre rôle, participe peut-être enmoindre mesure…

  30. 5. en pratique

  31. signal discret fonction de corrélation de n n = 1 2 3 4 5 6 7 8 9 10 11… A T C G G T C A T A C…           n= +1 +1 -1 -1 -1 +1 -1 +1 +1 +1 -1… si <n>=0 (autrement, on soustrait la moyenne) d = distance entre 2 sites le long de la séquence moyenne « temporelle » moyenne sur n (attention à la staionnarité…)

  32.  fonction de corrélation de n en pratique : sur un ordinateur, le signal est toujours discret !z(t)  (z1,z2,z3,z4,… zN) = z pour nous, le signal est intrinsèquement discret (pas=1), car c’est la séquence. sous scilab, on peut utiliser la fonction : corr : corr(z, dmax) = fonction de corrélation de x, en fonction de la distance d, pour d = 0, 1, 2,… dmax-1 (remarque : corrsoustrait automatiquement la moyenne de z)

  33. x(t) |X(f)| t f xk tk DSP de n– 1. calculer la TF : Signal Spectre Signal échantillonné ∆t  Spectre périodique de périodeƒe= 1/∆t Transformée de Fourier Rapide : FFT fe/2 0 f -fe Signal echantillonné: xk= k tde 0 à Te = N ∆T FFT du signal : ƒn= n ƒde 0 à ƒe= N ∆ƒ

  34. DSP de n– 2. déduire la DSP : FFT = transformée de Fourier Rapide sous scilab: fft : fft(z, -1) =fft(z) = TF de zdonne TF pour f = 0, ∆f, 2∆f,… fe-1 Wiener-Khintchine : estimateur DSP = d’où |fft(z)|2 / N ≈ DSP de z sous scilab, commencer par soustraire la moyenne de z

  35. fin

More Related