1 / 62

Lekciju saraksts

Nukleīnskābju un proteīnu sekvenču līdzības pamatprincipi Nukleīnskābju un proteīnu sekvenču daudzkārtējs salīdzinājums . Lekciju saraksts . Daudzkārtēja sekvenču salīdzināšana . Multiple sequence alignment (MSA) – vairāku nukleotīdu vai aminoskābju secību salīdzinājums

colton
Download Presentation

Lekciju saraksts

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Nukleīnskābju un proteīnu sekvenču līdzības pamatprincipi Nukleīnskābju un proteīnu sekvenču daudzkārtējs salīdzinājums

  2. Lekciju saraksts Mikrobioloģijas un biotehnoloģijas katedra

  3. Daudzkārtēja sekvenču salīdzināšana • Multiplesequencealignment(MSA)– vairāku nukleotīdu vai aminoskābju secību salīdzinājums • Viena no biežāk lietotajām bioinformātikas metodēm • Tiek izmantota jau pieminētajā PSI – BLAST , lai atrastu proteīnu grupu raksturojošus motīvus un attāli radniecīgas sekvences • Plaši izmanto dažādu proteīnu domēnu meklēšanā, proteīnu struktūras modelēšanā un filoģenētiskajā analīzē Mikrobioloģijas un biotehnoloģijas katedra

  4. Mikrobioloģijas un biotehnoloģijas katedra

  5. Daudzkārtēju sekvenču salīdzinājumu veidošana • Tāpat kā divu sekvenču salīdzināšanas gadījumā tiek meklēta līdzība starp nukleotīdiem vai aminoskābēm katrā salīdzinājuma pozīcijā • Daudzkārtējā sekvenču salīdzinājumā var izdalīt sekojošus etapus: 1. salīdzina savā starpā visus sekvenču pārus un izveido attālumu matricu; 2. aprēķina dendrogrammu, kas balstīta uz attālumu matricas; 3. Vienu pēc otras salīdzinājumam pievieno sekvences atbilstoši to secībai dendrogrammā sākot ar līdzīgākajām sekvencēm Mikrobioloģijas un biotehnoloģijas katedra

  6. Clustal X un Clustal W • Viena no populārākajām salīdzināšanas metodēm • Oriģinālā publikācija - Higgins and Sharp (1988) CLUSTAL: a package for performing multiple sequence alignment on a microcomputer. Gene 73,237-244 • Thompsonetal. (1994) CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positions-specific gap penalties and weight matrix choice. Nucleic Acids Research, 22:4673-4680 • Thompsonetal. (1997) The ClustalX windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Research, 24:4876-4882 • http://www.clustal.org/clustal2/ Mikrobioloģijas un biotehnoloģijas katedra

  7. Clustal X un Clustal W • Jaunākā versija - Clustal X2 • Larkin MA, Blackshields G, Brown NP, Chenna R, McGettigan PA, McWilliam H, Valentin F, Wallace IM, Wilm A, Lopez R, Thompson JD, Gibson TJ Higgins DG (2007) ClustalW and ClustalX version 2.0. Bioinformatics, doi:10.1093/bioinformatics/btm404 • Clustal W2 pieejama EBI mājas lapā http://www.ebi.ac.uk/Tools/clustalw2/ • Lekcijas piemēri sagatavoti ar Clustal X 1.83 MS Windows vidē Mikrobioloģijas un biotehnoloģijas katedra

  8. Clustal salīdzinājumu īpatnības • Ja salīdzinājumā ir daudzas radniecīgas sekvences, to relatīvā nozīme tiek samazināta, lai nezaudētu informāciju, ko nes atsevišķas attālas sekvences • Pārtraukumi sekvencēs tiek pārsvarā ienesti vietās, kur jau pārtraukumi ir • Dažādas līdzības pakāpes sekvenču salīdzinājumam izmanto dažādas aizvietojumu matricas, piemēram, līdzīgām sekvencēm BLOSUM30, bet attālākām sekvencēm BLOSUM62 Mikrobioloģijas un biotehnoloģijas katedra

  9. Clustal X2 un Clustal W2 • Clustal W ir programma, kas darbojas komandlīnijas režīmā, vai arī aiz interneta pārlūkprogrammas interfeisa, piemēram, http://www.ebi.ac.uk/Tools/clustalw2/ • Clustal X2 ir tas pats, kas Clustal W2, tikai tai ir grafiskais interfeiss dažādām operētājsistēmām, tai skaitā MS Windows • ftp://ftp.ebi.ac.uk/pub/software/clustalw2/ Mikrobioloģijas un biotehnoloģijas katedra

  10. Clustal W darbība • Ievada salīdzināmās sekvences (DNS vai aminoskābju, DNS secībām jābūt vienādā orientācijā); Failu formāti: FASTA, Clustal W ALN, GCG MSF u.c. • Norāda salīdzinājuma parametrus, rezultātu formātu un tmldz. • Veic daudzkārtēju sekvenču salīdzinājumu Mikrobioloģijas un biotehnoloģijas katedra

  11. Sekvenču failu formāti • FASTA – ieviesa tas pats W. Pearson, kurš izveidoja FASTA homoloģijas meklēšanas programmu >Nukleotīdu sekvences nosaukums ACTGACTGACTGACTG ACTGACTGACTG >Aminoskābju sekvences nosaukums MSFWLIVVPHGYM TTSSEDKRYP Mikrobioloģijas un biotehnoloģijas katedra

  12. Sekvenču failu formāti • FASTA fails var saturēt vairākas viena veida sekvences (aminoskābju vai nukleotīdu), tad to sauc par MSF (multiplesequencefile) • FASTA failiem nav noteikti failu paplašinājumi, var lietot .fas, .fasta, .fs • FASTA failā sekvences var būt dažāda garuma, vai arī vienāda garuma salīdzinātas sekvences ar atstarpēm (apzīmē ar “-”) • Sekvenču failus no GenBank var iegūt arī FASTA formātā • http://en.wikipedia.org/wiki/Fasta_format • http://blast.ncbi.nlm.nih.gov/blastcgihelp.shtml Mikrobioloģijas un biotehnoloģijas katedra

  13. Sekvenču failu formāti • NCBI GenBank formāts – tradicionālais NCBI sekvenču failu formāts. Ne visas programmas spēj to nolasīt • CLUSTAL ALN formāts – Clustal X/W sekvenču salīdzinājuma formāts • PHYLIP PHY formāts – filoģenētikas paketes sekvenču salīdzinājuma formāts Mikrobioloģijas un biotehnoloģijas katedra

  14. Mikrobioloģijas un biotehnoloģijas katedra

  15. Clustal W2 demonstrācija • Izmanto failu globins.fasta Mikrobioloģijas un biotehnoloģijas katedra

  16. Mikrobioloģijas un biotehnoloģijas katedra

  17. Clustal X2 demonstrācija • Izmanto failu globins2.fasta Mikrobioloģijas un biotehnoloģijas katedra

  18. Clustal X/W rezultāti • ALN fails – satur daudzkārtējo sekvenču salīdzinājumu Clustal formātā (var izvēlēties arī citus formātus, kas saderīgi ar citām analīzes programmām) • DND fails – dendrogramma, kas parāda sekvenču radniecību (teksta fails, bet dendrogrammu var apskatīt, piemēram, ar programmu TreeViewhttp://taxonomy.zoology.gla.ac.uk/rod/treeview.html) • Parametru fails – saglabāti sekvenču salīdzināšanas parametri, to var izmantot citu sekvenču salīdzināšanai • LOG fails – saglabāta sekvenču pāru salīdzinājumu matrica Mikrobioloģijas un biotehnoloģijas katedra

  19. Clustal X piemērs • KOG2323 – NCBI KOG datubāze • Piruvātkināze no sekvenētiem eikariotu genomiem – A. thaliana, C. elegans, D. melanogaster, H. sapiens, S. cerevisiae, S. pombe, Encephalitozooncuniculi • 32 proteīnu sekvences Mikrobioloģijas un biotehnoloģijas katedra

  20. KOG2323 Mikrobioloģijas un biotehnoloģijas katedra

  21. Mikrobioloģijas un biotehnoloģijas katedra

  22. Mikrobioloģijas un biotehnoloģijas katedra

  23. Mikrobioloģijas un biotehnoloģijas katedra

  24. Mikrobioloģijas un biotehnoloģijas katedra

  25. Sekvenču salīdzinājumu rediģēšana – JalView • Daudzkārtēju sekvenču salīdzinājumu rediģēšanas programma • Waterhouseetal. (2009)Jalview Version 2—a multiple sequence alignment editor and analysis workbench. Bioinformatics, 25:1189 • http://www.jalview.org/ Mikrobioloģijas un biotehnoloģijas katedra

  26. Mikrobioloģijas un biotehnoloģijas katedra

  27. Citas MSA programmas • T-Coffee (http://www.tcoffee.org/) (Tree based Consistency Objective Function For AlignmEntEvaluation) Notredame C, Higgins D, Heringa J (2000) T-Coffee: A novel method for multiple sequence alignments.J Mol Biol, 302: 205-217 • T-Coffee atšķirībā no Clustal tiešām izmanto visus iespējamos sekvenču pāru salīdzinājumus, kas dod priekšrocības attāli radniecīgu sekvenču salīdzināšanā Mikrobioloģijas un biotehnoloģijas katedra

  28. T-Coffee • Unix programma, ko iespējams darbināt arī MS Windows vidē izmantojot Cygwin (Linux emulators, http://www.cygwin.com/) • Vai arī internetā... http://tcoffee.vital-it.ch/cgi-bin/Tcoffee/tcoffee_cgi/index.cgi Mikrobioloģijas un biotehnoloģijas katedra

  29. Salīdzina DNS un proteīnu sekvences Salīdzina proteīnu sekvences izmantojot datus par proteīnu struktūru Salīdzina DNS un aminoskābju sekvences balstoties uz dažādu MSA programmu rezultātiem Izmanto aminoskābju sekvenču salīdzinājumu, lai iegūtu sākotnējo kodējošo DNS sekvenču salīdzinājumu Mikrobioloģijas un biotehnoloģijas katedra

  30. MSA pielietojumi • Sekvenču salīdzināšana – homoloģijas meklēšana un attālu homologu identifikācija • Sekvenču polimorfismu identifikācija – SNP un indel polimorfismu meklēšanai, allēļu frekvences noteikšanai un populāciju ģenētikas pētījumiem • Sekvenču motīvu identifikācija, piemēram, enzīmu aktīvo saitu identifikācija, DNS saistīšanās domēnu identifikācija • Filoģenētika –analīzes programmas izmanto MSA kā pamatu filoģenēzes izvērtēšanai izmantojot dažādus sekvenču evolūcijas modeļus Mikrobioloģijas un biotehnoloģijas katedra

  31. Transkripcijas faktoru saitu raksturošana izmantojot MSA • Transkripcijas faktori saistās pie specifiskām DNS sekvencēm • Salīdzinot vairākus eksperimentāli noteiktus TF saitus, var identificēt konsensus sekvences (motīvus), kurus tālāk var izmantot jaunu TF saitu meklēšanai genomā ar bioinformātikas metodēm Mikrobioloģijas un biotehnoloģijas katedra

  32. http://arep.med.harvard.edu/ecoli_matrices/dat/crp.dat http://weblogo.berkeley.edu/logo.cgi Mikrobioloģijas un biotehnoloģijas katedra

  33. Intronu – eksonu splaisingasaits Cilvēka splaisinga signālu MSA Eksonu – intronu splaisingasaits Mikrobioloģijas un biotehnoloģijas katedra

  34. MSA genomu sekvenēšanā • Genomu pilnas sekvences iegūšana no maziem sekvences gabaliņiem arī ir līdzīga MSA Mikrobioloģijas un biotehnoloģijas katedra

  35. MSA EST unigēnu veidošanā • Unigēnu rekonstruēšana no atsevišķiem cDNS sekvenču gabaliem Mikrobioloģijas un biotehnoloģijas katedra

  36. EST unigēni Mikrobioloģijas un biotehnoloģijas katedra

  37. Polymorfismu identifikācija DNS sekvencēs • Polimorfismu meklēšana parasti pamatojas uz atsevišķu DNS rajonu pārsekvenēšanu no dažādiem indivīdiem un salīdzināšanu ar references sekvenci – šim nolūkam var izmantot MSA programmas • Tālāk tomēr nepieciešamas programmas, kas analizēs sekvenču salīdzinājumus, noteiks SNP frekvences un izplatību dažādās subpopulācijās • Piemēram, DNASP programma Mikrobioloģijas un biotehnoloģijas katedra

  38. DNASP • DNASP (DNA SequencePolymorphism) ir programma DNS polimorfismu analīzei salīdzinātās sekvencēs • http://www.ub.es/dnasp/index.html • Rozas, J. and Rozas, R. 1995. DnaSP, DNA sequence polymorphism: an interactive program for estimating Population Genetics parameters from DNA sequence data. Comput. Applic. Biosci. 11: 621-625 Mikrobioloģijas un biotehnoloģijas katedra

  39. Mikrobioloģijas un biotehnoloģijas katedra

  40. Mikrobioloģijas un biotehnoloģijas katedra

  41. Filoģenēze. Klāsteru un kladistiskās metodes filoģenētisko koku rekonstruēšanā

  42. Meredithetal. (2011) Science, 334: 521 Mikrobioloģijas un biotehnoloģijas katedra

  43. Evolūcija "Nothing in Biology Makes Sense Except in the Light of Evolution“ Theodosius Dobzhansky (1973) http://www.2think.org/dobzhansky.shtml Mikrobioloģijas un biotehnoloģijas katedra

  44. Evolūcija “Praktiskais cilvēks pazīst tikai tādu attīstību kā attīstība no sēklas līdz graudam, no olas līdz vistiņai, un, ja viņam parāda skaistu izcelsmes koku no amēbas līdz cilvēkam, tad viņš gandrīz noteikti sāks ticēt, ka iekšējā, labākā nākotne ir determinēta. Un tāpēc cilvēkam vajag iebāzt degunā, ka no sasniegtā evolūcijas līmeņa var iet gan augšup, gan lejup un ka nekur nav rakstīts, ka cilvēks patlaban nav savas attīstības virsotnē un nespēj aptvert, ka zinātnes atziņas un progress tikai masificēsies un viss izvērtīsies baisā darbu dalošā termītu sistēmā.” Popers K, Lorencs K (1985) Nākotne ir atvērta Mikrobioloģijas un biotehnoloģijas katedra

  45. Evolūcija – Science2005. gada sasniegums • Science raksts par 2005. gada sasniegumiem http://www.sciencemag.org/cgi/reprint/310/5756/1878.pdf • Science video par 2005. gada sasniegumiem http://www.biocompare.com/science/btoy2005%22 Mikrobioloģijas un biotehnoloģijas katedra

  46. Filoģenēze • Filoģenēze (Phylogeny) – sugas (vai citas taksonomiskas vienības) evolucionārā vēsture Filoģenētiskās analīzes pamatā ir ideja, ka visi dzīvie organismi ir cēlušies no kopīga senča Evolucionārās attiecības starp taksonomiskajām vienībām parasti tiek attēlotas filoģenētiskā koka (dendrogrammas) veidā Mikrobioloģijas un biotehnoloģijas katedra

  47. GrayandAtkinson (2003) Nature, 426:6965 Mikrobioloģijas un biotehnoloģijas katedra

  48. Molekulārā filoģenēze • Evolūcijas kokus var veidot balstoties uz dažādām pazīmēm – morfoloģiskām, fizioloģiskām u.t.t. • Molekulārā filoģenēze tātad ir sugu (taksonomisko vienību) evolucionāro attiecību pētīšana izmantojot molekulārās sekvences Mikrobioloģijas un biotehnoloģijas katedra

  49. Mikrobioloģijas un biotehnoloģijas katedra

  50. Molekulāro sekvenču pielietojums sistemātikā • Uz 16S RNS sekvencēm balstīta sistemātika • Carl R. Woesehttp://mcb.illinois.edu/faculty/profile/1204 • Woese CR, Fox GE (1977) Phylogenetic structure of the prokaryotic domain: the primarykingdoms. PNAS 74:5088 http://plantgenetics.lu.lv/files/Episode2-SolvingThePuzzle.mp4 Mikrobioloģijas un biotehnoloģijas katedra

More Related