1 / 38

Počítačová část

Počítačová část. 1. Databáze na internetu: (Databáze, navržení primerů) 2. Fylogenetická analýza. Kde se dozvědět více?. Kurz Computational Genomics (Marc VanRanst) Bioinformatics bookmarks (http://www.kuleuven.ac.be/rega/mvr/bioinformatics.htm)

sophie
Download Presentation

Počítačová část

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Počítačová část 1. Databáze na internetu: (Databáze, navržení primerů) 2. Fylogenetická analýza

  2. Kde se dozvědět více? • Kurz Computational Genomics(Marc VanRanst)Bioinformatics bookmarks(http://www.kuleuven.ac.be/rega/mvr/bioinformatics.htm) • Úvod do bioinformatiky/Základy bioinformatiky(F. Cvrčková) • Molekulární ekologie(letní semestr, populační genetika, analýza paternity)

  3. Kde najdu adresy stránek z tohoto praktika? http://web.natur.cuni.cz/zoologie/biodiversity/ (http://www.natur.cuni.cz/~muncling)

  4. DATABÁZE PROGRAMY Primární databáze DNA sekvencí GenBank (Amerika) EMBL (Evropa) DDBJ (Japonsko) BLASTNa stránkách NCBI, Ensembl BLATNa stránkách USCS Primer3 – navrhování primerů In Silico PCR RepeatMasker Databáze genů Entrez GeneRefSeq Databáze genových expresních dat UniGeneGEO Důležité odkazy NCBI - http://www.ncbi.nlm.nih.gov/tam najdu skoro vše: GenBank, Entrez Gene, UniGene, MapViewer, BLAST… ENSEMBL - http://www.ensembl.org/Genome Browser, BLAST USCS – http://genome.ucsc.edu/Genome Browser, BLAT, In Silico PCR Databáze genomů NCBIEnsemblUCSC Genome Browser

  5. Formáty sekvencí • Fasta • GenBank • NEXUS • Phylip

  6. FASTA >gi|gi-number|gb|accession|locus – description GATCCTCCATATACAACGGTATCTCCACCTCAGGTTTAGATCTCAACAACGGAACCATTGCCGACATGAGACAGTTAGGTATCGTCGAGAGTTACAAGCTAAAACGAGCAGTAGTCAGCTCTGCATCTGAAGCCGCTGAAGTTCTACTAAGGGTGGATAACATCATCCGTGCAAGACCAAGAACCGCCAATAGACAACATATGTAACATATTTAGGATATACCTCGAAAATAATAAACCGCCACACTGTCATTATTATAATTAGAAACAGAACGCAAAAATTATCCACTATATAATTCAAAGACGCGAAAAAAAAAGAACAACGCGTCATAGAACTTTTGGCAATTCGCGTCACAAATAAATTTTGGCAACTTATGTTTCCTCTTCGAGCAGTACTCGAGCCCTGTCTCAAGAATGTAATAATACCCATCGTAGGTATGGTTAAAGATAGCATCTCCACAACCTCAAAGCTCCTTGCCGAGAGTCGCCCTCCTTTGTCGAGTAATTTTCACTTTTCATATGAGAACTTATTTTCTTATTCTTTACTCTCACATCCTGTAG

  7. GenBank • Obsahuje velmi podrobnou informaci o sekvenci:

  8. Sekvence v genetické bance Jsou známy nějaké sekvence mamuta (nejlépe cytochrom b)? Z jakého druhu mamuta jsou známé sekvence? Sekvence si chci stáhnout a porovnat Využijeme: 1. genetickou banku na stránkách NCBI(National Centre for Biotechnology Information)http://www.ncbi.nlm.nih.gov/ 2. EMBL-EBI tools nebo volně dostupný program BioEdit http://www.ebi.ac.uk/ http://www.mbio.ncsu.edu/BioEdit/bioedit.html

  9. Alignment • Přiřazení dvou i více sekvencí Sekvence se liší Sekvence si navzájem odpovídají Sekvence chybí

  10. Pairwise Alignment (2 sekvence) • Globální: • Zhruba stejně dlouhé sekvence • Snaží se přiřadit od začátku až do konce sekvence • Lokální: • Jen nejlépe shodující se místa obou sekvencí • Sekvence různě dlouhé Např. BioEdit http://www.ebi.ac.uk/ http://www.bioinformatics.org/sms2/index.html http://en.wikipedia.org/wiki/Sequence_alignment

  11. Multiple Alignment • Více sekvencí • Hledá konzervativní místa • ClustalW Např. BioEdit, http://www.ebi.ac.uk/, http://www.bioinformatics.org/ sms2/index.html http://en.wikipedia.org/wiki/Multiple_sequence_alignment

  12. Příklad • Zkuste provést alignment stažených sekvencí mamutů • V programu BioEdit lze použít možnost:Accessory Applications – ClustalW Multiple Alignment

  13. Čemu je tato sekvence podobná? BLAST Basic Local Alignment SearchTool =========================================== • Hledá lokální (částečné) podobnosti • Na rozdíl od klasického alignmentu, umožňuje velmi rychle a efektivně prohledávat velké databáze

  14. Úloha • Vyhledejte sekvence nejpodobnější cytochromu b mamuta • Použijeme BLAST na stránkách NCBI - http://www.ncbi.nlm.nih.gov/

  15. BLAST - Úloha ze života • Sekvenuji mamuty • Jedna ze sekvencí se mi nějak nezdáctagccatgc actactcacc agacgcctca accgcctttt catcaatcgc ccacatcact cgagacgtaa attatggctg aatcatccgc taccttcacg ccaatggcgc ctcaatattc tttatctgcc tcttcctaca catcgggcga ggcctatatt acggatcatt tctctactca gaaacctgaa acatcggcat tatcctcctg cttgcaacta tagcaacagc cttcataggc tatgtcctcc cgtgaggaca aatatcattc tga • V laboratoři se pracuje i s jinými zvířaty • Chci zjistit, kdo mi zkontaminoval vzorky

  16. Navržení vlastních primerů pro PCR

  17. RepeatMasker http://www.repeatmasker.org/ • Umožní vyhledat a „zakrýt“ oblasti, které jsou v genomu ve větším počtu (mikrosatelity, retrotranspozony a transpozony) • Umožní nám to při navrhování primerů se vyvarovat nespecifickým amplifikacím při PCR • Pouze ale organismy, které jsou již osekvenovány

  18. Zamaskovaná sekvence • Pomocí N nebo použitím malých písmen (většina programů určených pro analýzu sekvencí s nimi umí pracovat) >MusY.1 ACACTTTTTCTTTTGCATAATGCTGTGTGGAGATTTTGCAGACAGCATTGCTGTAAAATGCAGAGTAATTTCTGTAATGAGCTTGTGAAATATTGACTATTATGGCCCTCTCTAAGCATGGCTTTAATTATATTCTAGCACAGCAGCTTCTCTGGGGATACTCAGGTCAGATCACTGACTGAATGTTGTGTTCATTTGAAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCATTTGTTGGTGTGCTGAATTCTGTTTTGTTTTGCTTTTAACCTAACTAGCTAGAAATTCTGTCAATCTTTTTTCCTTCCTAGAAAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGAAACACAGGCTTT

  19. Primer3, Primer3Plus http://primer3.sourceforge.net/

  20. TGCG{CGCTAAGA<CTCCT>AA[CACACACACA]CGGAATTAGGGAAC}TT Excluded Region Target Included Region

  21. Rozestup primerů => délka amplifikované oblasti Koncentrace Mg2+ Koncentrace dNTPs Maskování repeatů

  22. Elektronická PCR • Vezme dvojici primerů a zkouší, zda-li by PCR ve známém genomu amplifikovala pouze námi požadovanou oblast nebo i jiné oblasti • Server UCSC (http://www.genome.ucsc.edu/) • Lze i na NCBI

  23. Úloha: • Zjistěte zda-li se nachází v sekvencích mikrosatelity • Zamaskujte je pomocí Repeatmaskeru • Navrhněte kolem nich primery v Primer3 • Zjistěte, které z těchto primerů jsou dále použitelné pomocí e-PCR

  24. Samostatná úloha • Stáhnout sekvenci cytochromu b alky velké(Pinguinus impennis), tak aby před začátkem i koncem sekvence cyt b byly dostatečně dlouhé oblasti na navrhnutí primerů • Navrhnout primery na vybranou část sekvence • Vyhledat podobné sekvence přes BLAST nebo prověřit příbuzné druhy • Udělat alignment sekvencí sekvencí cytochromu b

  25. Celogenomová data • Několik serverů skladujících celogenomická data: http://genome.ucsc.edu/ http://www.ensembl.org/ http://www.ncbi.nlm.nih.gov/

  26. Celogenomová data

  27. Pozice genů v genomu • Cytogenetická mapa (podle proužkování) • Genetická mapa (cM) • Fyzická mapa (bp, Mb) • pozice na chromosomu podle párů bazí • začátek chromosomu na centromeře – posice 1 (myš) • např. gen SRY chrY:1,918,381-1,919,568

  28. Prohlížeče: Ensembl

  29. Prohlížeče: Ensembl

  30. BioMart (Ensembl) • Efektivní získávání dat z celogenomových databází • Pracuje na principu filtru – lze nastavit parametry výběru • Výstup lze uložit jako .txt, .csv nebo .xls soubor

  31. BioMart (Ensembl)

  32. BioMart (Ensembl) Výběr kritérií Požadovaná data ve výstupu Propojení s daty z jiných organismů (pokročilé)

  33. BioMart: Příklad 1 • Pomocí laboratorního křížení se podařilo identifikovat oblast na chromosomu 17 (15 – 20 Mb) zodpovědnou za poruchu meiósy během spermatogenese. Najděte některé kandidátní gen. • Postup – použít filtr: • „Region“: chr7:15000000-2000000 • „Gene Ontology“: „meiosis“

  34. BioMart: Příklad 1 Kritéria výběru Co ve výstupu

  35. BioMart: Příklad 2 • Připravte multiple alignment sekvencí myších proteinů z rodiny tzv. Major Urinary Proteins (MUPs).

  36. BioMart: Příklad 2 • Postup: • ID rodiny MUPs (na Ensemblu) • BioMart: • Filtr => „Protein Domains“ => výběr rodiny (zadat ID rodiny) • Výstup => „Sequences“ => „Protein“ => „Results“ • Multiple Alignment (ClustalW – nejlépe EBI)

  37. BioMart: Příklad 3 • Koncová část chromosomu 1 (197-198 Mb) v lidském genomu byla asociována s velikostí mozku. Najděte kandidátní gen (předpoklad: gen ležící v této oblasti byl klíčový v evoluci člověka a sekvence tedy prošla velmi rychlou evolucí).

More Related