1 / 41

Seqüenciamento e montagem do genoma humano e análise de transcriptoma

Seqüenciamento e montagem do genoma humano e análise de transcriptoma. Seqüenciamento do Genoma Humano. Embate: Consórcio público x Celera genomics: Consórcio público: mapeamento físico, shotgun hieráriquico. Celera genomics: whole genome shotgun

tariq
Download Presentation

Seqüenciamento e montagem do genoma humano e análise de transcriptoma

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Seqüenciamento e montagem do genoma humano e análise de transcriptoma

  2. Seqüenciamento do Genoma Humano • Embate: Consórcio público x Celera genomics: • Consórcio público: mapeamento físico, shotgun hieráriquico. • Celera genomics:whole genome shotgun • Em fevereiro de 2001 foi publicada de forma independendente versão draft ou preliminar ambos grupos.

  3. Seqüenciamento do Genoma Humano • 2003: Consórcio público apresenta versão final do seqüenciamento do genoma humano • Comprimento total: 3 bilhões pb • 99% deste total foi seqüenciado • Erro de seqüenciamento estimado em1/10.000 nt • 99.9% não apresenta diferenças entre indivíduos. • 25.000 genes • Genes codificadores de proteínas correspondem a apenas 2% do genoma • 50 % do genoma consiste de regiões repetitivas (D.melanogaster 3%, C.elegans 7%)

  4. Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) Genoma Biblioteca genômica Plasmídeo (inserto 10 kb) BAC (inserto 100 kb) Leituras ou reads Seqüenciamento das extremidades do inserto

  5. Matepairs Contig Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem AGCGTTA GTTACAAC AGCGTTACAAC

  6. Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Matepairs Contig Contig

  7. Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem BAC contendo inserto de maior comprimento Matepairs Contig Contig

  8. Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Matepairs Contig Contig Matepairs Scaffold Contig Contig

  9. Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100Kb) Fragmento cromossômico Biblioteca genômica em BAC

  10. Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100Kb) Fragmento cromossômico Biblioteca genômica em BAC

  11. Consórcio público Mapeamento físico, shotgun hierárquico - Montagem BAC Biblioteca Plasmídeo (inserto 10 kb) Leituras ou reads Seqüenciamento das extremidades do inserto

  12. Consórcio público Mapeamento físico, shotgun hierárquico - Montagem Matepairs AGCGTTA GTTACAAC AGCGTTACAAC Contig

  13. Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb)

  14. Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb)

  15. Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb)

  16. Avaliação de estratégias de seqüenciamento • Vantagens WGS • Estratégia mais simples com menos etapas. • Vantagens Shotgun Hierárquico • Menos vulnerável que a estratégia WGS em relação a montagem de regiões repetitivas.

  17. Avaliação de estratégias de seqüenciamento Repetições no genoma Processo de montagem é suscetível a erros quando empregado em genomas com alto índice de repeticões. Genoma Montagem Cenário I X X X WGS: Montagem de 3 bilhões de bases (todo genoma). Shotgun hierárquico: Montagem de 100 mil bases (inserto de cada BAC).

  18. In silico

  19. Base-calling • Geração de uma seqüência de nucleotídeos através da análise dos chromatogramas • PHRED gaattcggcacgagagttctcccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttcccgccactttgctcgcctgcgcatcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgtttttgttgtcgttgttgcagcaatagtagaggacgggcgcttttttttttgtcaagagaaagggggaggggcgtactaccgctttatcgaggttggtattatttcttatatataaagggaaagagcaacgtgaagcgggtaagggaagagtgaaagtcgag

  20. Mascaramento • Eliminar fragmentos de vetor • cross_match >5’ gctccaccgcggtggcggccgctctagaactagtggatcccccgggctgcaggaattcggcacgagagttctcccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttcccgccactttgctcgcctgcgcatcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgtttttgttgtcgttgttgca >3’ gcaatagtagaggacgggcgcttttttttttgtcaagagaaagggggaggggcgtactaccgctttatcgaggttggtattatttcttatatataaagggaaagagcaacgtgaagcgggtaagggaagagtgaaagtcgagggggggcccggtacccaattc

  21. Montagem • Produzir uma seqüência contígua através de seqüências menores que possuam regiões de sobreposição • PHRAP, Celera Assembler, Arachne leituras contig

  22. Anotação • Localizar na seqüencia genômica final: • Genes que codificam proteínas e RNAs não traduzidos (tRNA, rRNA, snRNA) • Determinar, se possível, o produto provável de cada gene encontrado. • Associar cada gene à uma categoria funcional ou via metabólica. Ex.: síntese de lipídeos, maquinaria de tradução, fosforilação oxidativa, etc.

  23. Streptococcus pneumoniae R6 Anotação

  24. Anotação Automática contig Glimmer RBSfinder GeneMark tRNAscan CDS

  25. Anotação Automática BLAST contra KEGG BLAST contra COG PSORT BLAST contra GenBank Interpro Anotação manual

  26. BLAST (Basic Local Alignment Search Tool) Bancos de seqüências COG KEGG > SEQ1 atgggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg BLAST GenBank Nucleotídeos GenBank Proteínas

  27. BLAST (Basic Local Alignment Search Tool) • Aldolase Trypanosoma cruzi • .........1.........2.........3.........4.........5.........6.........7.........8.........9.........10 • acaagctggagctcccgcggtggtcggcgctctagaactagtggatcccccgggctgcaggaattcggcacgagaacaacttcaaccgcgtctggaaggcgccacgccgcccgtttgagaaggaacgccttgaccgcgagatgaaactctgcggccagtacggccttcngttgcaacgcgtgagatttggcgccgtgaacatgacgctctccaagatgcgtcgtaccgcccgtctgttgttgacgttgccggagaaccacccgcgccggcagctggagggttccgccatcatgcgccgctgccacgactacggcttcctcgagggggggcccggtacccaattcgccctatagtgagtcgtattacannattcactggccgntcgntnntttacaacgtcgntnngactgggnannaaaccctggnnncgttacccaacttaatcgcctt BLAST it!

  28. Anotação Automática BLAST contra KEGG BLAST contra COG PSORT BLAST contra GenBank Interpro Anotação manual

  29. Interpro • Procura na seqüências por domínios, assinaturas ou motivos conhecidos. • Se utiliza de outros bancos de domínios para produzir seu relatório final. PFAM, SMART, PROSITE, etc • Aldolase Trypanosoma cruzi • .........1.........2.........3.........4.........5.........6.........7.........8.........9.........10 • acaagctggagctcccgcggtggtcggcgctctagaactagtggatcccccgggctgcaggaattcggcacgagaacaacttcaaccgcgtctggaaggcgccacgccgcccgtttgagaaggaacgccttgaccgcgagatgaaactctgcggccagtacggccttcngttgcaacgcgtgagatttggcgccgtgaacatgacgctctccaagatgcgtcgtaccgcccgtctgttgttgacgttgccggagaaccacccgcgccggcagctggagggttccgccatcatgcgccgctgccacgactacggcttcctcgagggggggcccggtacccaattcgccctatagtgagtcgtattacannattcactggccgntcgntnntttacaacgtcgntnngactgggnannaaaccctggnnncgttacccaacttaatcgcctt Interpro

  30. Anotação Automática BLAST contra KEGG BLAST contra COG PSORT BLAST contra GenBank Interpro Anotação manual

  31. Anotação Streptococcus pneumoniae R6

  32. Sabiá • System for Automated Bacterial Integrated Annotation • LNCC – Coordenação do Projeto Genoma Brasileiro • Gerenciamento de todos softwares de Base-calling, Mascaramento, Montagem e Anotação automática. • Disponibilização da Anotação automática dos resultados via Web possibilitando a realização da Anotação manual por pesquisadores distribuídos geograficamente. Exemplo Sabiá Mapa Antes Mapa Depois

  33. Análise do transcriptoma • Projetos que precedem seqüenciamento do genoma nuclear: • Identificação de novos genes. • Estimativa do perfil de expressão da linhagem celular, estágio de desenvolvimento ou tecido avaliado

  34. Transcrição e Transcriptoma EST RNA total mRNA 5’ 3’ CAP cístron Poli A

  35. Transcrição e Transcriptoma EST Poli A cDNA Poli A Poli A Poli A Vetor + cDNA

  36. Transcrição e Transcriptoma EST ~ 800 pb Sequenciamento extremidades Vetor 5’ 3’ Poli A Vetor cDNAcompleto Vetor 5’ 3’ Poli A Vetor

  37. Transcrição e Transcriptoma EST X X Remoção Sequencia de vetor (cross_match, Lucy) Vetor 5’ 3’ Poli A Vetor X Remoção Poli A (Script Perl) 5’ 3’ Poli A EST 5’ 3’

  38. Análise do transcriptoma EST – Anotação 5’ 3’ Bancos de seqüências GenBank Nucleotídeos >clone_23 5’ ggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg BLASTX E BLASTN GenBank Proteínas clone_23 5’= amastina

  39. >clone_23 5’ ggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg = amastina Análise do transcriptoma EST – Anotação Agrupamento de seqüência similares ou agrupamento via anotação

  40. Transcrição e Transcriptoma Transcriptoma de amastigotas

  41. Transcrição e Transcriptoma Transcriptoma de amastigotas

More Related