1 / 31

Montagem e análise de genomas Janaina O. Melo

UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática. Montagem e análise de genomas Janaina O. Melo. Sequenciamento de genomas. Genoma: conjunto de toda informação hereditária de um organismo codificada no DNA (ou RNA, em alguns vírus). Inclui tanto genes como seqüências não codificantes

aulii
Download Presentation

Montagem e análise de genomas Janaina O. Melo

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática Montagem e análise de genomas Janaina O. Melo

  2. Sequenciamento de genomas • Genoma: conjunto de toda informação hereditária de um organismo codificada no DNA (ou RNA, em alguns vírus). Inclui tanto genes como seqüências não codificantes • Sequenciamento de genomas: • geralmente feito utilizando a estratégia de shotgun • Montagem “in silico’’ das seqüências • Identificação de genes, ORFs, análises filogenéticas, etc • Construção de bibliotecas genômicas: • Vetores que propagam grandes insertos, como BACs, por exemplo • Esses insertos precisam ser fragmentados, pois os métodos de sequenciamento geram leituras de aproximadamente 500-800 pb.

  3. Fragmentação Inserção em vetores de alta capacidade Cosmídeo, BAC, plasmídeo, etc. Nova fragmentação actgactgactgactgactgactactgactgactgactgactgactactgactgactgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact Clonagem em plasmídeos e sequenciamento C A A T T G G G Montagem dos contigs plasmídeo genoma

  4. Cluster 1 Cluster 2 Cluster 3 Montagem de “contigs” de seqüências (clusters) :

  5. Estratégias de bioinformática para montagem (assembly) dos contigs • VNTI ContigExpress (http://www.invitrogen.com/content.cfm?pageid=10209) • TIGR • DNAMAN • SeqMan • CAP3 - Web Contig Assembly Program (http://pbil.univ-lyon1.fr/cap3.php) • Phred/Phrap/Consed

  6. CAP3 - Web Contig Assembly Program • Copiar as seqüências em formato fasta para o programa CAP3 • CAP3: visualizar os contigs e as seqüências únicas, ver detalhes dos contigs e obter suas seqüências • Pode-se fazer uma busca no banco de dados utilizando o BLAST

  7. Phred/Phrap/Consed Pacote de programas para: • Leitura de cromatogramas • Atribuição de qualidade a cada base • Mascaramento de vetores • Montagem de seqüências • Visualização e edição dos contigs

  8. Phred: Programa que lê os arquivos dos cromatogramas, atribui uma base a cada pico e valores de qualidade às bases. A qualidade Phred corresponde a um inteiro entre 0 e 99 e está associada à probabilidade de erro de leitura. Uma base com qualidade 40 indica que o erro é 10-4, ou seja 1 erro a cada 10.000 bases. Desse modo, quanto maior o Phred maior a qualidade do sequenciamento.

  9. Phrap: É um programa para montagem das seqüências. • Gera várias informações sobre os contigs, contidas em path/edit_dir: phrap.out, *.ace and *.screen.contigs.qual files • Uma quantidade enorme de seqüências podem ser manipuladas • Gera dados importantes e permite a visualização gráfica por outros programas.

  10. Consed: Programa para visualização e edição dos alinhamentos produzidos pelo Phrap.

  11. Abrir o consed

  12. Abrir os contigs

  13. Pesquisar seqüências específicas

  14. Selecionar um contig (não há diferença entre letras maiúsculas e minúsculas na busca)

  15. Menu Navigate: • Regiões de baixa qualidade • Discrepância na qualidade das seqüências • Regiões cobertas por somente uma fita • Pesquisa por ORFs

  16. Percorrer o alinhamento

  17. Regiões de baixa qualidade

  18. Busca por ORFs

  19. Menu Misc: Tradução da seqüência consenso em aminoácidos

  20. Qualidade de uma base

  21. Verificação da qualidade da base

  22. Visualizar o cromatograma e editar as bases

  23. Obter informação do contig

  24. Busca de ORFs na sequência • ORF Finder: http://bioinformatics.org/sms/orf_find.html • GENSCAN: http://genes.mit.edu/GENSCAN.html

  25. Obrigada!

More Related