110 likes | 240 Views
Introdução à Bioinformática. Ricardo de Godoi M. Ferreira Laboratório de Epidemiologia Genética Instituto de Ciências Biomédicas Universidade de São Paulo. “Bio” o quê?. Bioinformática Biologia computacional Computação aplicada à biologia. DNA - Deoxyribonucleic acid.
E N D
Introdução à Bioinformática Ricardo de Godoi M. Ferreira Laboratório de Epidemiologia Genética Instituto de Ciências Biomédicas Universidade de São Paulo
“Bio” o quê? • Bioinformática • Biologia computacional • Computação aplicada à biologia
DNA - Deoxyribonucleic acid • Watson e Crick, 1953 • http://www.nature.com/nature/dna50/index.html • Rosalind Franklin?
A origem e o sentido da bioinformática • João Carlos Setubal (coordenador do Laboratório de Bioinformática da Unicamp ) em: http://www.comciencia.br/reportagens/bioinformatica/bio10.shtml • Problemas de 2 tipos: • Biotecnológicos (ex: montagem de genomas) • DNA como uma linguagem e entender os efeitos da informação genética
Primeiras bases de dados • Em 1960, Dayhoff e colaboradores construíram um catálogo contendo todas as seqüências de proteínas conhecidas até a data. “Atlas of Protein Sequences and Structure”, de 1965. O conteúdo dessa base de dados não deveria conter mais de 1Mb de informação, se transferida para computadores modernos (Baxevanis e Ouellette, 2001). • Com o advento do sequenciamento do DNA e, principalmente, a partir da década de 1990, do sequenciamento em larga escala, foi necessária a construção de bancos de dados mais robustos para abrigar a explosão no número de seqüências obtidas pelos pesquisadores. O NCBI, por exemplo, foi criado pelo NIH em 1988 para abrigar esse tipo de informação (Wheller et al., 2002).
Bases de dados • INSDC (International Nucleotide Sequence Database Colaboration): • 100.000.000.000 bases ! • NCBI - National Center for Biotechnology Information (Criado em 1988 pelo NIH) • EMBL - European Molecular Biology Laboratory • DDJB - DNA Data Bank of Japan • http://www.nlm.nih.gov/news/press_releases/dna_rna_100_gig.html
Classificação das bases de dados biológicos • Primários: • GenBank, EMBL (Stoesser et al., 2002) e PDB (Westbrook et al., 2002) • Secundários: • SWISS-PROT e o TrEMBL (Bairoch e Apweiler, 2002)
GenBank • Crescimento exponencial do número de seqüências contidas no GenBank ao longo das duas últimas décadas. Obtido em http://www.ncbi.nlm.nih.gov/ Genbank/genbankstats.html
Recursos disponíveis na internet • http://www.ncbi.nlm.nih.gov/genome/guide/human/ • http://www.icb.ufmg.br/~franc/ • http://www.comciencia.br/reportagens/bioinformatica/bio01.shtml
Como chegar a esses sites? • WWW.GOOGLE.COM!!!