1 / 15

Introduction of RefSeq and LocusLink: resources at the NCBI

Introduction of RefSeq and LocusLink: resources at the NCBI. Magno Inácio dos Santos. Artigos. Introducing refSeq and LocusLink: curated human genome resources at the NCBI RefSeq and LocusLink: NCBI gene-centered resources. Trends in Genetics,2000, Vol.16, No.1, pg.44-47

keanu
Download Presentation

Introduction of RefSeq and LocusLink: resources at the NCBI

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos

  2. Artigos • Introducing refSeq and LocusLink: curated human genome resources at the NCBI • RefSeq and LocusLink: NCBI gene-centered resources • Trends in Genetics,2000, Vol.16, No.1, pg.44-47 • Nucleic Acids Research,2001, Vol.29, No.1, pg.137-140 PARA MAIS INFORMAÇÕES...

  3. Equipe/recursos • Os idealizadores destes projetos foram os pesquizadores; Kim D. Pruitt, Donna R. Maglott, Kenneth S. Katz e Hugues Sicote com recursos para construção e manutenção dos seguintes grupos: • Human Gene Nomenclature Committee • Online Mendelian Inheritance in Man • National Center for Biotechnology Information • contribuições individuais e institucionais

  4. Objetivos • Encontrar a sequência de um gene; • determinar o que se sabe sobre um gene ou proteína; • estabelecer uma forma comum de referência para comparação de várias sequências e polimorfismos; • selecionar um número representativo de sequências para estudos de expressão em larga escala.

  5. Uso das ferramentas • LocusLink organiza informações sobre genes gerando um banco de dados para serem acessadas informações de genes específicos; • Refseq proporciona referências de modelos sequenciais de genomas, transcrições e proteínas; • RefSeq e LocusLink proporcionam uma via direta para auxiliar a pesquisa em genes e linhagens de genes, variação, expressão gênica e apontamento genomico.

  6. Análise do LocusLink • O LocusLink mantém informações descritivas sobre um“loci” incluindo nomenclatura, identificador de bancos de dados (locus ID), doenças associadas, posições no mapa e acréscimo de sequências; • O LocusLink mantém ligações diretas para facilitar pesquisas na PubMed, OMIM, RefSeq, GenBank, UniGene e dbSNP . • A pesquisa no LocusLink pode ser feita através de termos (como uma proteína ou nome de doença), símbolos de genes, sequências de acesso, e ID’s de bancos de dados. Http://www.ncbi.nlm.nih.gov/LocusLink.html Como acessar...

  7. Análise do Refseq • O RefSeq transcreve registros de proteínas. • Diferente dos registros do Genbank, o RefSeq pode ser modificado depois de revisado por um Biólogo. • Uma sequência provisória é computada de um registro nucleotídico que tem uma região de codificação completa (CDS). O registro RefSeq de uma proteína é a tradução de um apontamento de CDS. Http://www.ncbi.nlm.nih.gov/LocusLink/refseq.html Como acessar...

  8. RefSeq • Banco de sequências de referência • redundância do GenBank retirada • Inclui nº acesso • mRNAs (Nucleotide) NM • proteínas (Protein) NP • cromossomos inteiros (Genome) NC • Três níveis de curadoria para sequências NM: • predita, provisória e revisada • Além de entradas originadas de anotação do genoma

  9. Três classes de NM • Predita: automática • cDNA com ORF sem função descrita • Provisória: manual • proteína com função conhecida ou inferida • o melhor representante do GenBank, mais anotado • Revisada: manual • compilação sobre o gene e seus transcritos • sequência, propriedades, nomenclatura, referências, retirada de vetor, adição de UTRs, domínios conservados, descrição da função do gene, links

  10. Escolha das NM provisórias • Preferência para entrada GenBank com mais UTR; • Diferença com GenBank: • Inicialmente nenhuma • Anotação da entrada RefSeq vai ficando mais detalhada • Acrescenta dados de vários laboratórios e entradas • Seleção de um único representante; • redundância = somente isoformas de processamento • Pseudogenes não geram RefSeq; • Aparecem no GenBank

  11. Anotação do genoma • Software indica presença de gene e proteína; • Sem comprovação de expressão: • Acesso • NT contigs genômicos construídos, • XM mRNA modelado (sem evidência EST), • XP proteína modelada

  12. Download de sequências • Somente a entrada única do gene: Nome [Gene name] e srcd RefSeq [prop]; • Isoformas de processamento: Nome [Gene Name] e srcd RefSeq [properties]; • Todas as provisórias (combinar com organismo): Srcd RefSeq [prop] e provisional [all]; • Todas as revisadas (combinar com organismo): : Srcd RefSeq [prop] e Biomol mRNA [Prop] NOT provisional [all].

  13. Aumento e manutenção • As informações levantadas no LocusLink e RefSeq estão sendo continuamente revisadas e aumentadas. O número de registros RefSeq triplicou, e o LocusLink expandiu cerca de cinco vezes num período de um ano.

  14. Status atual • Registros RefSeq novos e atualizados são avaliados continuamente pelo público. • O site do LocusLink é atualizado semanalmente.

  15. URLs do NCBI

More Related