Banche dati specializzate
This presentation is the property of its rightful owner.
Sponsored Links
1 / 61

Banche dati specializzate PowerPoint PPT Presentation


  • 88 Views
  • Uploaded on
  • Presentation posted in: General

Banche dati specializzate. Banche dati Specializzate. Le banche dati specializzate raccolgono insiemi di dati omogenei dal punto di vista tassonomico e/o funzionale disponibili nelle Banche dati Primarie e/o in Letteratura, rivisti e annotati con informazioni di valore aggiunto.

Download Presentation

Banche dati specializzate

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Banche dati specializzate

Banche dati specializzate


Banche dati specializzate1

Banche dati Specializzate

Le banche dati specializzate raccolgono insiemi di dati omogenei dal punto di vista tassonomico e/o funzionale disponibili nelle Banche dati Primarie e/o in Letteratura, rivisti e annotati con informazioni di valore aggiunto


Banche dati specializzate di patterns proteici

Banche dati Specializzate di Patterns Proteici

  • Data una sequenza non caratterizzata:

    • A che famiglia appartiene?

    • Qual è la sua funzione?


The protein signature approach

“The protein signature approach”

  • Confrontiamo sequenze appartenenti alla stessa famiglia, cercando ‘pattern’ comuni

  • Costruiamo un database di profili conservati (elementi di sequenza conservati in specifiche posizioni)

  • Usiamo questi profili (pattern) per classificare una sequenza incognita


Banche dati specializzate

Multiple sequence alignment

What are protein signatures?

Protein family/domain

Build model

Search

UniProt

Protein analysis

Significant match

ITWKGPVCGLDGKTYRNECALL

Mature model

AVPRSPVCGSDDVTYANECELK


Banche dati specializzate

Diagnostic approaches (sequence-based)

Single motif methods

Regex patterns (PROSITE)

Full domain alignment methods

Profiles

(Profile Library)

HMMs

(Pfam)

Multiple motif methods

Identity matrices

(PRINTS)


Banche dati specializzate

Motif

Define pattern

xxxxxx

xxxxxx

xxxxxx

xxxxxx

Extract pattern sequences

Build regular expression

C-C-{P}-x(2)-C-[STDNEKPI]-x(3)-[LIVMFS]-x(3)-C

Pattern signature

PS00000

Patterns

Sequence alignment


Banche dati specializzate di patterns proteici1

Banche dati Specializzate di Patterns Proteici


Protein families

Protein families

  • PFAM (acronimo di Protein Families) è un database di domini di proteine descritti con modelli markoviani. E’ diviso in due sezioni: pfam-A contiene allineamenti curati da esperti; pfam-B contiene sequenze che vengono automaticamente raggruppate.


Banche dati specializzate

Pfam


Banche dati specializzate

InterPro Entry

Groups similar signatures together

Adds extensive annotation

Adds extensive annotation

Links to other databases

Links to other databases

Structural information and viewers

  • Hierarchical classification


Interpro hierarchies families

Interpro hierarchies: Families

FAMILIES can have parent/child relationships with other Families

  • Parent/Child relationships are based on:

  • Comparison of protein hits

  • child should be a subset of parent

  • siblings should not have matches in common

  • Existing hierarchies in member databases

  • Biological knowledge of curators


Interpro hierarchies domains

Interpro hierarchies: Domains

DOMAINS can have parent/child relationships with other domains


Domains and families may be linked through domain organisation

Domains and Families may be linked through Domain Organisation

Hierarchy


Banche dati specializzate

InterPro Entry

Groups similar signatures together

Adds extensive annotation

Adds extensive annotation

Links to other databases

Links to other databases

Structural information and viewers


Banche dati specializzate

InterPro Entry

Groups similar signatures together

Adds extensive annotation

Adds extensive annotation

Links to other databases

Links to other databases

Structural information and viewers

The Gene Ontology project provides a controlled vocabulary of terms for describing gene product characteristics


Banche dati specializzate

InterPro Entry

Groups similar signatures together

Adds extensive annotation

Adds extensive annotation

Links to other databases

Links to other databases

Structural information and viewers

UniProt

KEGG ... Reactome ... IntAct ...

UniProt taxonomy

PANDIT ... MEROPS ... Pfam clans ...

Pubmed


Banche dati specializzate

InterPro Entry

Groups similar signatures together

Adds extensive annotation

Adds extensive annotation

Links to other databases

Links to other databases

Structural information and viewers

PDB 3-D Structures

SCOP Structural domains

CATH Structural domain classification


Searching interpro

Searching InterPro


Searching interpro1

Searching InterPro

Protein family membership

Domain organisation

Domains, repeats

& sites

GO terms


Searching interpro2

Searching InterPro


Searching interpro3

Searching InterPro


Banche dati specializzate associate a patterns nucleotidici

Banche dati Specializzateassociate a Patterns Nucleotidici

Eukaryotic Promoter Database (http://www.epd.isb-sib.ch/)

Transcription Factors TRANSFAC

Translation Terminations TransTERM

Vector database VectorDB

Repeats Database Repbase


Profili strutturali

Profili strutturali

CATH (http://www.cathdb.info/)

SCOP (http://scop.mrc-lmb.cam.ac.uk/scop/)


Banche dati specializzate

CATH


Banche dati specializzate

SCOP


Banche dati specializzate di

Banche dati Specializzate di

  • Geni

  • Genomi

  • Trascritti e Profili di Espressione

  • Pathways Metabolici

  • Mutazioni


Banche dati specializzate di geni

Banche dati Specializzatedi Geni

  • COGs

  • Entrez Gene

  • RefSeq


Entrez gene

ENTREZ Gene


Siti genomici

Siti Genomici

NCBI Genomes

EBI Genomes

TIGR (Craig Venter)


Il genoma umano

Il Genoma Umano

Il Genoma Umano all’NCBI

Il Genoma Umano alla Celera

Ensembl

UCSC Genome Bioinformatics


Banche dati del trascrittoma

Banche dati del Trascrittoma

dbEST

UniGene

UTRdb/UTRsite


Banche dati di espressione

Banche dati di Espressione

GEO

ArrayExpress

EPDex


Banche dati di pathways metabolici

Banche dati diPathways Metabolici

Kyoto Encyclopedia

of Genes and Genomes

http://www.genome.jp/kegg/


Banche dati di pathways metabolici1

Banche dati diPathways Metabolici

REACT_945.4


Banche dati delle mutazioni

Banche dati delleMutazioni

dbSNP

HGVBase


  • Login