Gscope
This presentation is the property of its rightful owner.
Sponsored Links
1 / 25

Gscope PowerPoint PPT Presentation


  • 78 Views
  • Uploaded on
  • Presentation posted in: General

Gscope. L’outil bio-informatique pour la génomique structurale. Gscope pour le biologiste. Automatise la cascade des programmes Crée et gère les données Les visualise R echerche de cibles à l ’échelle génomique Annotation ... Gscope est aussi une boîte à outils bio-informatique.

Download Presentation

Gscope

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Gscope

Gscope

L’outil bio-informatique

pour la

génomique structurale


Gscope pour le biologiste

Gscope pour le biologiste

  • Automatise la cascade des programmes

    • Crée et gère les données

    • Les visualise

  • Recherche de cibles à l ’échelle génomique

  • Annotation

  • ...

    Gscope est aussi une boîte à outils bio-informatique


Gscope

DNA and/or Proteome

- Nuc sequence

- Prot sequence

- Intergenic regions

- GC content & Codon Usage

- ShineDalgarno

ORFs determination

(Glimmer,tRNAScan)

BlastP :

- Best hits

- Hits count

tBlastN :

- Presence/abs in

other organisms

- Two Gene Cluster

- Detection of putative

ORFs not created

Database searches

BlastP on SwissProt, TrEmbl

tBlastN on complete genomes

Database creation

MultiAlignment of

Complete Sequences

Ballast on BlastP output

DbClustal

- Alignments

- Trees

- Phylo profils

- Hydrophobicity

- Two Gene Cluster Analysis

- Wrong start codon detection

- Phylogenetic analysis

- Recombination

- Gene losses

- Functions

- Annotation

Integrated analysis

& Visualization tool


S quences

Séquences ?

  • un génome fraîchement séquencé (P.abyssi)

  • tous les génomes ‘petits’ existants (V.cholera…)

  • un groupe fonctionnel (TFIIH)

  • une famille de protéines (synthétases, NR, ERco)

  • un ...ome (ribosome, péroxisome)

  • une séquence (la vôtre).


Deux regards

Deux regards

  • Structural … je veux des cristaux !

    • ORF quality(overlap, validation du codon start, …)

    • organisation en domaines ( local vs global, ... )

    • productivité (codon usage vs coli or yeast, hydrophobicité)

  • Phylogénomique … qui suis-je, d’où je viens ?

    • annotation, recherche de fonction

    • bilan présence/absence dans autres organismes, transferts horizontaux, cluster maintenance

    • bilan de paralogie

    • bilan phylogénomique

    • etc.


Int gration et automatisation des outils existants

Lecture de données

formats TFA, EMBL, GenBank, texte,…

liste de accession numbers

Détermination des ORFs

Glimmer, tRNA_Scan

Création des séq nuc et prot

Analyse ADN

composition, codon usage,

biais GC, ShineDalgarno

BlastP, TBlastN, BlastX

SwissProt, TrEmbl, PDB

Human, CompleteGenomes

Ballast, DbClustal,

LMS et alignements multiples

avec test de qualité

BestDefinition

+Secator, Ordali

>> groupes, domaines

Phylogénie

Intègration et automatisationdes outils existants


Visualisation

Visualisation


Coloration liste

Séquence

Orthologues

blast, alignements

présence/absence

paralogues

Info structurale

PDB

codon adaptation index

hydrophobicité

Phylogénie

folle

fonction

Coloration/Liste


Ce qu il faut pour d marrer

Ce qu’il faut pour démarrer ...

  • une liste de séquences

    • accession numbers

    • fichiers existants

  • un fichier ADN (génome complet ou non)

  • une suite de contigs

  • un fichier GenBank avec ADN et protéome

  • ...

    Gscope lit, convertit, vérifie, recherche, range.


Gscope

DNA and/or Proteome

- Nuc sequence

- Prot sequence

- Intergenic regions

- GC content & Codon Usage

- ShineDalgarno

ORFs determination

(Glimmer,tRNAScan)

BlastP :

- Best hits

- Hits count

tBlastN :

- Presence/abs in

other organisms

- Two Gene Cluster

- Detection of putative

ORFs not created

Database searches

BlastP on SwissProt, TrEmbl

tBlastN on complete genomes

Database creation

MultiAlignment of

Complete Sequences

Ballast on BlastP output

DbClustal

- Alignments

- Trees

- Phylo profils

- Hydrophobicity

- Two Gene Cluster Analysis

- Wrong start codon detection

- Phylogenetic analysis

- Recombination

- Gene losses

- Functions

- Annotation

Integrated analysis

& Visualization tool

ORF quality


Orf quality la s quence est elle bien d finie existe start stop frame shift

ORF qualityla séquence est-elle bien définie ?(existe, start, stop, frame-shift)

  • protéome connu ou Glimmer, tRNAscan

  • overlap, biais en composition

  • beaucoup ou pas d’orthologues (Blastp, Tblastn)

  • validité du codon start (Secator, DbClustal)

  • ...

  • mauvais splicing


Validit du codon start

Codon start 1/3

Validité du codon start

beaucoup d ’erreurs dans les banques

  • overlap

    • peu probable

    • sauf overlap de un ( TAAATG > TAATG )

  • alignements des codons start

    • DbClustal le permet (méthode globale)

    • pour les séquences du groupe Secator en particulier

    • s ’il y en a suffisamment

  • … si en plus apparaît la séquence de Shine-Dalgarno !


Gscope

Codon start 2/3


Gscope

Codon start 3/3


Gscope

DNA and/or Proteome

- Nuc sequence

- Prot sequence

- Intergenic regions

- GC content & Codon Usage

- ShineDalgarno

ORFs determination

(Glimmer,tRNAScan)

BlastP :

- Best hits

- Hits count

tBlastN :

- Presence/abs in

other organisms

- Two Gene Cluster

- Detection of putative

ORFs not created

Database searches

BlastP on SwissProt, TrEmbl

tBlastN on complete genomes

Database creation

MultiAlignment of

Complete Sequences

Ballast on BlastP output

DbClustal

- Alignments

- Trees

- Phylo profils

- Hydrophobicity

- Two Gene Cluster Analysis

- Wrong start codon detection

- Phylogenetic analysis

- Recombination

- Gene losses

- Functions

- Annotation

Integrated analysis

& Visualization tool

Production


Production

Production

  • Codon adaptation index vs E.coli or S.cerevisiae

  • Hydrophobicité, hélices transmembranaires

  • Orthologues dans la PDB

    • existence

    • fragments

  • Mise en évidence de domaines

    • par l ’alignement

    • si opposition local (blast) - global (DbClustal)

    • … à suivre


Gscope

DNA and/or Proteome

- Nuc sequence

- Prot sequence

- Intergenic regions

- GC content & Codon Usage

- ShineDalgarno

ORFs determination

(Glimmer,tRNAScan)

BlastP :

- Best hits

- Hits count

tBlastN :

- Presence/abs in

other organisms

- Two Gene Cluster

- Detection of putative

ORFs not created

Database searches

BlastP on SwissProt, TrEmbl

tBlastN on complete genomes

Database creation

MultiAlignment of

Complete Sequences

Ballast on BlastP output

DbClustal

- Alignments

- Trees

- Phylo profils

- Hydrophobicity

- Two Gene Cluster Analysis

- Wrong start codon detection

- Phylogenetic analysis

- Recombination

- Gene losses

- Functions

- Annotation

Integrated analysis

& Visualization tool

Phylogenomic


Phylog nomique

Phylogénomique

  • Bilan de présence/absence dans les génomes complets

    • TBlastN

  • Phylo folle

    • Biais en GC

    • Arbre phylogénétique non conforme (pertes ou transferts)


Gscope

Un exemple de protocole d ’analysemis au point par Marcsur ERco pour mettre en évidence les domaines structuraux

  • Faire un alignement avec toutes les séquences du blastp

  • Définir les groupes avec Secator

  • Choisir un représentant par groupe

  • Puis

    • Rechercher les domaines existants (ProDom par exemple)

    • PDB

    • Prédictions de structures secondaires, profil hydrophobicité, …

    • Sites de coupures aux protéases (trypsine, …)

    • VRP

    • information bibliographique (fonction, mutants, …)

      à l ’aide de Gscope, qui l ’automatisera bientôt ...


Perspectives

Perspectives

  • Eucaryotes supérieurs

    • mauvais épissage

    • intégration des Est

    • étude promoteurs

  • Informations sur les domaines et motifs

    • Ballast

    • Correlator

    • Domainol

    • data mining

  • Utilisation

    • protocole automatique de recherche de cibles (Shankar)

    • RELACS (RELational Alignement of Complete Sequences)

  • De mieux en mieux

  • Web … mais ça marche déjà !!!


  • Login