Intégration
This presentation is the property of its rightful owner.
Sponsored Links
1 / 53

Bioinformatique fonctionnelle des protéines et analyse structurale de réseaux d'interactions PowerPoint PPT Presentation


  • 56 Views
  • Uploaded on
  • Presentation posted in: General

intégration. Relations inter-espèces, Équilibres écologiques. Populations. Développement, reproduction, vieillissement. Organismes. Régulations physiologiques. Tissus, organes. Migrations, Communications. Cellules. Réseau d’interactions entre molécules. Fonction cellulaire : voie,

Download Presentation

Bioinformatique fonctionnelle des protéines et analyse structurale de réseaux d'interactions

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

intégration

Relations inter-espèces,

Équilibres écologiques

Populations

Développement, reproduction,

vieillissement

Organismes

Régulationsphysiologiques

Tissus,organes

Migrations,

Communications

Cellules

Réseau d’interactions

entremolécules

Fonction cellulaire : voie,

cascade, processus

Fonction biochimique

ou moléculaire

Molécule

Bioinformatique fonctionnelle des protéines

et analyse structurale

de réseaux d'interactions

Deuxième partie

Octobre 2008

Bernard Jacq


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Les méthodes de prédiction fonctionnelle existantes

  • Sont souvent basées sur des inférences utilisant des données structurales (alignments de séquence, fusions de domaines, proximités géniques, profils phylogénétiques)

  • Similarité de séquence/structure n’est pas toujours synonyme de similarité de fonction

  • Ne peuvent souvent être appliquées qu’à un sous-ensemble de protéines

  • Sont souvent dépendantes de la qualité de l’annotation

  • Problème du transfert automatique d’annotations (catastrophes transitives)

  • Nécessitent la connaissance de la séquence génomique

  • Ne donnent pas accès à des prédictions au niveau cellulaire

  • NB : Une prédiction doit toujours être vérifiée expérimentalement


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Les approches de la fonction à grande échelle (suite) :

protéome et interactome


Etude grande chelle des complexes prot iques

Etude à grande échelle des complexes protéiques


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

ANALYSE SYSTEMATIQUE DES COMPLEXES PROTEIQUES CHEZ LA LEVURE

  • Stratégie

  • PCR of the TAP cassette

  • Transformation of yeast cells

  • Selection for positive clones

  • Large scale cultivation

  • Cell lysis, Tandem affinity purification

  • 1D SDS-PAGE

  • MALDI-TOF protein identification

  • Bioinformatic interpretation data

Gavin et al. (2002) Nature, 415:141-147


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Quelques résultats

  • 589 protéines utilisées comme entrées  78 % ont des partenaires  232 complexes identifiés

  • 304 protéines sans annotation fonctionnelle dans YPD  proposition de rôle pour 231 d’entre elles  76 %

  • 113 protéines de fonction connue se voient attribuer une nouvelle fonction


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Un RESEAU DE COMPLEXES PROTEIQUES

Rouge : Cell cycle

Vert foncé : Signalling

Bleu foncé : Transcription, DNA maintenance, chromatin structure

Rose : Protein and RNA transport

Orange : RNA metabolism

Vert clair : Protein synthesis and turnover

Marron : Cell polarity and structure

Violet: Intermediate and energy metabolism

Bleu clair : Membrane biogenesis and traffic


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

ANALYSE STATISTIQUE DES PROTEINES ET DES COMPLEXES


L i n t e r a c t o m e

L’interactome

Liste de toutes les interactions entre toutes les macromolécules d’une cellule, d’un type cellulaire, d’un organisme

Employé par défaut pour

décrire l ’ensemble des

interactions protéine-protéine


L interactome motivation

L’interactome (motivation)

Les protéines n’agissent pas seules et les processus cellulaires reposent dans leur grande majorité sur des interactions spécifiques entre protéines

Après avoir établi la liste des composants protéiques individuels (d’après les résultats du séquençage), une tâche essentielle est maintenant de déchiffrer la sructure, la dynamique, l’évolution des réseaux d’interaction

Identifier quels sont les partenaires connus d’une protéine inconnue pourra nous aider à en comprendre la fonction


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Genome

Transcriptome

Proteome

Interactome


Les interactions quelques d finitions

Les Interactions :quelques définitions

Interactions moléculaires

  • Il y a interaction moléculaire entre le gène Aet le gène B si le gène A(ou son ARNm ou son produit) interagit directement au niveau moléculaire avec le gène B(ou son ARNm ou son produit) --> Il existe un contact physique entre macromolécules.

  • La majorité des interactions décrites sont de 3 types:

    • Protéine-ADN

    • Protéine-ARN

    • Protéine-Protéine

  • Les interactions peuvent être orientées (Protéine-ADN, Protéine-ARN)ou non orientées(Protéine-Protéine).


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Les Interactions :quelques définitions, suite

Interactions et réseaux

  • Un ensemble d’interactions forme un réseau d’interactions

  • Un réseau peut illustrer les relation fonctionnelles existant entre gènes/protéines

  • Un réseau peut être représenté par un graphe orienté ou non

B

E

•A-->B:interaction directe

• A-->C-->D-->F-->G:

Interactions indirectes

• En bleu : le réseau

D

A

F

C

G


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Les Interactions :quelques définitions, fin

  • Interactions génétiques

  • Interactions indirectes entre gènes/protéines (mais aussi directes)

  • Analyse et mise en évidence au niveau du phénotype de l’animal

  • Quelques Propriétés des interactions

  • Spécifiques

  • Dynamiques

  • Dépendantes des caractéristiques intrinsèques de la protéine (modularité structurale, temps de 1/2 vie, localisation…)

  • Nombre ?

  • Eléments de base des réseaux de régulation


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Tucker, Gera, and Uetz

TCB, 2001

CARTE D’INTERACTIONS Protéine-Protéine

LEVURE, 1200 protéines


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

CARTE D’INTERACTIONS PP LEVURE

1548 protéines, 2358 interactions

Gris : Chromatine structure

Bleu : Membrane fusion

Vert : Cell structure

Jaune : Lipid metabolism

Rouge : Cytokinesis

Schikowski et al. (2000), Nat.Biotech., 18, 1257-1261


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Les réseaux protéines-ADN

Facteurs de

Transcription

Gène 1

Gène 2

Gène 3

.....

Un trait liant 2 points

Sur la circonférence

Représente une interaction

Protéine-ADN

Comment évolue la dynamique

des réseaux P-ADN en fonction des conditions physiologiques ?

Crédit: N. Luscombe


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Cycle cellulaire

Sporulation

Diauxic shift

Réparation du DNA

Stress

Utilisation du réseau dans differentes

Conditions physiologiques

Crédit: N. Luscombe


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

On dispose maintenant, grâce aux approches à grande échelle (double hybride, Chromatin IP) de milliers d’interactions binaires entre protéines ou entre protéines et ADNQue faire avec cette masse de données ??

  • décrire les caractéristiques de l'organisation du protéome/interactome= statistique, approche descriptive

  • prédire certaines « règles » à partir de l'observation du réseau = inférence, approche prédictive


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Analyse fonctionnelle du réseau

Comptage des interactions entre groupes fonctionnels

Schwikowski et al. (2000), Nat.Biotech., 18, 1257-1261


Un r seau ppi de levure

Analyse structurale et fonctionnelle de réseaux d’interaction

Un réseau PPI de levure

Quelles caractéristiques structurales peut-on mettre en évidence ?


Un r seau ppi de levure1

Analyse structurale et fonctionnelle de réseaux d’interaction

Un réseau PPI de levure

Deletion phenotype:

Red = lethal

Green = non-lethal

Orange = slow growth

Yellow = unknown

Ce réseau représente un

type d’organisation dit

« scale-free »

  • La plupart des nœuds (protéines) ont peu d’interactions

  • Un petit nombre de nœuds (hubs) sont connectés à un grand nombre de noeuds


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Analyse structurale et fonctionnelle de réseaux d’interaction

Des mesures topologiques pour

caractériser un réseau

Degré de

connectivité

Coefficient de

clusterisation

Longueur de chemin

Crédit: N. luscombe


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Méthodes d’analyse de graphes d’interactions protéine-protéine

Comment identifier à l’intérieur du graphe des groupes de protéines reliées fonctionnellement ?

  • • Approches :

  • distance dans le graphe

  • connectivité des protéines

  • densité

Peu dense

Dense (clique)

Crédit: C. Herrmann


Caract ristiques statistiques

Caractéristiques statistiques

  • connectivité k d'une protéine = nombre de voisins

k = 4

kin = 1

kout = 3

  • si le réseau est dirigé (réseaux protéine-ADN) , on distingue kin et kout

Crédit: C. Herrmann


Caract ristiques statistiques1

Caractéristiques statistiques

  • distribution de connectivité:

quelques protéines

fortement connectées = « hub »

beaucoup de protéines

faiblement connectées

Crédit: C. Herrmann


Interpr tation biologique 1 3

Interprétation biologique (1/3)

  • particularité des protéines ayant un grand nombre d'interacteurs

    • protéines structurantesex.: PBS2 chez S. cerevisae, k=15protéine structurante (« échafaudage ») pour le complexe MAP-kinase

    • protéines létalesex.: Jeong et al. ont montré une corrélation entre la connectivité d'une protéine et son caractère létal chez la levure« plus une protéine a de partenaires, plus elle est essentielle »

Crédit: C. Herrmann


Interpr tation biologique 2 3

Interprétation biologique (2/3)

  • Si des protéines ont une grande densité de connections ...

    ... c'est qu'elles forment un module fonctionnel

  • 2 type de modules fonctionnels

    • les complexes protéiques (interactions simultanées)

    • les voies de signalisation/voies métaboliques(interactions consécutives)

Crédit: C. Herrmann


Interpr tation biologique 3 3

Interprétation biologique (3/3)

voie de transduction du signal déclenchée

par la phéromone

levure

module impliqué

dans la régulation du

cycle cellulaire

[Spirin & Mirny, PNAS 2003]

Crédit: C. Herrmann


Pr dire quoi

Peut-on utiliser les réseaux d'interaction pour faire de la prédiction ?

Prédire quoi ?

  • on dispose d'informations encore très partielles sur le rôle des protéines

[date: 9/11/2004]

les réseaux d'interactions sont un moyen

privilégié pour inférer des fonctions

Crédit: C. Herrmann


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Observation:

les protéines de même

fonction ont tendance à

être en interaction directe

les unes avec les autres

source

d'erreurs

Règle inférée:

on peut déduire la fonction

d'une protéine à partir des

fonctions de ses voisines

Exemple de prédiction à partir d’un réseau d'interaction PP levure[Schwikowski et al., Nature Biotech 2000]

Crédit: C. Herrmann


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Comment peut-on systématiser les prédictions fonctionnelles faites à partir de réseaux d’interactions ?

Utilisation de la clusterisation fonctionnelle

Exemple de la méthode Prodistin (PROtein DIStance based on INteractions

Brun et al., Genome Biology

(2003) R, R6


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

What can be inferred about the functional relationships

between A and B on the one hand and C and D on the other ?

A

B

C

D

Tucker, Gera and Uetz

Trends in Cell Biology, March 2001

C and D interact directly and share several common interactors,

whereas A and B do not

It is likely that the network (cellular) functions of C and D are related

whereas that of proteins A and B are not


Principles of our functional classification method prodistin

Principles of our functional classification method (ProDistIn)

… Do not compare proteins themselves

but…

…compare the lists of their interactors…

•Etablish a functional distance between proteins using lists of common and specific interactors

• Calculate the distance for all possible pairs of proteins

• Perform a clusterisation (NJ)

• Visualisation of result as a tree (dendrogram)


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Z

1- Czekanovski-Dice distance for protein pairs

i

j

k

l

m

X spec + Y spec

1 + 4

D(X, Y) =

=

= 0.45

Y

8 + 3

(X UY) + (X  Y)

X

c

a

b

f

g

h

In order to make a functional comparison between N proteins:

- calculate D for all pairwise comparisons of proteins

- fill in a distance matrix

e

X

Y

Z

T

d

X

-

0.45

0.5

0.77

2- distance table for all possible pairs

Y

-

0.6

0.66

Z

-

0.84

n

o

p

Apply a clusterisation method (e.g. NJ) and

build a functional similarity tree

T

-

X

T

Y

Z

T

3- clusterisation and tree drawing

ProDistIn : the 3 first steps


Test on the yeast proteome

Data from :

• Double-hybrid screens (Fromont-Racine et al., Uetz et al., Ito et al.)

• literature (via MIPS and YPD)

• Information Extraction on Medline yeast abstracts

Test on the yeast proteome

• A total of 2946 direct protein-protein interactions involving 2143 proteins

• Only proteins with at least 3 interactors are considered further

  • =>Classification of 602 yeast proteins (10% of the proteome)


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

RESULT :

FUNCTIONAL

PROXIMITY

TREE

FOR 602

YEAST

PROTEINS


Il existe maintenant des bases de donn es d di es aux interactions

• Les interactions sont devenues en quelques années des données essentielles pour analyser et comprendre les fonctions des gènes et protéines

• Pour chaque organisme et dans chaque type cellulaire, il existe probablement des dizaines, centaines de milliers voire millions d’interactions moléculaires différentes

• Il est nécessaire de stocker informatiquement les données relatives aux interactions

Il existe maintenant des bases de données dédiées aux interactions

Exemple des bases DIP et BIND …


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Vision classique

Nouvelle vision

A

A

S

(Substrat)

P

(Produit)

La fonction de la protéine A

est définie par

son action de transformation

du substrat (S) en produit (P)

La fonction de la protéine A

est définie par

Le contexte des ses interactions avec d ’autres produits dans la cellule

La biologie à grande échelle conduit à

un changement de vision

de la fonction des protéines


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

C ’EST FINI !


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Le double-hybride dans la levure

  • Uetz et al. (2000) Nature, 403:623-627

  • Ito et al. (2000) PNAS, 97:1143-1147


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Le double-hybride dans la levure :

bas-débit et haut-débit

Schächter (2002)


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Le double-hybride dans la levure :

automatisation

Kumar and Snyder (2001)


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

PRINCIPAUX CRIBLES DOUBLE-HYBRIDE A GRANDE ECHELLE

Schachter (2002) DDT,7:S48-S54


Bioinformatique fonctionnelle des prot ines et analyse structurale de r seaux d interactions

Avantages et inconvénients des deux méthodes

  • Approche double-hybride :

  • + Mise en évidence d’interactions binaires  carte d’interactions

  • + Automatisable

  • Nombreux faux positifs  des appâts semblent interagir avec beaucoup de protéines car ils sont auto-activateurs, pb des proies collantes

  • Nombreux faux-négatifs  repliement incorrect, localisation subcellulaire incorrecte, absence de modification post-traductionnelle

  • Ne met en évidence que les interactions « durables »

  • Approche Spectrométrie de masse :

  • + On peut détecter les interactions du signalling

  • - Impératif de stabilité, solubilité, temps, concentration, taille

  • Approche chromosomique : pb tag des gènes essentiels


  • Login