Intégration
Download
1 / 53

Bioinformatique fonctionnelle des protéines et analyse structurale de réseaux d'interactions - PowerPoint PPT Presentation


  • 140 Views
  • Uploaded on

intégration. Relations inter-espèces, Équilibres écologiques. Populations. Développement, reproduction, vieillissement. Organismes. Régulations physiologiques. Tissus, organes. Migrations, Communications. Cellules. Réseau d’interactions entre molécules. Fonction cellulaire : voie,

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Bioinformatique fonctionnelle des protéines et analyse structurale de réseaux d'interactions' - amity-england


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

intégration

Relations inter-espèces,

Équilibres écologiques

Populations

Développement, reproduction,

vieillissement

Organismes

Régulationsphysiologiques

Tissus,organes

Migrations,

Communications

Cellules

Réseau d’interactions

entremolécules

Fonction cellulaire : voie,

cascade, processus

Fonction biochimique

ou moléculaire

Molécule

Bioinformatique fonctionnelle des protéines

et analyse structurale

de réseaux d'interactions

Deuxième partie

Octobre 2008

Bernard Jacq


Les méthodes de prédiction fonctionnelle existantes

  • Sont souvent basées sur des inférences utilisant des données structurales (alignments de séquence, fusions de domaines, proximités géniques, profils phylogénétiques)

  • Similarité de séquence/structure n’est pas toujours synonyme de similarité de fonction

  • Ne peuvent souvent être appliquées qu’à un sous-ensemble de protéines

  • Sont souvent dépendantes de la qualité de l’annotation

  • Problème du transfert automatique d’annotations (catastrophes transitives)

  • Nécessitent la connaissance de la séquence génomique

  • Ne donnent pas accès à des prédictions au niveau cellulaire

  • NB : Une prédiction doit toujours être vérifiée expérimentalement




ANALYSE SYSTEMATIQUE DES COMPLEXES PROTEIQUES CHEZ LA LEVURE

  • Stratégie

  • PCR of the TAP cassette

  • Transformation of yeast cells

  • Selection for positive clones

  • Large scale cultivation

  • Cell lysis, Tandem affinity purification

  • 1D SDS-PAGE

  • MALDI-TOF protein identification

  • Bioinformatic interpretation data

Gavin et al. (2002) Nature, 415:141-147


Quelques résultats

  • 589 protéines utilisées comme entrées  78 % ont des partenaires  232 complexes identifiés

  • 304 protéines sans annotation fonctionnelle dans YPD  proposition de rôle pour 231 d’entre elles  76 %

  • 113 protéines de fonction connue se voient attribuer une nouvelle fonction


Un RESEAU DE COMPLEXES PROTEIQUES

Rouge : Cell cycle

Vert foncé : Signalling

Bleu foncé : Transcription, DNA maintenance, chromatin structure

Rose : Protein and RNA transport

Orange : RNA metabolism

Vert clair : Protein synthesis and turnover

Marron : Cell polarity and structure

Violet: Intermediate and energy metabolism

Bleu clair : Membrane biogenesis and traffic



L i n t e r a c t o m e
L’interactome

Liste de toutes les interactions entre toutes les macromolécules d’une cellule, d’un type cellulaire, d’un organisme

Employé par défaut pour

décrire l ’ensemble des

interactions protéine-protéine


L interactome motivation

L’interactome (motivation)

Les protéines n’agissent pas seules et les processus cellulaires reposent dans leur grande majorité sur des interactions spécifiques entre protéines

Après avoir établi la liste des composants protéiques individuels (d’après les résultats du séquençage), une tâche essentielle est maintenant de déchiffrer la sructure, la dynamique, l’évolution des réseaux d’interaction

Identifier quels sont les partenaires connus d’une protéine inconnue pourra nous aider à en comprendre la fonction


Genome

Transcriptome

Proteome

Interactome


Les interactions quelques d finitions
Les Interactions :quelques définitions

Interactions moléculaires

  • Il y a interaction moléculaire entre le gène Aet le gène B si le gène A(ou son ARNm ou son produit) interagit directement au niveau moléculaire avec le gène B(ou son ARNm ou son produit) --> Il existe un contact physique entre macromolécules.

  • La majorité des interactions décrites sont de 3 types:

    • Protéine-ADN

    • Protéine-ARN

    • Protéine-Protéine

  • Les interactions peuvent être orientées (Protéine-ADN, Protéine-ARN)ou non orientées(Protéine-Protéine).


Les Interactions :quelques définitions, suite

Interactions et réseaux

  • Un ensemble d’interactions forme un réseau d’interactions

  • Un réseau peut illustrer les relation fonctionnelles existant entre gènes/protéines

  • Un réseau peut être représenté par un graphe orienté ou non

B

E

•A-->B:interaction directe

• A-->C-->D-->F-->G:

Interactions indirectes

• En bleu : le réseau

D

A

F

C

G


Les Interactions :quelques définitions, fin

  • Interactions génétiques

  • Interactions indirectes entre gènes/protéines (mais aussi directes)

  • Analyse et mise en évidence au niveau du phénotype de l’animal

  • Quelques Propriétés des interactions

  • Spécifiques

  • Dynamiques

  • Dépendantes des caractéristiques intrinsèques de la protéine (modularité structurale, temps de 1/2 vie, localisation…)

  • Nombre ?

  • Eléments de base des réseaux de régulation


Tucker, Gera, and Uetz

TCB, 2001

CARTE D’INTERACTIONS Protéine-Protéine

LEVURE, 1200 protéines


CARTE D’INTERACTIONS PP LEVURE

1548 protéines, 2358 interactions

Gris : Chromatine structure

Bleu : Membrane fusion

Vert : Cell structure

Jaune : Lipid metabolism

Rouge : Cytokinesis

Schikowski et al. (2000), Nat.Biotech., 18, 1257-1261


Les réseaux protéines-ADN

Facteurs de

Transcription

Gène 1

Gène 2

Gène 3

.....

Un trait liant 2 points

Sur la circonférence

Représente une interaction

Protéine-ADN

Comment évolue la dynamique

des réseaux P-ADN en fonction des conditions physiologiques ?

Crédit: N. Luscombe


Cycle cellulaire

Sporulation

Diauxic shift

Réparation du DNA

Stress

Utilisation du réseau dans differentes

Conditions physiologiques

Crédit: N. Luscombe


On dispose maintenant, grâce aux approches à grande échelle (double hybride, Chromatin IP) de milliers d’interactions binaires entre protéines ou entre protéines et ADNQue faire avec cette masse de données ??

  • décrire les caractéristiques de l'organisation du protéome/interactome= statistique, approche descriptive

  • prédire certaines « règles » à partir de l'observation du réseau = inférence, approche prédictive


Analyse fonctionnelle du réseau

Comptage des interactions entre groupes fonctionnels

Schwikowski et al. (2000), Nat.Biotech., 18, 1257-1261


Un r seau ppi de levure

Analyse structurale et fonctionnelle de réseaux d’interaction

Un réseau PPI de levure

Quelles caractéristiques structurales peut-on mettre en évidence ?


Un r seau ppi de levure1

Analyse structurale et fonctionnelle de réseaux d’interaction

Un réseau PPI de levure

Deletion phenotype:

Red = lethal

Green = non-lethal

Orange = slow growth

Yellow = unknown

Ce réseau représente un

type d’organisation dit

« scale-free »

  • La plupart des nœuds (protéines) ont peu d’interactions

  • Un petit nombre de nœuds (hubs) sont connectés à un grand nombre de noeuds


Analyse structurale et fonctionnelle de réseaux d’interaction

Des mesures topologiques pour

caractériser un réseau

Degré de

connectivité

Coefficient de

clusterisation

Longueur de chemin

Crédit: N. luscombe


Méthodes d’analyse de graphes d’interactions protéine-protéine

Comment identifier à l’intérieur du graphe des groupes de protéines reliées fonctionnellement ?

  • • Approches :

  • distance dans le graphe

  • connectivité des protéines

  • densité

Peu dense

Dense (clique)

Crédit: C. Herrmann


Caract ristiques statistiques
Caractéristiques statistiques protéine-protéine

  • connectivité k d'une protéine = nombre de voisins

k = 4

kin = 1

kout = 3

  • si le réseau est dirigé (réseaux protéine-ADN) , on distingue kin et kout

Crédit: C. Herrmann


Caract ristiques statistiques1
Caractéristiques statistiques protéine-protéine

  • distribution de connectivité:

quelques protéines

fortement connectées = « hub »

beaucoup de protéines

faiblement connectées

Crédit: C. Herrmann


Interpr tation biologique 1 3
Interprétation biologique (1/3) protéine-protéine

  • particularité des protéines ayant un grand nombre d'interacteurs

    • protéines structurantesex.: PBS2 chez S. cerevisae, k=15protéine structurante (« échafaudage ») pour le complexe MAP-kinase

    • protéines létalesex.: Jeong et al. ont montré une corrélation entre la connectivité d'une protéine et son caractère létal chez la levure« plus une protéine a de partenaires, plus elle est essentielle »

Crédit: C. Herrmann


Interpr tation biologique 2 3
Interprétation biologique (2/3) protéine-protéine

  • Si des protéines ont une grande densité de connections ...

    ... c'est qu'elles forment un module fonctionnel

  • 2 type de modules fonctionnels

    • les complexes protéiques (interactions simultanées)

    • les voies de signalisation/voies métaboliques(interactions consécutives)

Crédit: C. Herrmann


Interpr tation biologique 3 3
Interprétation biologique (3/3) protéine-protéine

voie de transduction du signal déclenchée

par la phéromone

levure

module impliqué

dans la régulation du

cycle cellulaire

[Spirin & Mirny, PNAS 2003]

Crédit: C. Herrmann


Pr dire quoi

Peut-on utiliser les réseaux d'interaction pour faire de la prédiction ?

Prédire quoi ?

  • on dispose d'informations encore très partielles sur le rôle des protéines

[date: 9/11/2004]

les réseaux d'interactions sont un moyen

privilégié pour inférer des fonctions

Crédit: C. Herrmann


Observation: prédiction ?

les protéines de même

fonction ont tendance à

être en interaction directe

les unes avec les autres

source

d'erreurs

Règle inférée:

on peut déduire la fonction

d'une protéine à partir des

fonctions de ses voisines

Exemple de prédiction à partir d’un réseau d'interaction PP levure[Schwikowski et al., Nature Biotech 2000]

Crédit: C. Herrmann


Comment peut-on systématiser les prédictions fonctionnelles faites à partir de réseaux d’interactions ?

Utilisation de la clusterisation fonctionnelle

Exemple de la méthode Prodistin (PROtein DIStance based on INteractions

Brun et al., Genome Biology

(2003) R, R6


What can be inferred about the functional relationships fonctionnelles faites à partir de réseaux d’interactions ?

between A and B on the one hand and C and D on the other ?

A

B

C

D

Tucker, Gera and Uetz

Trends in Cell Biology, March 2001

C and D interact directly and share several common interactors,

whereas A and B do not

It is likely that the network (cellular) functions of C and D are related

whereas that of proteins A and B are not


Principles of our functional classification method prodistin
Principles of our functional classification method (ProDistIn)

… Do not compare proteins themselves

but…

…compare the lists of their interactors…

•Etablish a functional distance between proteins using lists of common and specific interactors

• Calculate the distance for all possible pairs of proteins

• Perform a clusterisation (NJ)

• Visualisation of result as a tree (dendrogram)


Z (ProDistIn)

1- Czekanovski-Dice distance for protein pairs

i

j

k

l

m

X spec + Y spec

1 + 4

D(X, Y) =

=

= 0.45

Y

8 + 3

(X UY) + (X  Y)

X

c

a

b

f

g

h

In order to make a functional comparison between N proteins:

- calculate D for all pairwise comparisons of proteins

- fill in a distance matrix

e

X

Y

Z

T

d

X

-

0.45

0.5

0.77

2- distance table for all possible pairs

Y

-

0.6

0.66

Z

-

0.84

n

o

p

Apply a clusterisation method (e.g. NJ) and

build a functional similarity tree

T

-

X

T

Y

Z

T

3- clusterisation and tree drawing

ProDistIn : the 3 first steps


Test on the yeast proteome

Data from : (ProDistIn)

• Double-hybrid screens (Fromont-Racine et al., Uetz et al., Ito et al.)

• literature (via MIPS and YPD)

• Information Extraction on Medline yeast abstracts

Test on the yeast proteome

• A total of 2946 direct protein-protein interactions involving 2143 proteins

• Only proteins with at least 3 interactors are considered further

  • =>Classification of 602 yeast proteins (10% of the proteome)


RESULT : (ProDistIn)

FUNCTIONAL

PROXIMITY

TREE

FOR 602

YEAST

PROTEINS


Il existe maintenant des bases de donn es d di es aux interactions

(ProDistIn)Les interactions sont devenues en quelques années des données essentielles pour analyser et comprendre les fonctions des gènes et protéines

• Pour chaque organisme et dans chaque type cellulaire, il existe probablement des dizaines, centaines de milliers voire millions d’interactions moléculaires différentes

• Il est nécessaire de stocker informatiquement les données relatives aux interactions

Il existe maintenant des bases de données dédiées aux interactions

Exemple des bases DIP et BIND …


Vision classique (ProDistIn)

Nouvelle vision

A

A

S

(Substrat)

P

(Produit)

La fonction de la protéine A

est définie par

son action de transformation

du substrat (S) en produit (P)

La fonction de la protéine A

est définie par

Le contexte des ses interactions avec d ’autres produits dans la cellule

La biologie à grande échelle conduit à

un changement de vision

de la fonction des protéines


C ’EST FINI ! (ProDistIn)


Le double-hybride dans la levure (ProDistIn)

  • Uetz et al. (2000) Nature, 403:623-627

  • Ito et al. (2000) PNAS, 97:1143-1147


Le double-hybride dans la levure : (ProDistIn)

bas-débit et haut-débit

Schächter (2002)


Le double-hybride dans la levure : (ProDistIn)

automatisation

Kumar and Snyder (2001)


PRINCIPAUX CRIBLES DOUBLE-HYBRIDE A GRANDE ECHELLE (ProDistIn)

Schachter (2002) DDT,7:S48-S54


Avantages et inconvénients des deux méthodes (ProDistIn)

  • Approche double-hybride :

  • + Mise en évidence d’interactions binaires  carte d’interactions

  • + Automatisable

  • Nombreux faux positifs  des appâts semblent interagir avec beaucoup de protéines car ils sont auto-activateurs, pb des proies collantes

  • Nombreux faux-négatifs  repliement incorrect, localisation subcellulaire incorrecte, absence de modification post-traductionnelle

  • Ne met en évidence que les interactions « durables »

  • Approche Spectrométrie de masse :

  • + On peut détecter les interactions du signalling

  • - Impératif de stabilité, solubilité, temps, concentration, taille

  • Approche chromosomique : pb tag des gènes essentiels


ad