les biopuces et le grand s quen age des outils pour comprendre le vivant l chelle g nomique n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Les biopuces et le grand séquençage: des outils pour comprendre le vivant à l’échelle génomique PowerPoint Presentation
Download Presentation
Les biopuces et le grand séquençage: des outils pour comprendre le vivant à l’échelle génomique

Loading in 2 Seconds...

play fullscreen
1 / 57

Les biopuces et le grand séquençage: des outils pour comprendre le vivant à l’échelle génomique - PowerPoint PPT Presentation


  • 139 Views
  • Uploaded on

Les biopuces et le grand séquençage: des outils pour comprendre le vivant à l’échelle génomique. Partie 3: applications. Philippe Kastner. ESBS – septembre 2009. Utilisation des biopuces pour l’étude du transcriptome. Conception d’une expérience de microarray Méthodes d’analyse

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Les biopuces et le grand séquençage: des outils pour comprendre le vivant à l’échelle génomique' - brandon


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
les biopuces et le grand s quen age des outils pour comprendre le vivant l chelle g nomique

Les biopuces et le grand séquençage: des outils pour comprendre le vivant à l’échelle génomique

Partie 3: applications

Philippe Kastner

ESBS – septembre 2009

slide2
Utilisation des biopuces pour l’étude du transcriptome
  • Conception d’une expérience de microarray
  • Méthodes d’analyse
  • Exemples d’application
comment concevoir une exp rience de microarrays
Comment concevoir une expérience de microarrays ?

But: déterminer les variations biologiques entre différents échantillons.

Mais il faut distinguer celles-ci des variations

liées à la technologie, ou à celles liées à la variabililé intrinsèque des échantillons

slide6

Différences d’expression réelles ou artéfactuelle ?

6 échantillons: A1, A2, A3, B1, B2, B3

Microarray comprenant 20 000 gènes

échelle d’expression: 1- 10000

Mesures pour un gène X

Test t: p = 0,01

Pour combien de gènes une telle valeur peut-elle être obtenue par hasard ? (« false discovery rate », ou FDR)

slide7

Estimation du nombre de gènes différentiels « réels »

La moitié des gènes différentiels est artéfactuelle !

Solutions: multiplier les réplicats

augmenter la stringence des critères de sélection.

slide8

Combien de réplicats sont-ils nécessaires pour une expérience réussie ?

variabilité

deux grands types de m thodes de clustering
Deux grands types de méthodes de « clustering »
  • Méthodes hiérarchique: génération d’un dendogramme (arbre) qui relie tous les gènes ou échantillons entre eux.
  • Méthodes par partitionnement, qui divise les gènes en K classes ayant des profils similaires (K défini par l’utilisateur)

- K-means

- Self-organizing maps (SOM)

- analyse par composantes principales (PCA)

regroupement en fonction de profils d expression similaires
Regroupement en fonction de profils d’expression similaires

700 gènes

1. Gènes

Évolution temporelle de l’expression des gènes dans des fibroblastes humains stimulés par du sérum (Pat Brown, 1997)

(Première expérience publiée de microarrays)

Visualisation d’une chorégraphie de l’expression génique dans le temps.

slide11

Fold Changes

-6

-4

-2

1

+2

+4

+6

Genes belonging

to one cluster

Different cell lines to be compared

Regroupement en fonction de profils d’expression similaires

2. échantillons

slide12

Méthodes par partitionnement

(K-means, Fuzzy C-means, Self organizing maps)

  • N expériences
  • chaque gène est considéré comme un vecteur dans un espace de dimension N (coordonnées = valeurs d’expression dans chaque expérience)
  • Partitionnement des gènes en K classes optimisées selon des critères de proximité des gènes dans l’espace vectoriel
slide13

Analyse par partitionnement de données correspondant à 5 types de leucémies T (20 groupes)

Visualisation et sélection des classses de gènes intéressantes

slide14

Analyse par partitionnement de données correspondant à 5 types de leucémies T (20 groupes)

Ikaros

bcat

TelJak2

Tal-Lmo1

slide15

B-catenin ICN1 Ikaros TelJak2 Tal-Lmo1

Visualisation des clusters FCM (4208 genes)

applications des microarrays
Applications des microarrays

1. Expression différentielle

Question: pourquoi B est-il différent de A ?

(KO vs WT; effet d’un traitement; sain vs malade, etc …)

Comparaison de A et B

200 gènes différentiels !!

Et ensuite ??? ….

Extraction d’un sens biologique

  • Analyse biographique
  • Annotation fonctionnelle des gènes (gene ontology: codification des annotations)

Identification de gènes candidats ou voies moléculaires

exemple 1 lymphomes thymiques chez des souris mutantes pour le g ne ikaros
Exemple 1: Lymphomes thymiques chez des souris mutantes pour le gène Ikaros

Recherche de la voie moléculaire impliquée dans le développement de ces tumeurs par une analyse du transcriptome.

slide18

6 IkL/L tumors

Genes specifically deregulated in IkL/L tumors ?

4 Tel-Jak2 tumors

5 non tumoral thymocytes

Conception expérimentale

slide19

IkL/L tumors

TelJak2 tumors

IkL/L tumor

pT

Hes1

Deltex 1

Notch1

Notch upregulation is associated with tumors lacking Ikaros

Notch pathway signature

Expérience fondatrice d’un projet concernant le rôle d’Ikaros dans la régulation de la voie Notch.

applications des microarrays1
Applications des microarrays

2. Transcriptome comme mesure phénotypique d’un système biologique

Concept: Profil apparenté de l’expression des gènes implique une similitude d’état biologique

Application principale: classification des tumeurs

slide21

2285 échantillons de tumeurs

de 20 types de cancer différents

2198 probe sets

Meta-analysis of 2285 tumors, from 20 different cancer types

Projet « carte d’identité des tumeurs » de la Ligue contre le Cancer

slide22

Example 2 : Cancer Expression Analysis

  • Large Diffuse B-Cell Lymphomas (LDBCL)
  • No reliable indicators to subtype them
  • Analysis of >100 LDBCL samples, as well as normal subsets of B lymphocytes
  • Hybridise to 18K human “lymphoma” slide
  • Alizadeh et al. , Nature 2000
  • Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling.
slide25

Mortality and LDBCL

Pronostic différent pour les deux groupes de tumeurs

signature transcriptomique
Signature transcriptomique

Ensemble de gènes caractéristiques d’un état biologique donné

  • type cellulaire (ex: signature des pDCs)
  • stimulation d’une voie moléculaire (ex: Notch)
slide27

Exemple 3: analyse de la signature de cellules dendritiques plasmacytoïdes

Liu et al, Nature Immunol, 2004

slide28

Comment les pDCs se développent-elles ?

Controverses dans la littérature:

Les pDCs sont-elles apparentées aux cellules myéloïdes (macrophages, monocytes) ou lymphoïdes (lymphocytes) ?

Les pDCs sont-elles apparentées aux autres types de cellules dendritiques « conventionnelles », impliquées dans la présentation des antigènes ?

slide29

Une vue génomique des cellules dendritiques

  • Assemblage de profils d’expression génique pour la plupart des types cellulaires immunitaires (macrophages, neutrophiles, lymphocytes B, T, NK, pDCs, cDCs) = « compendium »
  • Pour l’homme et la souris
  • Clustering pour visualiser les distances entre lignage
  • Identification de programmes d’expression géniques conservés

Robbins et al, 2008 (Genome Biology)

slide30

Similitude des profils transcriptomiques des DC

1. SOURIS

Principal component analysis (PCA)

(Projection on first 2 dimensions)

Hierarchical clustering

slide31

Similitude des profils transcriptomiques des DC

Publicly available datasets on Affymetrix U133 v2

2. HOMME

slide32

Signature des DC de souris

Pan-DC genes

Conventional DC genes

pDC specific genes (500 genes)

(Fuzzy C-means clustering)

slide33

Signatures des DC humaines

Conventional DC genes

Pan DC genes

pDC genes

slide34

Gènes les plus fortement associés à des types de cellules spécifiques

Rouge: connu pour être spécifique de ces lignages

slide35

Conclusion des études transcriptomiques

  • Proximité des programmes géniques des pDC et cDC: les DC constituent-elles une branche développementale séparée du système hématopoîétique ?
  • Signatures conservées entre l’homme et la souris
  • Les gènes spécifiques des DCs sont largement inconnus
les pdc sont elles bloqu es dans leur diff renciation dans la moelle osseuse
Les pDC sont-elles bloquées dans leur différenciation dans la moelle osseuse ?

Présence d’une population exprimant un marqueur des pDC, 120G8, mais pas B220

slide38

La population 120G8+ mutante appartient-elle au lignage des pDC ?

Analyse du transcriptome (Affymetrix: 45000 gènes)

Comparaison à divers types cellulaires hématopoïétiques

slide39

(scatter plot)

Surexpression de la plupart des gènes dérégulés

slide40

Visualisation des gènes spécifiques des populations WT et mutantes

Clustering hiérarchique)

Les pDC IkL/L possèdent la signature pDC

Dérégulation (surexpression) d’un grand nombre de gènes

Sous-signature commune avec les DC conventionnelles

applications des microarrays2
Applications des microarrays

3. Data mining

Recherche d’informations « cachées » dans les données de transcriptome

Confrontation des données:

- à d’autres sets de données transcriptomiques

- aux données de séquence et d’organisation des génomes

- aux données de fonctions des gènes

slide42

Exemple 5: Profils d’expression et recherche de motifs régulateurs

Nature Genetics 22, 281 (1999)

Question: En confrontant les séquences des promoteurs de gènes co-régulés, peut-on découvrir de nouvelles séquences régulatrices ?

  • Données: de transcriptome du cycle cellulaire de levure (2 cycles)
  • partition en 30 classes de gènes (K-means)
  • pour chaque classe:
  • Enrichissement par rapport à une fonction ?
  • Présence de motifs spécifiques dans les promoteurs (1kb en amont du site d’initiation)?
  • méthode: déplacement d’une fenêtre de 10pb à travers la séquence, recherche de séquences homologues dans les autres gènes du cluster
  •  calcul d’un score (MAP score). Si MAP score >10 , = significatif
slide43

18 motifs dans 12 clusters

Motifs spécifiques d’un cluster donné

Éléments régulateurs connus et inconnus

Identification de nouveaux sites régulateurs

slide44

Gènes co-exprimés

Motif régulateur commun ?

Présence d’un ou plusieurs motifs donné

Gènes corégulés ?

general scheme 1
Generalscheme (1)
  • clustering-based approaches for finding motifs from gene expression and sequence data

classify

general scheme 2
Generalscheme (2)
  • sequence(/knowledge)-based approaches for finding motifs from gene expression and sequence data
slide47

Données: levures cultivées dans différentes conditions

Etude des promoteurs des groupes 1 et 4: enrichissement de deux motifs régulateurs, PAC et RRPE, souvent présents de façon conjointe.

slide48

Question: la présence de l’un ou des deux motifs PAC et/ou RRPE permet-elle de prédire la régulation du gène correspondant?

Très bonne corrélation des profils d’expression qui contiennent la suite RRPE, PAC

slide49

Exemple 6: découverte de fonction de gènes

Idée: gènes aux fonctions similaires sont régulés de façon similaire

Compendium : base de données de profils d’expression

(levures cultivées dans différentes conditions, souches mutantes, etc …)

Gène à la fonction inconnue:

- profil d’expression similaire à ???

- Souche mutante pour ce gène: profil similaire à ???

slide50

Exemple: découverte de la fonction du gène YER044C

Souches mutantes

Gènes

Forte association avec des gènes impliqués dans la synthèse de l’ergostérol

Validation fonctionelle

slide51

Exemple 7: recherche de gènes voisins co-régulés

Question:la comparaison des profils d’expression géniques et des localisations chromosomiques permet-elle d’identifier des région de gènes corégulés ?

Données: cycle cellulaire de la levure

1. Pour tous les couples de gènes, calcul des corrélation des profils d’expression (valeurs entre -1 et 1)

2. Représentation par ordre sur les chromosomes

slide53

Exemple 8: influence de la localisation chromosomique sur le niveau d’expression génique

Question: l’expression des gènes humains varie-t-elle en fonction de domaines chromosomiques ?

  • Mesure du niveau d’expression de tous les gènes humains dans 12 tissus (SAGE)
  • Représentation du niveau d’expression en fonction de la position géographique sur les chromosomes
slide54

Exemple: chromosome 11

  • Identification de domaines d’expression génique élevée (RIDGE)
  • influence de l’environnement chromosomique large sur la façon dont un gène est exprimé

Positions sur le chromosome

Intégration du niveau d’expression sur une fenêtre de 39 gènes

tissus

biopuces
Biopuces
  • Analyse sans à priori des systèmes biologique: outils puissant générer des hypothèses
  • Analyse globale, permettant de révéler des propriétés nouvelles, non visibles par des études restreintes.