Présentation du projet de mission professionnelle - PowerPoint PPT Presentation

slide1 n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Présentation du projet de mission professionnelle PowerPoint Presentation
Download Presentation
Présentation du projet de mission professionnelle

play fullscreen
1 / 20
Présentation du projet de mission professionnelle
148 Views
Download Presentation
xanto
Download Presentation

Présentation du projet de mission professionnelle

- - - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

  1. Arnaud Felten – M2.1 Bioinfo Conception et réalisation d’un environnement logiciel pour l’exploration et l’analyse phylogénétique des microbiomes Présentation du projet de mission professionnelle Encadrant : Catherine Dauga Tuteur universitaire : Josselin Bodilis Mardi 27 Mars 2012

  2. Objectifs • Comparer la performance des technologies 454 et Illumina pour le séquençage de microbiome • Evaluer différentes méthodes d’analyses : logiciel et banque • Proportion d’artefacts et de chimères • Proportion des OTUs rares • Qualité de l’identification taxonomique • Efficacité du filtrage • Concevoir une stratégie d’analyse des microbiomes • utilisant les meilleurs outils testés et leurs paramètres • intégrés dans un système de Workflow Janvier 2012

  3. Méthodologie Seq 16S Synthetic data Serveur NCBI/RDPII ptaxoptimizer pblastall  Best hit Silva/Greengenes NCBI/RDPII script Optimisation du fichier de sortie  tabulation taxonomique script Silva/Greengenes traitement des résultats et représentations graphiques

  4. Analyse et représentation des données avec R • Bibliothèque de fonction • lecture csv • dénombrement de la taxonomie • calcule sensibilité/spécificité Script modèle « à trous » Création d’un script adapté aux données à partir de la technologie et du domaine utilisé ainsi que de la nature des séquences initiales • Scripts représentations graphiques • histogramme • nuage de points • (radar plot) • ajout des légendes/titres… • production d’un PDF

  5. Automatisation NGS readsimulators : MetaSim, ART, … Seq 16S Synthetic data Serveur NCBI/RDPII ptaxoptimizer pblastall  Best hit Silva/Greengenes NCBI/RDPII script script Silva/Greengenes

  6. Simulation : “Mono bacteria” • Mockcommunities : “mono bacteria” • Une seule espèce d’un seul genre bactérien • Acinetobacter, • Helicobacter, • Enterococcus, • (Akkermansia) • 454 / Illumina • ARNr16S : complet / régions V5-V6 • 1000 reads par échantillon • Temps d’analyse : 1h pour 1 bactérie / 1 technologie / 1 domaine • 11/2 semaines pour répétitivité X100 (400 000 BLAST) • Analyse sur la base de données RDP II

  7. Analyse « mono-bacteria » 454/illumina

  8. Analyse « mono-bacteria »V5-V6/full length

  9. Simulation “multi-phyla” Mockcommunities • Plusieurs espèces d’un ou plusieurs phyla • Protéobacteria, • Firmicutes, • Bacteroidetes, • Actinobacteria, • Fusabacteria • 454 / Illumina • ARNr16S : complet / régions V5-V6 (V4) • 5 000 reads

  10. Bases de données ARNr 16S 16S Microbial SSURef 11/11 108 Mothur 2011 BLAST RDPII SSURef Ref Souche type 10.28 05/11 10.28

  11. Analyse « multi-phyla » 454

  12. Analyse « multi-phyla »Illumina

  13. Analyse « multi-phyla»Rapport faux positifs et NA sur correctement identifiés

  14. Simulations “microbiote cryptes souris” Mockcommunities • Plusieurs espèces venant d’un même phylum • Proteobacteria, • 454 / Illumina • ARNr16S : complet / régions V5-V6 (V4)  50 000 reads

  15. Composition microbiote cryptes souris (données réelles) Pseudomodales

  16. Composition et phylogénie des données synthétiques 90% 0,5% 0,5% 2,5% 1,5% 2,5% 2,5%

  17. Analyse des résultats de la simulation crypte souris454

  18. Analyse des résultats de la simulation crypte sourisIllumina

  19. Analyse des résultats de la simulation crypte sourisIdentification à l’espèce

  20. Perspectives à court et moyen terme Poursuite des simulations de données: • Simulation et analyse crypte souris : Firmicutes • Simulation d’un microbiote complet de souris •  37 bactéries provenant de 5 phyla • Génération de données avec ART et évaluation des méthodes de filtrage (qualité) • Evaluation des détecteurs de chimères sur les données réelles • Autres méthodes (MEGAN, RDP classifier) Analyse des séquences : Analyse des OTUs : • Uclust, QUIME, Mothur, TreePhyler, ARB