1 / 11

Informatique en Biologie 2004 - Institut Pasteur

S P I N S earch in P rotein I nteraction N etwork. Elisabeth Rémy Karine Robbe Mathieu Barthélémy Tuteur : Thierry Rose. Informatique en Biologie 2004 - Institut Pasteur. S earch in P rotein I nteraction N etwork : La fonction d’une protéine peut être déduite

sorcha
Download Presentation

Informatique en Biologie 2004 - Institut Pasteur

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. S P I N Search in Protein Interaction Network Elisabeth Rémy Karine Robbe Mathieu Barthélémy Tuteur : Thierry Rose Informatique en Biologie 2004 - Institut Pasteur

  2. Search in Protein Interaction Network : La fonction d’une protéine peut être déduite de celle de ses partenaires. LISTER : - récupérer ou créer des listes d’interaction protéine/protéine, - normaliser leur format, - éliminer les redondances, - constituer les listes de références. SPIDER : - utiliser les listes de référence pour retrouver le graphe connexe qui contient une protéine requête, suivant des contraintes fixées. GRAPHER : - représenter les graphes. Informatique en Biologie 2004 - Institut Pasteur

  3. Architecture Bases de données DIP : 45000 intéractions BIND : 75000 intéractions … Futur Puces Text mining … Création - Prédiction Rosetta stone Profiles de conservation Gènes voisins … LISTER SPIDER Saisie Le chercheur … GRAPHER Informatique en Biologie 2004 - Institut Pasteur

  4. Choix du format des données DIP XML PSI MI BASE DE DONNEES direct XML au format PSI MI LISTE SIMPLE BIND Texte simple Texte délimité par des tabulations XML PSI MI Maker Flattener Saisie Analyseur syntaxique : Module EXPAT de Python Informatique en Biologie 2004 - Institut Pasteur

  5. LISTE SIMPLE : OBJECTIF XML PSI MI : LISTE SIMPLE : RESULTAT

  6. Algorithme de prédiction d’intéraction : Rosetta stone Marcotte et al., 1999. Parfois, 2 protéines A et B d’un organisme sont fusionnées dans un autre organisme. Les protéines A et B ont des chances d’interagir. S. cerevisiae topo II E. coli gyrB E. coli gyrA Base non redondante (nr) : 2 768 300 protéines... E. coli x S. cerevisiae 4300 x 6200 Informatique en Biologie 2004 - Institut Pasteur

  7. Algorithme de prédiction d’intéraction : Rosetta stone pb formatdb my_db query_file iterator BioFasta look for pairs rosetta pairs history une ligne par paire : concatenation de 2 lignes de la sortie Blast : historique de l’association en paire. buil simple list build fasta file list_pairs liste des paires, tuples de gi. list_ids liste des gi de chaque protéine impliquée dans une paire prédictive. fichier FASTA (requêtes au NCBI) Informatique en Biologie 2004 - Institut Pasteur

  8. Algorithme de prédiction d’intéraction : Rosetta stone fonction look for pairs single_query query_file iterator BioFasta my_db fonction runblast : pb blastall -p blastp -e 0,001 -m 8 -d user/my_db -i single_query 1 ligne par hit : instanciations de la classe Hit la ligne est un attribut de Hit les paramètres sont définis ici (par défaut) méthode covers : recouvrement dans la protéine requête Q .............. Q .............. Q .............. si Hit.target est vrai, l’objet est placé dans une liste fonction extractpairs : stocke la position dans la liste des objets Hit formant une paire (méthode covers) -> liste de tuples de position fonction builsrosettalist : concatène les attributs line de 2 objets Hit formant une paire, ecrit la ligne dans un fichier Informatique en Biologie 2004 - Institut Pasteur

  9. Algorithme de prédiction d’intéraction : Rosetta stone temps d’exécution, paramètres et contrôles, optimisations S .cerevisiae x E. coli 6200 x 4300 1h35 de calcul NR 2 768 000 15 jours de calcul Faire varier le score, la taille des domaines d’homologie, des domaines non recouvrants. Informatique en Biologie 2004 - Institut Pasteur

  10. Saisie d’intéractions : Formulaire et CGI CGI avec méthode POST

  11. SPIN LISTER Bases de données DIP : 45000 intéractions BIND : 75000 intéractions … Futur Puces Text mining … DIP : 45000 intéractions Création - Prédiction Rosetta stone Gènes voisins … Rosetta stone LISTER SPIDER Profiles de conservation Saisie Le chercheur … GRAPHER Le chercheur

More Related