1 / 10

Les bases de données biologiques au LBBE

Les bases de données biologiques au LBBE. Le système ACNUC Bases de données  généralistes  Bases de données développées au labo Accès aux bases de données. Journées du laboratoire 1-2 Juin 2005. Simon Penel. Le système ACNUC Système de requête sur les séquences biologiques.

jabir
Download Presentation

Les bases de données biologiques au LBBE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Les bases de données biologiques au LBBE • Le système ACNUC • Bases de données  généralistes  • Bases de données développées au labo • Accès aux bases de données Journées du laboratoire 1-2 Juin 2005 Simon Penel

  2. Le système ACNUCSystème de requête sur les séquences biologiques • Développé au laboratoire (M. Gouy) • Génération d’index à partir des annotations de séquences • Permet de retrouver les séquences à partir de mot clefs, de la bibliographie, de la taxonomie, de la date, du type de séquence, du type de molécule • Séquences « mères » et « filles » • Permet d’extraire les séquences sous différents formats, de récupérer les annotations • Accès ACNUC local : API en C • Accès ACNUC à distance, mode client serveur (sockets) , API en C

  3. Bases de données généralistes structurées sous ACNUC maintenues au laboratoire • Mise à jour automatique: • GenBank Séquences nucléiques - 2 milions de CDS (NCBI) • EMBL Séquence nucléiques - 2 milions de CDS • Uniprot(anciennement SwissProt + TrEMBL + PIR) - 2milions de protéines • et aussi.... • Ensembl Génomes complets métazoaires • Genome Reviews Génomes complets bactériens (EBI) • Complete Protéomes (EBI) • HAMAPGénomes microbiens(SIB)

  4. Bases de données de familles de gènes développées au labo et/ou en collaboration • Bases de données de familles de gènes • protéines ET/OU séquences nucléiques • Familles de gènes/protéines • Alignement • Arbre phylogénétique (avec évènement de spéciation et duplication) • Applications: • Evolution moléculaire • Prédiction de fonction de gène • Phylogénie des espèces • Cartographie comparée • Génétique des populations • Utilisation des ressources du centre de calcul de l’IN2P3 (P. Calvat) • parallèlisation des calculs (BLAST, CLUSTALW) : gain 20 x à 50 x

  5. Bases de données de familles de gènes généralesFamilles de gènes homologues • Hobacgen Bactéries & levures (G. Perrière) Hogenom • HovergenVertébrés 250 000 séquences (L. Duret) • HoGenom Génomes complets 650 000 séquences (L. Duret, S. Penel) • Projet Européen Temblor/Integr8 (EBI) • Homolens Génomes complets de Ensembl 250 000 séquences

  6. Bases de données plus spécialiséesCollaborations au sein du LBBE ou avec labos extérieurs • HoppsigenA. Khelifi (LBBE) Familles de retroélements, retropseudogènes • RTKdbJ. Grassot (LBBE/ Centre de Génétique Moléculaire et Cellulaire) Familles de Récepteurs Tyrosine Kinase • Nurebase(LBBE/ENS-Lyon) Familles de Récepteurs Nucléaires • PolymorphixE. Bazin ( Laboratoire « Génome Populations Interactions Adaptation ») Familles de séquences polymorphes • TaxoBacGenG. Devulder (LBBE) Taxonomie des génomes bactériens • EMGLibG.Perrière (LBBE) Génomes bactéries et levures, annotations corrigées • GemCoreV. Navratil, (LBBE, INRA) SNiPs, cartographie comparée • Futur : • Familles de gènes homologues de plantes • Fusion Hogenom + Homolens • Hovergen: Vertébrés  Métazoaires ( x 2) • Tout Uniprot ( 2 millions de séquences, x10)

  7. Accès au banques • query, query_win en local à partir de pbil, biomserv, pbil2 (M. Gouy) • Requêtes sur les banques • Visualisation, extraction de données • query_win en mode client-serveur sur Mac et PC (S. Delmotte, M. Gouy) • seqinR en mode client-serveur (D. Charif, S. Delmotte, J. Lobry) • Serveur Web du PBIL (S. Penel, G. Perrière) • Requêtes sur les banques • Recherche avec BLAST • Visualisation, extraction de données • FamFetch (banques de familles): application Java (G. Perrière) • Recherche et visualisation des familles • Recherche de motifs dans les arbres (J.F. Dufayard)

  8. Accès au banques • query, query_win à partir de pbil, biomserv, pbil2

  9. Accès au banques • Serveur Web du PBIL

  10. Conclusions • De nombreuses banques • De nombreux outils • Grosses capacités de calcul (IN2P3) • Compétences en modélisation, conception, mise en place et maintenance des banques • Favoriser • l’utilisation des banques • le développement de nouvelles banques associées à différentes thématiques au sein du laboratoire

More Related