1 / 38

Ambroise Ingold (LIPN Université Paris 13)

Le 28 mars 2002. Mise en relation de Medline avec Flybase par l’identification dans Medline des gènes décrits dans Flybase et application à l’extraction d’informations sur les interactions génétiques ou moléculaires à partir de publications. Ambroise Ingold (LIPN Université Paris 13). Plan.

jalena
Download Presentation

Ambroise Ingold (LIPN Université Paris 13)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Le 28 mars 2002 Mise en relation de Medline avec Flybase par l’identification dans Medline des gènes décrits dans Flybase et application à l’extraction d’informations sur les interactions génétiques ou moléculaires à partir de publications Ambroise Ingold (LIPN Université Paris 13)

  2. Plan • Motivations • Identification des gènes dans Medline • Extraction d’information sur les interactions • Interface de la base de données • Perspectives

  3. La circulation de l’information Recherche Données d’expériences Publications Banque de résultats d’expériences Swissprot, Genbank BdD Bibliographiques Medline Encyclopédies en ligne Flybase

  4. Investigation dans les BdD Représentation des connaissances GED, informatique documentaire Indexation BdD Bibliographique Encyclopédies en ligne Réf. Biblio. Réf. rés. exp. Réf. Biblio. Réf. rés. exp. Indexation Banques de résultats d’expériences Bio-informatique

  5. MeSH Terms : • Amino Acid Sequence • Animal • Drosophila/genetics* • Drosophila/embryology • Epitope Mapping • Gene Expression • Gene Expression Regulation, Developmental* • Genes, Insect* • Helix-Loop-Helix Motifs/genetics • Immunohistochemistry • In Situ Hybridization • In Vitro • Molecular Sequence Data • Morphogenesis/genetics • Sense Organs/embryology* • Support, Non-U.S. Gov't • Gene Symbols : • da • emc • AS-C Medline (exemple) • Regulation of scute function by extramacrochaete in vitro and in vivo. • The pattern of adult sensilla in Drosophila is established by the dosage-sensitive interaction of two antagonistic groups of genes. Sensilla development is promoted by members of the achaete-scute complex and the daughterless gene whereas it is suppressed by whereas extramacrochaete (emc) and hairy. All these genes encode helix-loop-helix proteins. The products of the achaete-scute complex and daughterless interact to form heterodimers able to activate transcription. In this report, we show that (1) extra-macrochaete forms heterodimers with the achaete, scute, lethal of scute and daughterless products; (2) extramacrochaete inhibits DNA-binding of Achaete, Scute and Lethal of Scute/Daughterless heterodimers and Daughterless homodimers and (3) extramacrochaete inhibits transcription activation by heterodimers in a yeast assay system. In addition, we have studied the expression patterns of scute in wild-type and extramacrochaete mutant imaginal discs. Expression of scute RNA during imaginal development occurs in groups of cells, but high levels of protein accumulate in the nuclei of only a subset of the RNA-expressing cells. The pattern is dynamic and results in a small number of protein-containing cells that correspond to sensillum precursors. extramacrochaete loss-of-function alleles develop extra sensilla and correspondingly display a larger number of cells with scute protein. These cells appear to arise from those that in the wild type already express scute RNA; hence, extramacrochaete is a repressor of scute function whose action may take place post-transcriptionally. ?

  6. Flybase (Gène Wg) Genetic analysis demonstrates that wg is dispensable for efficient homeotic gene expression in the visceral mesoderm. (Tremml and Bienz, 1989) Medline Tremml G, Bienz M. EMBO J 1989 Sep;8(9):2687-93 An essential role of even-skipped for homeotic gene expression in the Drosophila visceral mesoderm. Exemple de lien de Flybase vers Medline

  7. BdD bibliographique Redondantes, non-ordonnées À jour, détaillées Fidèles, nuancées, contextualisées BdD factuelles Organisées, calculables Parcellaires, incomplètes Simplificatrices, hors contexte BdD bibliographiques vs BdD factuelles

  8. Exemple de couplage factuel/textuel • Domaine d’application • Gènes • Relations entre les gènes (interaction) Identification des gènes Medline Flybase Reconnaissance des interactions BdD interactions

  9. Argumentaire • Pas d’indexation des gènes dans Medline (ou très incomplète) • Les références bibliographiques dans Flybase sont incomplètes • Pas de BdD des interactions génétiques

  10. Réalisation • Système d’identification des gènes • Système d’extraction d’information sur les interactions

  11. Première partie Identification des gènes

  12. Identification des gènes (schéma) • Grandes étapes Medline 109 résumés 50 résumés Dictionnaire des gènes Flybase Confrontation Identification • Modifications • Manuelles • Automatiques Mise au point Test

  13. Identification des gènes (plan) • Le dictionnaire des gènes issu de Flybase • Méthode d’identification des gènes • L’amélioration du dictionnaire des gènes • Les résultats

  14. Le dictionnaire des gènes issu de Flybase • Exemple de gène • Nom complet : wingless • Symbole : wg • Synonymes : Spd, spade, fg, flag, Sp, Sternopleural, Br, Bristled, int-1, Dint-1, Dm-1et l(2)wg • Terminologie • Label : la chaîne de caractère • Gène : l’entité biologique • Définition : la relation entre le gène et le label

  15. Identification : Indexation et interprétation des labels Initially, eve expression in individual stripes is established by different regulatory elements, each of which responds to nonperiodic spatial cues provided, at least in part, by the gap genes even skipped (eve) stripes (str)

  16. Élimination des sous-chaînes Reconnaissance bloquée • These results, along with the intermediate SOP phenotype observed in Suppressor of Hairless; Hairless double mutant imaginal discs, suggest that the two genes act antagonistically to commit imaginal disc cells stably to alternative fates.

  17. Algorithme d’interprétation des labels • Confirmation de l’interprétation ? • Ambiguïté du label? • Plusieurs interprétations ? • Interprétation confirmée • Défaut de confirmation • Interprétation multiple • Interprétation simple Oui Non Oui Non Oui Non

  18. Confirmation des labels ambigus The different thoracic muscles of Drosophila are affected specifically in the mutants: stripe (sr), erect wing (ewg), vertical wings (vtw), and nonjumper (nj). We have tested the extent of this specificity by means of a genetic analysis of these loci, multiple mutant combinations, and gene dosage experiments. […] The locus stripe seems to have a polar organization where different allelic combinations show quantitative specificity in the muscle affected. « bande » stripe (sr) Interprétation confirmée

  19. Confirmation des labels ambigus (algorithme) • Confirmation de l’interprétation ? Oui • Interprétation confirmée

  20. Label ambigü non confirmé We demonstrate that posterior stripe boundaries are established by gap protein repressors unique to each stripe: h stripe 5 is repressed by the giant (gt) protein on its posterior border and h stripe 6 is repressed by the hunchback (hb) protein on its posterior border. « bande » Défaut de confirmation stripe (sr)

  21. Défaut de confirmation des labels ambigus (algorithme) • Confirmation de l’interprétation ? Non • Ambiguïté du label ? Oui • Défaut de confirmation

  22. Interprétation multiple Localization of the maternally synthesized nanos (nos) RNA to the posterior pole of the Drosophila embryo provides the source for a posterior-to- anterior gradient of Nos protein. Correct spatial regulation of nos activity is essential for normal pattern formation. nanos (nos) Nitric oxide synthase (Nos) Identification multiple

  23. Interprétation multiple (algorithme) • Confirmation de l’interprétation ? • Ambiguïté du label ? • Plusieurs interprétations ? Non Non • Interprétation multiple Oui

  24. Amélioration du dictionnaire des gènes • Nettoyage des données • Ajout de labels, de définitions et de gènes ou objet assimilé manquant • Caractérisation de l’ambiguïté des labels

  25. Performance (identification des gènes) • 88 % des identifications sont exactes. • Le programme trouve 86 % des identifications faite par l’annotateur.

  26. Améliorations possibles

  27. Deuxième partie Reconnaissance des interactions

  28. Grandes étapes (reconnaissance des interactions) Phrases annotées manuellement Liste d’interactions Phrases Phrases annotées automatiquement Comparaison Comparaison Liste d’interactions

  29. Calcul de l’IVI Phrase : We conclude that Notch signallingactivity is directlyresponsible for the accumulation of basic helix-loop- helix proteinsencoded by the Enhancer of split locus

  30. Extraction des interactions Phrase : We conclude that Notch signalling activity is directly responsible for the accumulation of basic helix-loop- helix proteins encoded by the Enhancer of split locus Notch Enhancer of split

  31. Performance de la reconnaissance des interactions

  32. Comparaison 2G et nG

  33. Troisième partie Interface de la base de données

  34. Formulaire d’annotation(graphiques synthétiques)

  35. Formulaire d’annotation(comparaison des annotations)

  36. Formulaire d’annotation(autres informations)

  37. Conclusion (Bilan) • Le couplage factuel-textuel • Identification des gènes Flybase dans Medline • Confrontation encyclopédie/texte • Méthode d’identification automatique des gènes • Étude usage • Reconnaissance interactions • Cooccurrence • Indice de pertinence • Simplicité, robustesse

  38. Conclusion (perspective) • Autres domaines d’applications • Couplage avec des résultats d’expériences • Interface Homme-Machine / Recherche documentaire

More Related