1 / 34

Ontologies pour l’astronomie

Ontologies pour l’astronomie. Nathalie Hernandez Josiane Mothe Laurent Cardonner. Objectifs. Représentation des informations via des ontologies (indexation) Etude des thesaurus existants Adéquation aux collections Mise à jour de la connaissance du domaine Découverte de connaissances

adamdaniel
Download Presentation

Ontologies pour l’astronomie

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Ontologies pour l’astronomie Nathalie Hernandez Josiane Mothe Laurent Cardonner

  2. Objectifs • Représentation des informations via des ontologies (indexation) • Etude des thesaurus existants • Adéquation aux collections • Mise à jour de la connaissance du domaine • Découverte de connaissances • Ontologie du domaine de la tâche / du contenu

  3. Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses Plan • Résultats des analyses via Syntex • Définition de mesures d’adéquation d’une ontologie par rapport à un corpus • Techniques de mise à jour • Définition de différents types d’ontologies adaptés à l’usage des données • Exemple de l’exploration des publications

  4. Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple • A notre disposition : • thesaurus de l’astronomie IAU • résumés d’articles publiés dans les revues A&A et APJ sur plusieurs années.

  5. Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Syntex : analyseur syntaxique de corpus • Intérêt : extraire syntaxiquement les expressions d’une collection documentaire [Bourigault & Fabre, 2000] • Deux phases • Pré-traitement par un étiqueteur • Analyse syntaxique • Originalité : apprentissage endogène [Bourigault & Lame, 2002]

  6. Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Résultats • APJ • A&A

  7. Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple IAU • Thesaurus (représentation terminologique du domaine de l’astronomie) crée en 1995 • 2863 termes dont 2222 expressions (magnetic field, X ray,…) • 5000 relations entre termes de plusieurs natures : • t1 BT t2 : terme t2 plus spécifique t1 • t1 NT t2 : terme t2 plus générique t1 • t1 U t2 : utiliser le terme t1 plutôt le terme t2 • t1 UF t2 : utiliser le terme t2 à la place de t1 • t1 RT t2 : t1 et t2 sont liés

  8. Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Recherche termes IAU / CORPUS • APJ • 1999 : 865 termes retrouvés • 2002 : 877 termes retrouvés • A&A • 1995 : 832 termes retrouvés • 2002 : 884 termes retrouvés • 588 termes communs aux 4 corpus  IAU adapté à l’indexation de nos corpus?  Mesures génériques (ontologie/thesaurus)

  9. Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses IAU en OWL • Ontology Web Language [http://www.w3.org/TR/owl-features/] recommandation du W3C • Transformation • Définition de concepts (différents labels)X Ray UF X-RayX Ray UF X-Ray radiationX Ray ; X-Ray, X-Ray radiation • Définition de relations (généricité/specificité, est lié à)

  10. Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses Analyse lexicale • Couverture ontologie / corpus • Pourcentage de termes de l’ontologie présents dans le corpus Choix ou non de l’ontologie comme point de départ • Couverture corpus / ontologie • Détection des concepts représentatifs des documents (tf.idf [Salton 71]) Proposition de nouveaux termes à ajouter

  11. Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses Analyse conceptuelle • Principe : « un concept est représentatif d’un domaine si il est en relation avec d’autres concepts du domaine » • Définition d’une mesure du pouvoir représentatif d’un concept • Définition d’une mesure du pouvoir représentatif d’une ontologie à partir de la mesure des concepts retrouvés dans les documents  Validation du choix de l’organisation des concepts dans l’ontologie

  12. Techniques de mise à jour Mesures d’adéquation Ontologies spécifiques à une tache Exemple Analyses Mise à jour des concepts • Ajout des termes représentatifs des documents dans l’ontologie • Nouveau label pour un concept • Nouveau concept utilisation des mesures de proximité sémantique de Syntex

  13. Techniques de mise à jour Mesures d’adéquation Ontologies spécifiques à une tache Exemple Analyses Mise à jour des relations • Spécification sémantique de la relation « est lié a » : (« événement lié à », « objet lié a ») • Détection de nouvelles relations entre concepts  utilisation des mesures de proximité sémantique de Syntex

  14. Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses • Nécessité de deux types ontologies : • Ontologie du domaine de la tâche : organisation des méta-données ou rôles des connaissances dans la réalisation d’une tâche • Ontologie du domaine abordé dans le corpus: représentation de la connaissance liée au domaine traité dans le contenu des documents  optimiser les tâches

  15. Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses Architecture

  16. Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses Cadre applicatif • Tâche: Exploration des publications dans les revues A&A et APJ • Collection à notre disposition • Expérience à partir de Tétralogie

  17. Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses Travaille avec Travaille pour CHERCHEUR nom prénom LABORATOIRE adresse A pour domaine d’intérêt Rédige Travaille pour depuis Est situé en ARTICLE ref Ecrit en DATE PAYS Publié dans Traite de LITTERATURE DU DOMAINE OBJET DE RECHERCHE Est un Est un Est un REVUE OUVRAGE ACTES DE CONFERENCE Ontologie du domaine de la tache d’exploration Construction semi-automatique

  18. Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses CORPS CELESTE a un spectre Est un Est un Est un Partie de Partie de SYSTEME SOLAIRE COMET ASTEROIDE Synonyme ETOILE PLANETOIDE Partie de Est un SOLEIL Est un événement lié Partie de ECLIPSE SOLAIRE COURONNE SOLAIRE Ontologie du domaine abordé dans le corpus Échantillon construit à partir de IAU et Factguru

  19. Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses Echantillon de l’ontologie de tâche au niveau instance Travaille avec Rédige CHERCHEUR nom Dupont prénom Jean ARTICLE Ref : 1 Traite de objet de recherche A pour domaine d’intérêt ETOILE Est un Echantillon de l’ontologie de domaine SOLEIL Est un Evénement lié à Partie de COURONNE SOLAIRE ECLIPSE SOLAIRE Liens entre les deux ontologies

  20. Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Prototype – interface de visualisation • Plusieurs niveaux de navigation • Niveau conceptuel : vue générale sur le corpus • Niveau instance : détails sur le corpus • Deux accès à la collection • À travers l’ontologie du domaine de la tâche • A travers l’ontologie du domaine abordé dans la collection

  21. Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Aperçu de l’interface

  22. Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Exploration via ontologie domaine tache

  23. Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Connaissance établie pour instance Chercheur

  24. Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Connaissance établie pour instance Article

  25. Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Exploration via ontologie domaine abordé dans corpus

  26. Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses Conclusion • IAU • Intégration d ’autres éléments : instances des concepts ? • Instruments, • objets - Exemple objets Lien avec Simbad • FACTGURU ?? [http://www.site.uottawa.ca:4321/astronomy/index.html]

  27. Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses Travaux à faire • Évaluation • Cadre • Réalisable • Définition de tâches • Mise à jour - Mots clés (oui avec niveau souhaité - Ontologie - Web sémantique) • Lien avec UCD

  28. Evaluation • Comparer l’adéquation d’échantillons de deux ontologies sur un même corpus, puis sur des différents (évolution du domaine)  Proposer les corpus et les deux ontologies

  29. particle photon particle wave pulsar psr radiation neutral particle electromagnetic wave high energy radiation celestial body Photon Electromagnetic radiation X ray X ray radiation X-ray X ray pulsar Background radiation celestial sphere X ray background X ray X-Ray X ray source X ray scattering X ray spectra X ray source X ray astronomy X ray binariesstar hard X ray wave soft X ray pulsar X ray pulsar Ontology A Ontology B Is related to Part of Is a Evaluation

  30. Ontologie • Ontologie : « spécification explicite et formelle d’une conceptualisation partagée» [Studer 1998] • Deux niveaux sémiotiques : • Lexical (termes) • Conceptuel (concepts et relations entre concepts) base pour la communication entre les machines, entre humains et machines

  31. Recherche d’information et ontologie • Intégration des ontologies dans un processus de recherche : • Réduction du silence : extension des requêtes à partir des termes et concepts de l’ontologie • Réduction du bruit : désambiguïsation des termes contenus dans la requête

  32. Recherche d ’information et Ontologie • Indexation des documents à partir des concepts de l’ontologie • Descripteurs choisis dans l’ontologie • Indexation à partir de concepts et non plus à partir de mots souvent ambigus  Choix d’une ontologie reflétant le ou les domaines de connaissance relatifs aux corpus

  33. Météorite Extrait d’une hiérarchie de concepts Météorite……………….chondrule Achondrite Chondrite Extraits des documents Chondrite carbonnée Chondrule Chondrule…….. Chondrule Exploration de collections documentaires à partir d’ontologies • Objectifs : • Aide à l’indexation des documents par un procédé de catégorisation automatique des documents au niveau des concepts d’ontologies

More Related