Mod lisation et reformulation d expressions temporelles extraites de textes en langage naturel
This presentation is the property of its rightful owner.
Sponsored Links
1 / 20

Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel PowerPoint PPT Presentation


  • 83 Views
  • Uploaded on
  • Presentation posted in: General

Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel. Cyril Faucher 1 , Jean-Yves Lafaye 1 , Frédéric Bertrand 1 , Charles Teissèdre 2,3. 1 L3i, Université de La Rochelle, France [email protected]

Download Presentation

Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Mod lisation et reformulation d expressions temporelles extraites de textes en langage naturel

Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel

Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3

1 L3i, Université de La Rochelle, France

[email protected]

2 MoDyCo - Université de Paris Ouest Nanterre La Défense – CNRS

3 Mondeca, France

AFADL 2010 - du 9 au 11 juin 2010 – Poitiers Futuroscope

Ce travail est financé par l’Agence Nationale de la Recherche (ANR-Contint, projet RelaxMultiMedias 2)

10es Journées Francophones Internationales sur les Approches Formelles dans l’Assistance au Développement de Logiciels)


Introduction

Introduction

  • Chaîne d’acquisition de connaissances temporelles

    • A partir de textes (dépêches)

  • Produire une reformulation des informations saisies, dans un langage formel non ambigu, proche du langage naturel initial

  • => validation sémantique par l’utilisateur

Sous forme de modèles

Evénements + propriétés temporelles

Texte libre

Texte contrôlé


Mod lisation et reformulation d expressions temporelles extraites de textes en langage naturel

Plan

  • 1. Contexte et objectifs

  • 2. Workflow générique

  • 3. Modéliser des propriétés temporelles d’événements

  • 4. Acquisition et Modélisation de Connaissances Temporelles : chaîne TKAM

  • 5. Conclusion et perspectives


1 contexte

2

1. Contexte

  • Notion d’événements

    • Nature des événements: culturels, touristiques

    • Propriétés spatiales et temporelles

    • Récurrence et périodicité

  • Interopérabilité avec les standards du domaine (presse)

    • IPTC (NewsML, EventsML)

    • iCalendar


1 contexte utilisation de l idm

1. Contexte : utilisation de l’IDM

  • Utilisation de (Méta-) Modèles pivots pour assurer

    • l’interopérabilité d’applications métier (passerelles entre espaces techniques)

    • l’intégration de données hétérogènes

    • la vérification de l’intégrité d’instances / d’information

  • Exemple : transformation / reformulation / intégration

Texte Libre

SGBDR

MODELE

PIVOT

Ontologie

DSL

(Domain SpecificLanguage)

Langages formels, langages de preuve

Texte contrôlé

Langages de règles

Applications


1 objectifs

1. Objectifs

  • Représenter de manière intégrée des événements et leurs métadonnées

  • Assurer la persistance dans une base de données / connaissances

  • Aligner un modèle métier sur des ontologies existantes (donne accès à des raisonneurs, définit une sémantique de manière formelle et structurée)

  • Formuler des requêtes sur le Modèle Pivot, exécuter dans un autre espace (ex. base de connaissances)

  • Visualiser des ensembles de données conformes au Modèle Pivot dans des environnements ad hoc (SimileExhibit, Google Agenda, etc)


2 workflow g n rique

2. Workflow générique

Métier : linguistique

Modèle pivot

Dépêches

Texte contrôlé

Texte Libre

CU1 : Persistance

Associer des propriétés temporelles aux Events

Reformulation en langage naturel contrôlé à l’aide d’une grammaire formelle

Extraction de connaissance

Obtention de propriétés temporelles valides

Représentation dans un DSL

Représentation dans le modèle pivot

Modèle linguistique : expressions temporelles pour les périodes d’accès

CU2 : Résolution de requêtes

Rechercher des expressions temporelles dans les bases

Vérification de propriétés structurelle (invariant) et sémantique


3 mod liser des propri t s temporelles d v nements comment

3. Modéliser des propriétés temporelles d’événements : Comment ?

  • Deux types de représentations des occurrences d’événements

    • Concrète : un ensemble (extension) contenant des dates identifiables dans un calendrier (une granularité est fixée, le calendrier est défini sur une base annuelle)

    • Extension :

      { …, « de 2010-05-20T14:00:00 à 2010-05-20T16:00:00 »,

      « de 2010-05-27T14:00:00 à 2010-05-27T16:00:00 », … }

    • Abstraite : une formule décrit en intension l’ensemble précédent

      • Particulièrement adapté aux événements périodiques ou pseudo périodiques (exceptions), et aussi aux événements définis relativement les uns par rapport aux autres

    • Intension[Carnap] :

      « tous les jeudis de mai de chaque année de 14h à 16h »

      « tous les jours 3 heures avant la basse mer »


3 mod liser des propri t s temporelles d v nements avec quel mod le

3. Modéliser des propriétés temporelles d’événements : avec quel modèle ?

  • Modèle métier : DSL Modèle d’accessiblité [Battistelli, Teissèdre]

  • Modèle d’événement : métadonnées sur les événements (IPTC)

    • spatiales

    • temporelles

  • Modèles temporels existants

    • ISO 19108 standard : Time geometry: Instant, Period, Allen’s relations

    • iCalendar format : Periodic interval, Exception (+ periodic exception)

    • TimeML [Pustejovsky], OWL-Time [Pan]

  • Modèle temporel proposé

    • synthèse de l’ISO et d’iCalendar sous une forme objet

    • position relative (3 heures avant la basse mer)

    • une grammaire formelle


3 mod liser des propri t s temporelles d v nements periodic temporal occurrence

3. Modéliser des propriétés temporelles d’événements : Periodic Temporal Occurrence

  • Extension de l’ISO 19108

  • Basé sur le concept de PeriodicRule

Norme ISO 19108


3 mod liser des propri t s temporelles d v nements position relative

3. Modéliser des propriétés temporelles d’événements : Position relative

Définition d’un intervalle entre 2 expressions temporelles avec les relations d’Allen

Expression relative: 3 heuresavant la BasseMer

Allen’s relations

1


3 un langage textuel contr l pour exprimer des propri t s temporelles

3. Un langage textuel contrôlé pour exprimer des propriétés temporelles

  • L’utilisateur saisie des expressions temporelles avec un éditeur contextuel

  • Techniques IDM : EMF, xText

Peuplement

Vue textuelle


3 un langage textuel contr l pour exprimer des propri t s temporelles1

3. Un langage textuel contrôlé pour exprimer des propriétés temporelles

Temporal Model

Grammar (xText)

PeriodicRule :

('(identified by 'name=ID')')?

(frequency=Frequency)?

('using a time span as ' validity+=PeriodicTimeSpan)*

('time extent ' ruleExtent=TM_Period )?

;

FreqWithDurationRef :

(

(times=INT 'times') |

// times is fixed to 1

('during one' referenceDuration=Duration 'period') |

(times=INT 'times during one‘

referenceDuration=Duration 'period')

)

('and starts on' startTime=TM_Instant)?

;


4 acquisition et de mod lisation de connaissances temporelles cha ne tkam

4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM

  • Période d’accès d’un lieu exprimé en intension

    • Le musée est ouvert tous les jours de 10h à 19h sauf le lundi

    • Le restaurant est fermé les 1ère et 2ème semaines d’avril

    • Le marché est exceptionnellement ouvert les 3ers dimanche de décembre


4 acquisition et de mod lisation de connaissances temporelles cha ne tkam1

4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM

Métamodèle générique pour les Events

Approche IDM

Event

ISO19108

Texte libre

extension

Métamodèle pivot pour les propriétés temporelles

DSL des périodes d’accès

iCalendar

Grammaire formelle (xText)

conforme à

conforme à

conforme à

Données métier

Instances du modèle pivot

Textes contrôlés

Vérification de contraintes structurelle (invariant) et sémantique (modèle de calendrier)

Solveur de requêtes


4 acquisition et de mod lisation de connaissances temporelles cha ne tkam2

4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM

- du texte en langage naturel au texte contrôlé -

Expression saisie : « Ouvert du lundi au vendredi, de 9h à 18h. Nocturne le jeudi jusqu'à 22h. Fermé le 18 mai. »

La chaîne de traitement a été expérimentée sur un corpus de 513 expressions fournies par RelaxNews

iCalendar

Export

Kermeta

Kermeta

Texte contrôlé

Instances du modèle temporel

Instances du modèle linguistique


4b autre application couplage d un sma avec le mod le temporel

4b. Autre application : couplage d’un SMA avec le modèle temporel

SMA : DAHU

TimeManager

Requêtetemporelle

Agents pêcheurs

Modèle Temporel

Réponse :

pêche autorisée, interdite ou restreinte

Texteréglementaire :

“Digging is prohibited each year, from 9 pm to 6 am between July 1st and August 31st. Out of these periods, digging is allowed from 3 hours before low tide up to 3 hours after the same low tide (according to the tide almanac in Douarnenez).”

Faucher C., Tissot C., Lafaye J.Y., Bertrand F., "Benefits of a periodic temporal model for the simulation of human activities", GeoVA(t) (Geospatial Visual Analytics : Focus on Time) Workshop at AGILE 2010, 10-11 May 2010, Guimaraes (Portugal)


5 conclusions

5. Conclusions

  • Chaîne d’acquisition et de modélisation de connaissances temporelles

    • D’un texte en langage naturel vers un texte contrôlé

  • Un modèle générique d’expressions temporelles pour modéliser des phénomènes périodiques

    • Extension de la norme ISO 19108

    • Expressions temporelles en intension (à l’inverse d’extension)

    • Grammaire formelle

    • Vérification structurelle et sémantique

    • 2 cas d’utilisations pour expérimenter les approches dont 1 industriel


5 perspectives

5. Perspectives

  • Moteur de requêtes

    • en formulant une requête sous forme d’expressions temporelles

    • exprimer et calculer l’intersection de deux expressions sans calculer leurs extensions

    • Traduire une règle périodique en requête (SQL/SPARQL…) sur la base de données ou de connaissance

    • Filtrer les nuplets/graphes candidats de la base pour optimiser l’exécution de la requête


Mod lisation et reformulation d expressions temporelles extraites de textes en langage naturel1

Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel

Merci de votre attention

Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3

1 L3i, University of La Rochelle, France

[email protected]

2 MoDyCo - Université de Paris Ouest Nanterre La Défense - CNRS

3 Mondeca, France


  • Login