mod lisation et reformulation d expressions temporelles extraites de textes en langage naturel
Download
Skip this Video
Download Presentation
Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel

Loading in 2 Seconds...

play fullscreen
1 / 20

Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel - PowerPoint PPT Presentation


  • 120 Views
  • Uploaded on

Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel. Cyril Faucher 1 , Jean-Yves Lafaye 1 , Frédéric Bertrand 1 , Charles Teissèdre 2,3. 1 L3i, Université de La Rochelle, France [email protected]

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel' - beyla


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
mod lisation et reformulation d expressions temporelles extraites de textes en langage naturel

Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel

Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3

1 L3i, Université de La Rochelle, France

[email protected]

2 MoDyCo - Université de Paris Ouest Nanterre La Défense – CNRS

3 Mondeca, France

AFADL 2010 - du 9 au 11 juin 2010 – Poitiers Futuroscope

Ce travail est financé par l’Agence Nationale de la Recherche (ANR-Contint, projet RelaxMultiMedias 2)

10es Journées Francophones Internationales sur les Approches Formelles dans l’Assistance au Développement de Logiciels)

introduction
Introduction
  • Chaîne d’acquisition de connaissances temporelles
    • A partir de textes (dépêches)
  • Produire une reformulation des informations saisies, dans un langage formel non ambigu, proche du langage naturel initial
  • => validation sémantique par l’utilisateur

Sous forme de modèles

Evénements + propriétés temporelles

Texte libre

Texte contrôlé

slide3
Plan
  • 1. Contexte et objectifs
  • 2. Workflow générique
  • 3. Modéliser des propriétés temporelles d’événements
  • 4. Acquisition et Modélisation de Connaissances Temporelles : chaîne TKAM
  • 5. Conclusion et perspectives
1 contexte

2

1. Contexte
  • Notion d’événements
    • Nature des événements: culturels, touristiques
    • Propriétés spatiales et temporelles
    • Récurrence et périodicité
  • Interopérabilité avec les standards du domaine (presse)
    • IPTC (NewsML, EventsML)
    • iCalendar
1 contexte utilisation de l idm
1. Contexte : utilisation de l’IDM
  • Utilisation de (Méta-) Modèles pivots pour assurer
    • l’interopérabilité d’applications métier (passerelles entre espaces techniques)
    • l’intégration de données hétérogènes
    • la vérification de l’intégrité d’instances / d’information
  • Exemple : transformation / reformulation / intégration

Texte Libre

SGBDR

MODELE

PIVOT

Ontologie

DSL

(Domain SpecificLanguage)

Langages formels, langages de preuve

Texte contrôlé

Langages de règles

Applications

1 objectifs
1. Objectifs
  • Représenter de manière intégrée des événements et leurs métadonnées
  • Assurer la persistance dans une base de données / connaissances
  • Aligner un modèle métier sur des ontologies existantes (donne accès à des raisonneurs, définit une sémantique de manière formelle et structurée)
  • Formuler des requêtes sur le Modèle Pivot, exécuter dans un autre espace (ex. base de connaissances)
  • Visualiser des ensembles de données conformes au Modèle Pivot dans des environnements ad hoc (SimileExhibit, Google Agenda, etc)
2 workflow g n rique
2. Workflow générique

Métier : linguistique

Modèle pivot

Dépêches

Texte contrôlé

Texte Libre

CU1 : Persistance

Associer des propriétés temporelles aux Events

Reformulation en langage naturel contrôlé à l’aide d’une grammaire formelle

Extraction de connaissance

Obtention de propriétés temporelles valides

Représentation dans un DSL

Représentation dans le modèle pivot

Modèle linguistique : expressions temporelles pour les périodes d’accès

CU2 : Résolution de requêtes

Rechercher des expressions temporelles dans les bases

Vérification de propriétés structurelle (invariant) et sémantique

3 mod liser des propri t s temporelles d v nements comment
3. Modéliser des propriétés temporelles d’événements : Comment ?
  • Deux types de représentations des occurrences d’événements
    • Concrète : un ensemble (extension) contenant des dates identifiables dans un calendrier (une granularité est fixée, le calendrier est défini sur une base annuelle)
    • Extension :

{ …, « de 2010-05-20T14:00:00 à 2010-05-20T16:00:00 »,

« de 2010-05-27T14:00:00 à 2010-05-27T16:00:00 », … }

    • Abstraite : une formule décrit en intension l’ensemble précédent
      • Particulièrement adapté aux événements périodiques ou pseudo périodiques (exceptions), et aussi aux événements définis relativement les uns par rapport aux autres
    • Intension[Carnap] :

« tous les jeudis de mai de chaque année de 14h à 16h »

« tous les jours 3 heures avant la basse mer »

3 mod liser des propri t s temporelles d v nements avec quel mod le
3. Modéliser des propriétés temporelles d’événements : avec quel modèle ?
  • Modèle métier : DSL Modèle d’accessiblité [Battistelli, Teissèdre]
  • Modèle d’événement : métadonnées sur les événements (IPTC)
    • spatiales
    • temporelles
  • Modèles temporels existants
    • ISO 19108 standard : Time geometry: Instant, Period, Allen’s relations
    • iCalendar format : Periodic interval, Exception (+ periodic exception)
    • TimeML [Pustejovsky], OWL-Time [Pan]
  • Modèle temporel proposé
    • synthèse de l’ISO et d’iCalendar sous une forme objet
    • position relative (3 heures avant la basse mer)
    • une grammaire formelle
3 mod liser des propri t s temporelles d v nements periodic temporal occurrence
3. Modéliser des propriétés temporelles d’événements : Periodic Temporal Occurrence
  • Extension de l’ISO 19108
  • Basé sur le concept de PeriodicRule

Norme ISO 19108

3 mod liser des propri t s temporelles d v nements position relative
3. Modéliser des propriétés temporelles d’événements : Position relative

Définition d’un intervalle entre 2 expressions temporelles avec les relations d’Allen

Expression relative: 3 heuresavant la BasseMer

Allen’s relations

1

3 un langage textuel contr l pour exprimer des propri t s temporelles
3. Un langage textuel contrôlé pour exprimer des propriétés temporelles
  • L’utilisateur saisie des expressions temporelles avec un éditeur contextuel
  • Techniques IDM : EMF, xText

Peuplement

Vue textuelle

3 un langage textuel contr l pour exprimer des propri t s temporelles1
3. Un langage textuel contrôlé pour exprimer des propriétés temporelles

Temporal Model

Grammar (xText)

PeriodicRule :

(\'(identified by \'name=ID\')\')?

(frequency=Frequency)?

(\'using a time span as \' validity+=PeriodicTimeSpan)*

(\'time extent \' ruleExtent=TM_Period )?

;

FreqWithDurationRef :

(

(times=INT \'times\') |

// times is fixed to 1

(\'during one\' referenceDuration=Duration \'period\') |

(times=INT \'times during one‘

referenceDuration=Duration \'period\')

)

(\'and starts on\' startTime=TM_Instant)?

;

4 acquisition et de mod lisation de connaissances temporelles cha ne tkam
4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM
  • Période d’accès d’un lieu exprimé en intension
    • Le musée est ouvert tous les jours de 10h à 19h sauf le lundi
    • Le restaurant est fermé les 1ère et 2ème semaines d’avril
    • Le marché est exceptionnellement ouvert les 3ers dimanche de décembre
4 acquisition et de mod lisation de connaissances temporelles cha ne tkam1
4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM

Métamodèle générique pour les Events

Approche IDM

Event

ISO19108

Texte libre

extension

Métamodèle pivot pour les propriétés temporelles

DSL des périodes d’accès

iCalendar

Grammaire formelle (xText)

conforme à

conforme à

conforme à

Données métier

Instances du modèle pivot

Textes contrôlés

Vérification de contraintes structurelle (invariant) et sémantique (modèle de calendrier)

Solveur de requêtes

4 acquisition et de mod lisation de connaissances temporelles cha ne tkam2
4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM

- du texte en langage naturel au texte contrôlé -

Expression saisie : « Ouvert du lundi au vendredi, de 9h à 18h. Nocturne le jeudi jusqu\'à 22h. Fermé le 18 mai. »

La chaîne de traitement a été expérimentée sur un corpus de 513 expressions fournies par RelaxNews

iCalendar

Export

Kermeta

Kermeta

Texte contrôlé

Instances du modèle temporel

Instances du modèle linguistique

4b autre application couplage d un sma avec le mod le temporel
4b. Autre application : couplage d’un SMA avec le modèle temporel

SMA : DAHU

TimeManager

Requêtetemporelle

Agents pêcheurs

Modèle Temporel

Réponse :

pêche autorisée, interdite ou restreinte

Texteréglementaire :

“Digging is prohibited each year, from 9 pm to 6 am between July 1st and August 31st. Out of these periods, digging is allowed from 3 hours before low tide up to 3 hours after the same low tide (according to the tide almanac in Douarnenez).”

Faucher C., Tissot C., Lafaye J.Y., Bertrand F., "Benefits of a periodic temporal model for the simulation of human activities", GeoVA(t) (Geospatial Visual Analytics : Focus on Time) Workshop at AGILE 2010, 10-11 May 2010, Guimaraes (Portugal)

5 conclusions
5. Conclusions
  • Chaîne d’acquisition et de modélisation de connaissances temporelles
    • D’un texte en langage naturel vers un texte contrôlé
  • Un modèle générique d’expressions temporelles pour modéliser des phénomènes périodiques
    • Extension de la norme ISO 19108
    • Expressions temporelles en intension (à l’inverse d’extension)
    • Grammaire formelle
    • Vérification structurelle et sémantique
    • 2 cas d’utilisations pour expérimenter les approches dont 1 industriel
5 perspectives
5. Perspectives
  • Moteur de requêtes
    • en formulant une requête sous forme d’expressions temporelles
    • exprimer et calculer l’intersection de deux expressions sans calculer leurs extensions
    • Traduire une règle périodique en requête (SQL/SPARQL…) sur la base de données ou de connaissance
    • Filtrer les nuplets/graphes candidats de la base pour optimiser l’exécution de la requête
mod lisation et reformulation d expressions temporelles extraites de textes en langage naturel1

Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel

Merci de votre attention

Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3

1 L3i, University of La Rochelle, France

[email protected]

2 MoDyCo - Université de Paris Ouest Nanterre La Défense - CNRS

3 Mondeca, France

ad