Framenet
This presentation is the property of its rightful owner.
Sponsored Links
1 / 44

FrameNet PowerPoint PPT Presentation


  • 120 Views
  • Uploaded on
  • Presentation posted in: General

FrameNet. Théorie, Produit, Processus, Multilingualité et Connexio ns. FrameNet. Théorie: Frame Semantics Produit: Base de Frames Processus: Construction et utilisation d’un FrameNet Multilinguisme: Autres versions de FrameNet Connexions: Liens avec WordNet, VerbNet, PropBank.

Download Presentation

FrameNet

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Framenet

FrameNet

Théorie, Produit, Processus, Multilingualité et Connexions

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet1

FrameNet

  • Théorie: Frame Semantics

  • Produit: Base de Frames

  • Processus: Construction et utilisation d’un FrameNet

  • Multilinguisme: Autres versions de FrameNet

  • Connexions: Liens avec WordNet, VerbNet, PropBank

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics

Frame Semantics

  • (Fillmore, 1982), dérivée de la Case Grammar de Fillmore (1968)

  • Une Frame est

    • une structure d’arguments appelés Frame Elements (≈rôles sémantiques) ou FEs

    • associée à une description textuelle

    • reliéeà d’autres Frames dans un graphe annoté par un nombre limité de relations

  • Les types de FEs ne sont pas en nombre finis

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics1

Frame Semantics

  • Un peu la même idée que la Grammaire de Construction:

    • la langue n’est pas régie par quelques principes généraux,

    • mais par de nombreux/ses constructions/cadres qui sont mis en relations

  • 1 unité lexicale (LU) évoque 1 unique frame

  • 1 LU = 1 lemme associé à 1 sens (Cruse, 1986)

  • Chaque frame peut être associée à plusieurs LU, de plusieurs types (nom, adj, verbe)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics2

Frame Semantics

  • Relations entre Frames

    • Inheritance

    • Using (point de vue, présupposition)

    • Subframe (partie d‘une frame complexe)

    • Causative

    • Inchoative (début d‘un événement)

    • SeeAlso (lien non spécifié)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics3

Frame Semantics

  • Inheritance

    • Une frame enfant est l’élaboration de la frame parent

    • Une enfant doit posséder au minimum tous les subframes, FEs, et types sémantiques de son parent.

    • Exemple: Rewards and Punishment est le parent de Revenge

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics4

Frame Semantics

  • Using

    • Point de vue

      • Une perspective spécifique sur une frame

      • Ex : Commerce_Sell et Commerce_Buy sont 2 points de vue sur Commerce_Goods_Transfer

    • Présupposition

      • Un lien plus “encyclopédique”, un arrière-plan nécessaire pour comprendre la frame, même s’il n’y a pas de lien

      • Ex: Volubility et Communication

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics5

Frame Semantics

  • SubFrame

    • Pour les frames décrivant des scénarios complexes, dont les sous-éléments existent en tant que frame.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics6

Frame Semantics

  • Causative_of

    • Le parent dénote la cause de l’état décrit par l’enfant

  • Inchoative_of

    • Le parent dénote l’entrée dans l’état décrit par l’enfant

  • SeeAlso

    • Quand un groupe de frames relativement similaires doit être différencié avec précaution, chaque élément du groupe a un lien SeeAlso avec un représentant “central”

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics7

Frame Semantics

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics8

Frame Semantics

  • Exemple : Commerce_Sell

  • Description :These are words describing basic commercial transactions involving a buyer and a seller exchanging money and goods, taking the perspective of the seller. The words vary individually in the patterns of frame element realization they allow. For example, the typical patterns for SELL: SELLER sells GOODS to BUYER for MONEY. Robin sold a car to Abby for $5,000.

  • Core FEs :SELLER, GOOD, BUYER

  • Non-Core FEs : DURATION(Duration), MANNER, MEANS, MONEY, PLACE(Location), PURPOSE, PURPOSE_OF_GOODS, RATE, REASON, RELAY, RESULT, REVERSIVE, Time(Time), UNIT

  • Relations :

    • Inherits From: Giving

    • Is Used By: Exporting

    • Perspective on: Commerce_goods-transfer

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics9

Frame Semantics

  • Unités Lexicales : lease.v, rent.v, retail.v, retailer.n, sale.n, sell.v, vend.v, vendor.n

  • Voisinage :

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics10

Frame Semantics

  • Types de FEs

    • Core: arguments conceptuellement nécessaires

    • Peripheral: arguments précisant le concept

      • ex: MONEY, MEANS, PLACE

    • Extra-Thematic: arguments qui sont liés au Frame complet, pas uniquement au concept « central »

      • ex: PURPOSE, REASON,RESULT

  • Difficile de choisir dans certains cas (ex MONEY pourrait être Core)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics11

Frame Semantics

  • Pour résumer

    • Frame = connaissance encyclopédique liée au lexique

    • Frame+FEs = comment cette connaissance met en relation les arguments des unités lexicales qui “implémentent” la frame

    • Graphe de Frames = liens de généralisation entre connaissances

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet

Construction d’un FrameNet

  • Construire une base de donnée lexicale FrameNet,

    • il faut d’abord avoir le graphe de Frames avec les FEs (modifier les frames coûte très cher)

    • Trouver ensuite les unités lexicales qui sont liées à chaque Frame (on peut le faire progressivement)

    • relier à chaque unité lexicale (LU) des informations sur les instanciations grammaticales

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet1

Construction d’un FrameNet

  • Technique originale (FN Anglais, Espagnol, Japonais):

    • Choisir une LU, et chercher dans son corpus des exemples à partir de motifs imaginés par le lexicographe

    • Annoter les phrases ainsi choisies avec les FEs

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet2

Construction d’un FrameNet

  • Technique systématique (Allemand)

    • Prendre phrases d’un corpus les unes après les autres

    • Trouver la Frame “centrale”

    • Annoter

  • Autres techniques (recherches en cours)

    • Projection à partir d’annotation de traductions ?

    • Projection interlingue à partir d’un entraînement sur les FEs ?

    • Recherche des LU à partir de ressources bilingues ?

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet3

Construction d’un FrameNet

  • Annotation des anaphores, ellipses, etc.

    • Les core FEs étant nécessaires, on ne peut pas ne pas les annoter, pourtant ils sont parfois absents de la phrase (soit dans le contexte linguistique, soit dans le contexte implicite)

    • FrameNet introduit 3 étiquettes : CNI, DNI, INI

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet4

Construction d’un FrameNet

  • CNI - Constructional Null Instanciation

    • le FE est porté par la construction syntaxique

    • “Get even[with herOFFENDER][for thisINJURY]. [CNIAVENGER]”

  • DNI - Definite Null Instanciation

    • le FE est porté par le discours ou le contexte de l’énonciation

    • “[The monkeyAVENGER] avenged[himselfINJURED_PARTY] [by growing to the size of a giant and setting fire to the cityPUNISHMENT]. [DNIOFFENDER]”

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet5

Construction d’un FrameNet

  • INI - Indefinite Null Instanciation

    • le FE est porté par une valeur implicite, connue encyclopédiquement

    • “He takes and never gives back. [INITHEME]

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet6

Construction d’un FrameNet

  • Types de lemmes intéressants dans FrameNet

    • Verbes

    • Adjectifs

    • Noms

    • Expressions mots multiples

  • Seuls sont utiles à décrire les LU ayant un aspect prédicatifs, c’est-à-dire qui décrivent un sens par composition d’arguments.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet7

Construction d’un FrameNet

  • Pas intéressant pour les choses et les genres naturels (cf. WordNet)

  • Sémantiquement, FrameNet décrit les événements, les états, les relations et les propriétés

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet8

Construction d’un FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Utilisation de framenet

Utilisation de FrameNet

  • La Frame Semantics a de forts liens avec la Grammaire de Construction

    • Les informations constructionnelles (Valence, Cadres de sous-catégorisation) servent de base à une GC.

    • Les liens entre Frames et le graphe de Frames peuvent partiellement être transformés en hiérarchies de constructions.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Utilisation de framenet1

Utilisation de FrameNet

  • Annotation automatique

    • Entraînement à partir d’annotations manuelles (Gildea & Jurafsky, 2000)

    • Techniques de classification (clusterisation sémantique + informations grammaticales)

    • Segmentation automatique des FEs

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Utilisation de framenet2

Utilisation de FrameNet

  • Utilisation pour la résolution d’anaphores

    • Riche description des rôles sémantiques

    • Fonctionne aussi parfois pour les anaphores nulles…

    • Mais ne décrit pas la compatibilité sémantique comme peut le faire WordNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Utilisation de framenet3

Utilisation de FrameNet

  • Autres applications

    • Questions/Réponses

    • Systèmes de Dialogue (suffisamment générique pour “traiter” le hors-domaine, mais facilement spécifiable, cf. SoccerFN & NukeFN)

    • Résumés (à vérifier..)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Statistiques sur framenet

Statistiques sur FrameNet

  • Version anglaise (développée depuis 1997)

  • 739 Frames + 6054 Fes / 135000 phrases annotées

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Statistiques sur framenet1

Statistiques sur FrameNet

  • Utilisateurs principaux :

    • MIT, U Colorado*, Saarland U /DFKI*

    • CMU, Edinburgh, HK Polytechnic, Keio*, Nat U Singapore

    • Baylor, HKUST, Leipzig, U College Dublin, USC, U Sydney, U TX Dallas* & Austin*, Xiamen

      * collab. FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Outils framenet

Outils FrameNet

  • Création

    • FNDesktop (Berkeley)

    • SALSA (Sarrebruck)

  • Utilisation

    • Automatic Labeler (devel) Gildea&Jurafsky

    • Projection (devel) Pàdo

  • APIs

    • Stanford (limitée)

    • Berkeley (très récente)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Outils framenet1

Semantics:

Independent frames

Trees of depth one

One edge points to target, others to frame elements

Outils FrameNet

(They didn‘t want to pay the move back because the employee had quit.)

TIGER Syntax:

  • Node labels: constituents

  • Edge labels: gramm. functions

  • Crossing edges

  • POS

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue

FrameNet Multilingue

  • 4 langues déjà traitées

    • Anglais américain

    • Japonais (Keio & U Tokyo)

      • Corpus propre, outils de recherche

      • Outils d’édition FN annotation/frame?

    • Espagnol (U A Barcelona)

      • Lexicographique

      • Corpus propre, FN software

      • 81 Frames, 585 LUs, ~6,900 phrases annotées

    • Allemand (U Saarlandes)

      • FN frames & FEs

      • corpus propre (TIGER) et soft annotation

      • Creation de LU “unknown” au besoin -> U Texas Austin

      • 20K phrases

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue1

FrameNet Multilingue

  • Projets en gestation

    • Hebreux

    • Chinois (projection BiFrameNet avec Hownet)

    • Romance FrameNet

      • Projet lancé avril 2005

      • Plusieurs partenaires intéressés

      • Besoin d’une structure dirigeante

      • Et d’un support financier

    • Français (c’est nous)

      • Recherche de techniques pour économiser du temps

      • Mi-parcours de la phase préliminaire

      • Susanne Alt, Benoît Crabbé, Laurent Romary

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue2

FrameNet Multilingue

  • Graphe de Frames commun à plusieurs langues

    • Cas problématiques:

      • un frame existe qui devrait être divisé. Ex. driving = aller en voiture en conduisant OU en étant conduit (en Allemand)

      • deux frames qui n’ont pas de parent

    • Des FE peuvent être Core ou pas (même problème: raffinement)

    • Questions techniques: pour l’Allemand = mots collés, verbes disloqués (?).

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue3

FrameNet Multilingue

  • Romance FrameNet

    • Conception collaborative et simultanée d’un FN pour plusieurs langues (romanes)

    • Idées proposées

      • Corpus traduit existant

      • Traduction “contrainte” par la frame à annoter

      • Plusieurs corpus traduits pour des sous-ensembles de langue, projections avec techniques bilingues.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue4

FrameNet Multilingue

  • FrameNet français

    • Annotation de 1000 phrases déjà annotées en Anglais et Allemand (Europarl)

    • Récupération des tables du LADL

    • Construction semi-automatisée de la base de frames françisées

    • Tentative d’annotation automatique en utilisant un entrainement LSA sur corpus bilingue - utilisable aussi pour projection

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue5

FrameNet Multilingue

  • Perspectives

    • Plutôt un FN européen utilisant plusieurs techniques

      • récupération des travaux déjà effectués en Espagnol et Allemand

      • ne reposant pas sur une traduction N langues, mais autorisant plusieurs traductions existantes bilingues

    • Intégration de WordNet,

    • Lien avec les classes de Levin difficile car propre à l’Anglais

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Connexions

Connexions

  • PropBank

    • Classification de Levin

    • 300000 mots (WS Journal)

    • Décrit les structures de valence pour chaque lemme

    • Pas de connaissance encyclopédique (notamment pas de liens entre frames)

    • Les rôles des structures de valence ne sont pas corrélés entre eux hors de la classe de Levin

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Connexions1

Connexions

  • VerbNet

    • Classes tirées des classes “intersectives” de Levin

    • Peuvent être plus ou moins corrélées à des frames

    • Dans Giuglea & Moschitti (2004), les classes de VerbNet (par exemple Judgment) sont projetées dans plusieurs frames (Rewards and Punishments, Judgment Communication, Pardon, Arraignment, etc.)

    • Les projections sont faites par similarité de LU liées aux classes et ensuite par les motifs d’ “alternation”

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Connexions2

Connexions

  • WordNet

    • Plusieurs synsets peuvent être reliés aux FEs

    • Potentiellement utile pour affiner les descriptions de frames (usages typiques)

    • Utilisation envisageable pour l’annotation automatique

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Connexions3

Connexions

  • Dans le cadre de LIRICS (prg e-Contents)

    • Développement d’un méta-modèle permettant d’intégrer les 4 approches

    • Outils d’annotation multilingue

      • Synchronisation des versions pour un développement collaboratif

      • Exportation d’anciennes données

      • Etude de l’intégration d’outils statistiques pour faciliter le développement

        • préannotation,

        • validation par annotation auto

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Journ e d tude

Journée d’étude

  • JE ATALA le 13 mai

  • Deadline le 13 mars

  • Ressources pour un FrameNet français

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


  • Login