Framenet
Download
1 / 44

FrameNet - PowerPoint PPT Presentation


  • 169 Views
  • Uploaded on

FrameNet. Théorie, Produit, Processus, Multilingualité et Connexio ns. FrameNet. Théorie: Frame Semantics Produit: Base de Frames Processus: Construction et utilisation d’un FrameNet Multilinguisme: Autres versions de FrameNet Connexions: Liens avec WordNet, VerbNet, PropBank.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' FrameNet' - joyce


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Framenet

FrameNet

Théorie, Produit, Processus, Multilingualité et Connexions

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet1
FrameNet

  • Théorie: Frame Semantics

  • Produit: Base de Frames

  • Processus: Construction et utilisation d’un FrameNet

  • Multilinguisme: Autres versions de FrameNet

  • Connexions: Liens avec WordNet, VerbNet, PropBank

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics
Frame Semantics

  • (Fillmore, 1982), dérivée de la Case Grammar de Fillmore (1968)

  • Une Frame est

    • une structure d’arguments appelés Frame Elements (≈rôles sémantiques) ou FEs

    • associée à une description textuelle

    • reliéeà d’autres Frames dans un graphe annoté par un nombre limité de relations

  • Les types de FEs ne sont pas en nombre finis

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics1
Frame Semantics

  • Un peu la même idée que la Grammaire de Construction:

    • la langue n’est pas régie par quelques principes généraux,

    • mais par de nombreux/ses constructions/cadres qui sont mis en relations

  • 1 unité lexicale (LU) évoque 1 unique frame

  • 1 LU = 1 lemme associé à 1 sens (Cruse, 1986)

  • Chaque frame peut être associée à plusieurs LU, de plusieurs types (nom, adj, verbe)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics2
Frame Semantics

  • Relations entre Frames

    • Inheritance

    • Using (point de vue, présupposition)

    • Subframe (partie d‘une frame complexe)

    • Causative

    • Inchoative (début d‘un événement)

    • SeeAlso (lien non spécifié)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics3
Frame Semantics

  • Inheritance

    • Une frame enfant est l’élaboration de la frame parent

    • Une enfant doit posséder au minimum tous les subframes, FEs, et types sémantiques de son parent.

    • Exemple: Rewards and Punishment est le parent de Revenge

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics4
Frame Semantics

  • Using

    • Point de vue

      • Une perspective spécifique sur une frame

      • Ex : Commerce_Sell et Commerce_Buy sont 2 points de vue sur Commerce_Goods_Transfer

    • Présupposition

      • Un lien plus “encyclopédique”, un arrière-plan nécessaire pour comprendre la frame, même s’il n’y a pas de lien

      • Ex: Volubility et Communication

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics5
Frame Semantics

  • SubFrame

    • Pour les frames décrivant des scénarios complexes, dont les sous-éléments existent en tant que frame.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics6
Frame Semantics

  • Causative_of

    • Le parent dénote la cause de l’état décrit par l’enfant

  • Inchoative_of

    • Le parent dénote l’entrée dans l’état décrit par l’enfant

  • SeeAlso

    • Quand un groupe de frames relativement similaires doit être différencié avec précaution, chaque élément du groupe a un lien SeeAlso avec un représentant “central”

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics7
Frame Semantics

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics8
Frame Semantics

  • Exemple : Commerce_Sell

  • Description :These are words describing basic commercial transactions involving a buyer and a seller exchanging money and goods, taking the perspective of the seller. The words vary individually in the patterns of frame element realization they allow. For example, the typical patterns for SELL: SELLER sells GOODS to BUYER for MONEY. Robin sold a car to Abby for $5,000.

  • Core FEs :SELLER, GOOD, BUYER

  • Non-Core FEs : DURATION(Duration), MANNER, MEANS, MONEY, PLACE(Location), PURPOSE, PURPOSE_OF_GOODS, RATE, REASON, RELAY, RESULT, REVERSIVE, Time(Time), UNIT

  • Relations :

    • Inherits From: Giving

    • Is Used By: Exporting

    • Perspective on: Commerce_goods-transfer

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics9
Frame Semantics

  • Unités Lexicales : lease.v, rent.v, retail.v, retailer.n, sale.n, sell.v, vend.v, vendor.n

  • Voisinage :

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics10
Frame Semantics

  • Types de FEs

    • Core: arguments conceptuellement nécessaires

    • Peripheral: arguments précisant le concept

      • ex: MONEY, MEANS, PLACE

    • Extra-Thematic: arguments qui sont liés au Frame complet, pas uniquement au concept « central »

      • ex: PURPOSE, REASON,RESULT

  • Difficile de choisir dans certains cas (ex MONEY pourrait être Core)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Frame semantics11
Frame Semantics

  • Pour résumer

    • Frame = connaissance encyclopédique liée au lexique

    • Frame+FEs = comment cette connaissance met en relation les arguments des unités lexicales qui “implémentent” la frame

    • Graphe de Frames = liens de généralisation entre connaissances

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet
Construction d’un FrameNet

  • Construire une base de donnée lexicale FrameNet,

    • il faut d’abord avoir le graphe de Frames avec les FEs (modifier les frames coûte très cher)

    • Trouver ensuite les unités lexicales qui sont liées à chaque Frame (on peut le faire progressivement)

    • relier à chaque unité lexicale (LU) des informations sur les instanciations grammaticales

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet1
Construction d’un FrameNet

  • Technique originale (FN Anglais, Espagnol, Japonais):

    • Choisir une LU, et chercher dans son corpus des exemples à partir de motifs imaginés par le lexicographe

    • Annoter les phrases ainsi choisies avec les FEs

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet2
Construction d’un FrameNet

  • Technique systématique (Allemand)

    • Prendre phrases d’un corpus les unes après les autres

    • Trouver la Frame “centrale”

    • Annoter

  • Autres techniques (recherches en cours)

    • Projection à partir d’annotation de traductions ?

    • Projection interlingue à partir d’un entraînement sur les FEs ?

    • Recherche des LU à partir de ressources bilingues ?

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet3
Construction d’un FrameNet

  • Annotation des anaphores, ellipses, etc.

    • Les core FEs étant nécessaires, on ne peut pas ne pas les annoter, pourtant ils sont parfois absents de la phrase (soit dans le contexte linguistique, soit dans le contexte implicite)

    • FrameNet introduit 3 étiquettes : CNI, DNI, INI

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet4
Construction d’un FrameNet

  • CNI - Constructional Null Instanciation

    • le FE est porté par la construction syntaxique

    • “Get even[with herOFFENDER][for thisINJURY]. [CNIAVENGER]”

  • DNI - Definite Null Instanciation

    • le FE est porté par le discours ou le contexte de l’énonciation

    • “[The monkeyAVENGER] avenged[himselfINJURED_PARTY] [by growing to the size of a giant and setting fire to the cityPUNISHMENT]. [DNIOFFENDER]”

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet5
Construction d’un FrameNet

  • INI - Indefinite Null Instanciation

    • le FE est porté par une valeur implicite, connue encyclopédiquement

    • “He takes and never gives back. [INITHEME]

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet6
Construction d’un FrameNet

  • Types de lemmes intéressants dans FrameNet

    • Verbes

    • Adjectifs

    • Noms

    • Expressions mots multiples

  • Seuls sont utiles à décrire les LU ayant un aspect prédicatifs, c’est-à-dire qui décrivent un sens par composition d’arguments.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet7
Construction d’un FrameNet

  • Pas intéressant pour les choses et les genres naturels (cf. WordNet)

  • Sémantiquement, FrameNet décrit les événements, les états, les relations et les propriétés

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Construction d un framenet8
Construction d’un FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC




Utilisation de framenet
Utilisation de FrameNet

  • La Frame Semantics a de forts liens avec la Grammaire de Construction

    • Les informations constructionnelles (Valence, Cadres de sous-catégorisation) servent de base à une GC.

    • Les liens entre Frames et le graphe de Frames peuvent partiellement être transformés en hiérarchies de constructions.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Utilisation de framenet1
Utilisation de FrameNet

  • Annotation automatique

    • Entraînement à partir d’annotations manuelles (Gildea & Jurafsky, 2000)

    • Techniques de classification (clusterisation sémantique + informations grammaticales)

    • Segmentation automatique des FEs

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Utilisation de framenet2
Utilisation de FrameNet

  • Utilisation pour la résolution d’anaphores

    • Riche description des rôles sémantiques

    • Fonctionne aussi parfois pour les anaphores nulles…

    • Mais ne décrit pas la compatibilité sémantique comme peut le faire WordNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Utilisation de framenet3
Utilisation de FrameNet

  • Autres applications

    • Questions/Réponses

    • Systèmes de Dialogue (suffisamment générique pour “traiter” le hors-domaine, mais facilement spécifiable, cf. SoccerFN & NukeFN)

    • Résumés (à vérifier..)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Statistiques sur framenet
Statistiques sur FrameNet

  • Version anglaise (développée depuis 1997)

  • 739 Frames + 6054 Fes / 135000 phrases annotées

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Statistiques sur framenet1
Statistiques sur FrameNet

  • Utilisateurs principaux :

    • MIT, U Colorado*, Saarland U /DFKI*

    • CMU, Edinburgh, HK Polytechnic, Keio*, Nat U Singapore

    • Baylor, HKUST, Leipzig, U College Dublin, USC, U Sydney, U TX Dallas* & Austin*, Xiamen

      * collab. FrameNet

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Outils framenet
Outils FrameNet

  • Création

    • FNDesktop (Berkeley)

    • SALSA (Sarrebruck)

  • Utilisation

    • Automatic Labeler (devel) Gildea&Jurafsky

    • Projection (devel) Pàdo

  • APIs

    • Stanford (limitée)

    • Berkeley (très récente)

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Outils framenet1

Semantics:

Independent frames

Trees of depth one

One edge points to target, others to frame elements

Outils FrameNet

(They didn‘t want to pay the move back because the employee had quit.)

TIGER Syntax:

  • Node labels: constituents

  • Edge labels: gramm. functions

  • Crossing edges

  • POS

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue
FrameNet Multilingue

  • 4 langues déjà traitées

    • Anglais américain

    • Japonais (Keio & U Tokyo)

      • Corpus propre, outils de recherche

      • Outils d’édition FN annotation/frame?

    • Espagnol (U A Barcelona)

      • Lexicographique

      • Corpus propre, FN software

      • 81 Frames, 585 LUs, ~6,900 phrases annotées

    • Allemand (U Saarlandes)

      • FN frames & FEs

      • corpus propre (TIGER) et soft annotation

      • Creation de LU “unknown” au besoin -> U Texas Austin

      • 20K phrases

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue1
FrameNet Multilingue

  • Projets en gestation

    • Hebreux

    • Chinois (projection BiFrameNet avec Hownet)

    • Romance FrameNet

      • Projet lancé avril 2005

      • Plusieurs partenaires intéressés

      • Besoin d’une structure dirigeante

      • Et d’un support financier

    • Français (c’est nous)

      • Recherche de techniques pour économiser du temps

      • Mi-parcours de la phase préliminaire

      • Susanne Alt, Benoît Crabbé, Laurent Romary

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue2
FrameNet Multilingue

  • Graphe de Frames commun à plusieurs langues

    • Cas problématiques:

      • un frame existe qui devrait être divisé. Ex. driving = aller en voiture en conduisant OU en étant conduit (en Allemand)

      • deux frames qui n’ont pas de parent

    • Des FE peuvent être Core ou pas (même problème: raffinement)

    • Questions techniques: pour l’Allemand = mots collés, verbes disloqués (?).

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue3
FrameNet Multilingue

  • Romance FrameNet

    • Conception collaborative et simultanée d’un FN pour plusieurs langues (romanes)

    • Idées proposées

      • Corpus traduit existant

      • Traduction “contrainte” par la frame à annoter

      • Plusieurs corpus traduits pour des sous-ensembles de langue, projections avec techniques bilingues.

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue4
FrameNet Multilingue

  • FrameNet français

    • Annotation de 1000 phrases déjà annotées en Anglais et Allemand (Europarl)

    • Récupération des tables du LADL

    • Construction semi-automatisée de la base de frames françisées

    • Tentative d’annotation automatique en utilisant un entrainement LSA sur corpus bilingue - utilisable aussi pour projection

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Framenet multilingue5
FrameNet Multilingue

  • Perspectives

    • Plutôt un FN européen utilisant plusieurs techniques

      • récupération des travaux déjà effectués en Espagnol et Allemand

      • ne reposant pas sur une traduction N langues, mais autorisant plusieurs traductions existantes bilingues

    • Intégration de WordNet,

    • Lien avec les classes de Levin difficile car propre à l’Anglais

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Connexions
Connexions

  • PropBank

    • Classification de Levin

    • 300000 mots (WS Journal)

    • Décrit les structures de valence pour chaque lemme

    • Pas de connaissance encyclopédique (notamment pas de liens entre frames)

    • Les rôles des structures de valence ne sont pas corrélés entre eux hors de la classe de Levin

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Connexions1
Connexions

  • VerbNet

    • Classes tirées des classes “intersectives” de Levin

    • Peuvent être plus ou moins corrélées à des frames

    • Dans Giuglea & Moschitti (2004), les classes de VerbNet (par exemple Judgment) sont projetées dans plusieurs frames (Rewards and Punishments, Judgment Communication, Pardon, Arraignment, etc.)

    • Les projections sont faites par similarité de LU liées aux classes et ensuite par les motifs d’ “alternation”

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Connexions2
Connexions

  • WordNet

    • Plusieurs synsets peuvent être reliés aux FEs

    • Potentiellement utile pour affiner les descriptions de frames (usages typiques)

    • Utilisation envisageable pour l’annotation automatique

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Connexions3
Connexions

  • Dans le cadre de LIRICS (prg e-Contents)

    • Développement d’un méta-modèle permettant d’intégrer les 4 approches

    • Outils d’annotation multilingue

      • Synchronisation des versions pour un développement collaboratif

      • Exportation d’anciennes données

      • Etude de l’intégration d’outils statistiques pour faciliter le développement

        • préannotation,

        • validation par annotation auto

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


Journ e d tude
Journée d’étude

  • JE ATALA le 13 mai

  • Deadline le 13 mars

  • Ressources pour un FrameNet français

Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC


ad