1 / 27

Frame Net

Frame Net. Maria Husarciuc Diana-Maria Trandabăţ. Introducere. FrameNet = o resursă lexicală on-line pentru limba engleză, bazată pe cadre semantice ( frame semantics ).

nellie
Download Presentation

Frame Net

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. FrameNet Maria Husarciuc Diana-Maria Trandabăţ

  2. Introducere • FrameNet = o resursă lexicală on-line pentru limba engleză, bazată pe cadre semantice (frame semantics). • Scop: inventarierea posibilităţilor combinatorii semantice şi sintactice (valenţe) ale fiecărui cuvânt cu toate sensurile sale. • S-a folosit adnotarea manuală a propoziţiilor şi organizarea automată a rezultatelor acestei adnotări.

  3. Baza de date FrameNet • Dimensiuni: • mai 2001 (lexiconul disponibil iniţial): ~2.000 itemi – verbe, substantive şi adjective – reprezentativi pentru diferite domenii lexicale. Analiza s-a realizat pe aproximativ 40.000 de propoziţii adnotate; • 2002: aproximativ 6.000 unităţi lexicale şi 130.000 propoziţii adnotate • 2003: încă 1.500 unităţi lexicale noi + noi propoziţii adnotate + reanalizarea unor frame-uri

  4. Baza de date FrameNet Baza de date FrameNet serveşte ca: - DICŢIONAR: sunt incluse definiţii (preluate dinthe Concise Oxford Dictionary, 10th Editionsau scrise de membrii echipei FrameNet), exemple adnotate din corpus, precum şi un index alfabetic (pe unităţi lexicale şi pe cadre semantice) - TEZAUR: există linkuri de la cuvinte spre cadrele semantice din care ele fac parte, precum şi spre alte cuvinte care evocă acele cadre; există, de asemenea, legături între cadre semantice diferite

  5. Terminologie • Unitate lexicală = asocierea unui sens unui cuvânt, fiecare sens al unui cuvânt polisemantic aparţinând unui cadru semantic diferit; • Cadru semantic(frame)= o structură de inferenţe care caracterizează un anumit tip de situaţie, obiect sau eveniment;o structură semantică tripartită, cuprinzând: • un rol semantic (frame element FE - say, Patient); • o funcţie gramaticală (grammatical functionGF - say, Object); • un grup sintactic (phrase type PT - say, NP) => 3 nivele de adnotare

  6. Exemple de roluri semantice

  7. Funcţii gramaticale Funcţiile gramaticale folosite sunt: • External Argument (Ext) pentru verbe, adjective, prepoziţii, substantive; • Object (Obj) pentru verbe, prepoziţii; • Complement (Comp) verbe, adjective, substantive; • Modifier (Mod) verbe, adjective, substantive; • Head noun modified by attributive adjective (Head) pentru adjective; • Genitive determiner (Gen) pentru substantive; • Appositive (Appos) pentru substantive.

  8. Adnotarea corpusului Corpusul principal folosit de FrameNet este British National Corpus (BNC), conţinând 100.000.000 cuvinte. Adnotareacorpusului se realizează, cu ajutorul unui software propriu, în două etape: - adnotarea semantică (cu ajutorul unui software numit "Annotate“); - adnotarea sintactică, prin care se adaugă fiecărui grup sintactic funcţia gramaticală (GF) şi tipul grupului (PT)

  9. Adnotarea corpusului • Propoziţiile adnotate, în format XML, sunt punctul de plecare pentru descrierea unităţilor lexicale. • Acest format facilitează căutarea după unitate lexicală, după frame, după un element dintr-un frame.

  10. Adnotare - exemplu REVENGE frame • Definition: An Avenger performs some Punishment on an Offender as a response to an earlier action, the Injury, that was inflicted on an Injured_party. The Avenger need not be identical to the Injured_party but needs to consider the prior action of the Offender a wrong. Importantly, the punishment of the Offender by the Avenger is seen as justified by individual or group opinion rather than by law. • Frame elements: Avenger, Punishment, Offender, Injury, and Injured_party. • Lexical units: avenge.v, avenger.n, get even.v, retaliate.v, retaliation.n, retribution.n, retributive.a, retributory.a, revenge.v, revenge.n, revengeful.a, revenger.n, vengeance.n, vengeful.a, and vindictive.a.

  11. Adnotare – exemplu • Example sentence: [His brothers Avenger] avenged [him Injured_party]. With this, [El Cid Agent] at once avenged [the death of his son Injury]. [Hook Avenger] tries to avenge [himself Injured_party] [on Peter Pan Offender] [by becoming a second and better father Punishment].

  12. Principii generale în adnotare • Adnotarea FrameNet este întotdeaunarelativă la o anumită unitate lingvistică (the target), care este în general un singur cuvânt, dar poate fi şi o expresie (verb frazal: give insau idiom: take into account). • Sunt adnotaţi toţi constituenţii şi nu numai cuvintele-head ale grupurilor sintactice. =>a se vedea exemplul III (prepoziţia ON este inclusă în grupul sintactic dependent având rolul semantic Offender) • Fiecare grup dependent este adnotat conform celor trei nivele: FE, PT şi GF relativ la unitatea lexicală LU. • Sunt adnonate propoziţii ce constituie contexte pentru unitatea lexicală LU vizată. • Propoziţiile folosite în descrierea unei unităţi lexicale LU sunt adnotate numai relativ la acel LU. • Setul de propoziţii adnotate pentru o unitate lexicală dată este ales astfel încât să reprezinte seria completă de posibilităţi combinatorice pentru acea unitate lexicală.

  13. Adnotarea verbelor Adnotarea este mai uşor de realizat atunci când sunt exprimate în propoziţie numai elementele de tip core ale cadrului semantic (adică numai valenţele obligatorii ale elementului predicativ). Elementele de tip non-core reprezintă valenţe facultative ale elementului predicativ situat în centrul cadrului semantic. Aceste roluri nu sunt strict necesare exprimării, în sensul că nu caracterizează în mod unic cadrul respectiv. Astfel, pentru majoritatea cadrelor ce indică evenimente sau procese, rolurile temporale şi spaţiale nu sunt esenţiale, din acest motiv nefiind întotdeauna adnotate.

  14. Adnotarea verbelor Diferitele tipuri de informaţie semnificativă sunt înregistrate pe nivele de adnotare separate.Această separare pe nivele face posibilă reprezentarea unor situaţii complexe, cum ar fi situaţia în care un constituent care reprezintă un element al cadrului este inclus într-un alt constituent cu alt rol semantic.

  15. Adnotarea substantivelor Tipuri de substantive: • Substantive care denotă evenimente, precum withdrawalsaureplacement; • Substantive relaţionale,precum brothersaugirlfriend; • Substantive artifact, precumhousesauvest;

  16. Exemplu The Americans must have felt as if he was taking revenge on them for what had happened. King Menephta took awful revenge on the Libyan army. În ambele exemple, este evident că se raportează un fapt de răzbunare şi nu unul de ‘luare’, deşi este folosit verbul take. Cadrul sugerat de substantivul revenge este dominant, astfel fiind necesară adnotarea substantivului ca fiind legat de cadrul verbului. Multe din aspectele discutate anterior pentru verb se aplică adnotării substantivelor, totuşi această iniţiativă a ridicat şi unele probleme.

  17. Expresii suport După cum s-a văzut în exemplul precedent, cadrul dominat este determinat de substantivul revenge şi nu de verbultake. Astfel de verbe sunt tratate separat sub denumirea de support verbs. Intuiţia din spatele acestei manevre este că verbele suport nu introduc nici un fel de semantică.Verbele suport sunt astfel definite ca fiind acele verbe care se combină cu un substantiv de stare sau de eveniment pentru a crea un predicat verbal, permiţând argumentelor verbului să fie roluri în cadrul evocat de substantiv.În exemplu discutat, subiectul verbului take are rolul de Răzbunător, chiar dacă cadrul verbului nu implică singur acest rol. Dimpotrivă, în exemplul următor, verbul encouragedmodifică semnificativ sensul propoziţiei. The Prime Minister encouraged revenge against Absurdistan.

  18. Expresii suport În concordanţă cu statutul lor de argumente sintactice ale substantivelor, expresiile suport nu sunt elemente ale cadrului semantic. Sunt adnotate pe rândul NOUN şi nici nu au funcţie gramaticală, nici nu sunt asignate unui grup sintactic.

  19. Verbe auxiliare şi propoziţii copulative • Denumirea de verb auxiliar este dată în general în engleză verbului be în context de forma NP1V NP2. • De exemplu: 1. John is a sailor. 2. Smithers is the vice-president of the armchair division. • OBS: Prima utilizare a verbului este predicativă: proprietatea de a fi marinar este atribuită lui John. A doua folosire a verbului este ecuaţionlă: identitatea între Smithers şi the vice-president of the armchair division. În astfel de propoziţii, NP1 şi NP2 pot fi inversate, păstrându-se sensul propoziţiei, ceea ce nu se poate în primul caz. 1. *A sailor is John. 2. The vice-president of the armchair division is Smithers.

  20. Verbe auxiliare şi propoziţii copulative • Unele substantive apar în propoziţii ecuaţionale în care ce e la dreapta lui beexprimă un rol semantic al cadrului evocat de substantiv. His decision is to leave the company. To leave the company is his decision. • Pentru a se putea distinge între cele două plasări ale substantivului ţintă, este numit be verb copulativ doar atunci când urmează substantivul ţintă. Când îl precede este numit verb suport, la fel ca în cazul verbuluitake. His decision [is Copula] to leave the company. To leave the company [is Supp] his decision.

  21. Verbe auxiliare şi propoziţii copulative • Adnotarea verbului copulativ după substantivul understanding.

  22. Adnotarea adjectivelor Şi adjectivele pot evoca cadre. Unele cadre semantice precum cele legate de emoţii conţin un număr semnificativ de unităţi lexicale adjectivale. Adjectivele atributive vs. predicative. • Adjectivele atributive modifică substantivele. • Adjectivele predicative acceptă în general drept complement acelaşi tip de fraze ca verbele sau substantivele: • propoziţii finale : Jo is happy that he passed • Infinitivale: Jo is eager to finish • Gerundivale: Jo is busy writing • Preposiţionale: Jo is curious about the new student • Adverbiale: Jo is not in the least disappointed • etc. Totuşi adectivele predicative nu pot avea complement direct, cu excepţia adjectivului worth (de exemplu în It's not worth the trouble).

  23. Adnotarea adjectivelor • Când adjectivele sunt folosite predicativ, adnotarea verbelor precum be se realizează la fel ca în cazul verbului take, ca verbe suport. Se observă că în cazul adjectivelor, spre deosebire de substantive, nu se poate specifica modul de folosire, deoarece adjectivele nu sunt referenţiale. Verbele copulative ce apar împreună cu substantivele sunt adnotate ca fiind verbe suport indiferent de poziţia faţă de verb. Smithers [is Supp] very clever but he's no Einstein. Clever though he may [be Supp], Smithers is no Einstein.

  24. Concluzii Cine va folosi această imensă bază de date? 1. Cercetători din domeniul NLP ce lucrează pe aplicaţii ale limbajului natural ce includ: • word sense disambiguation: FrameNet oferă informaţii sintactice şi referitoare la colocaţii care permit de multe ori asocierea sensului corect; • machine translation: FrameNets pentru diferite limbi va scoate la iveală diferenţe inter-lingvistice în ceea ce priveşte înţelesul şi comportamentul gramatical al cuvintelor ce aparţin unor cadre. • information extraction: Adnotările din FrameNet oferă o mare precizie ce poate fi folosită la construirea tiparelor pentru extragerea informaţiilor. • question answering: Datele din FrameNet vor facilita recunoaşterea relaţiilor cadrelor semantice ce există între limbajul întrebării şi cel al documentului în care se caută răspunsul.

  25. Concluzii 2. Lexicografii care încearcă realizarea unei noi intrări în dicţionare sau revizuirea unei intrări dea existente vor aprecia: • O caracterizare completă a gramaticii cuvântului şi a posibilităţilor sale de combinare, cu exemple din corpusuri pentru a le arăta folosirea autentică. • O tehnică de analiză a corpusului, bazată pe cadre semantice şi pe capacitatea lor de a identifica faptele relevante din punct de vedere lexicografic în contextul propoziţiilor din corpus. 3. Profesori de limbi şi cei care vor să înveţe o limbă străină la nivel avansat vor descoperi că lexiconul FrameNet–ului oferă un complement pentru informaţia redusă din dicţionarele convenţionale: • Un sumar al potenţialului sintactic şi semantic al unui cuvânt cu ilustrări autentice, ceea ce formează o bază ideală pentru crearea materialului didactic, precum şi a exerciţiilor. • Exemple reale ale folosirii unui cuvânt în context, care explică cum sunt formate frazele.

  26. Vă mulţumim!

More Related