1 / 21

Grammatiche, Linguaggio e Automi

Grammatiche, Linguaggio e Automi. R. Basili TAL - a.a. 2009-2010. Sommario. Grammatiche: definizione di base La gerarchia di Chomsky Grammatiche e Lingue Naturali Cenni alla Teoria degli Automi. Motivazioni.

sailor
Download Presentation

Grammatiche, Linguaggio e Automi

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Grammatiche, Linguaggio e Automi R. Basili TAL - a.a. 2009-2010

  2. Sommario • Grammatiche: definizione di base • La gerarchia di Chomsky • Grammatiche e Lingue Naturali • Cenni alla Teoria degli Automi

  3. Motivazioni • Un sistema di riconoscimento della sintassi di una lingua deve esibire proprietà: • Descrittive. Deve cioè spiegare la motivazioni alla base della accettabilità grammaticale degli enunciati di una lingua in termini di • Proprietà lessicali delle classi di oggetti elementari della lingua • Proprietà strutturali degli enunciati • Procedurali: Deve fornire meccanismi computazionali in grado di • Riconoscere la accettabilità grammaticale • Costruire le strutture grammaticali che soggiacciono ai singoli enunciati accettabili

  4. Grammatiche Formali • Un linguaggio L e’ caratterizzato da un insieme di stringhe, cioe’ sequenze finite di elementi di un vocabolario di partenza A • “…I will consider a language to be a set (finite or infinite) of sentences, each finite in length and constructed out of a finite set of elements… All natural languages are languages in this sense… Similarly, the set of “sentences” of some formalized system of mathematics can be considered a language” Chomsky 1957

  5. Grammatiche Formali (2) • Dato un vocabolario A, l’insieme di tutte le stringhe costruite su A (A*) più l’operazione di concatenazione (formazione di stringhe complesse a partire da stringhe semplici) costituisce una struttura algebrica definita come monoide libero su A. • Normalmente, non tutte le stringhe del monoide costituiscono frasi ben formate di L: per es, dato un frammento del lessico italiano, non tutte le sequenze arbitrarie sono frasi dell’italiano: • Il bambino corre Corre il bambino • *il corre bambino * bambino corre il …..

  6. Grammatiche Formali (3) • Quindi L con vocabolario A è in genere un sottoinsieme proprio di A*, i.e. L  A* • IL compito della grammatica di L è di catturare il sottoinsieme in questione generando tutte e sole le stringhe che lo compongono (capacità generativa debole) e di esprimere la struttura delle frasi di L (capacità generativa forte). • [il bambino] [legge [il libro ]] e non • * [[[[il] bambino] legge] il] libro]

  7. Grammatiche Formali (4) • Per lo studio delle proprietà formali, è utile considerare linguaggi semplificati, con lessici molto ridotti e sintassi semplice, per es, linguaggi come i seguenti: • ab, abab, ababab, abababab,… • ab, aab, aabbbb, aaaaabb,... • ab, aabb, aaabbb, aaaabbbb... • aa, bb, abba, baab, abaaba, aaabbaaa, ... • a, abab, abbabb, abbababbab,... • abc, aabbcc, aaabbbccc, aaaabbbbcccc

  8. Grammatiche Formali (5) • Una grammatica formale è un sistema deduttivo di assiomi e regole di inferenza, che genera le frasi della lingua come suoi teoremi (capacità generativa debole). Inoltre, assegna rappresentazioni strutturali alle frasi (capacità generativa forte).  

  9. Grammatiche Formali (6) • Una grammatica formale è definita da una quadrupla : • (i) Un vocabolario terminale VT • (ii) Un vocabolario non terminale VN • (iii) Un assioma, o simbolo iniziale SVN • (iv) Un insieme di regole di riscrittura  • Nella sua forma più generale, la parte sinistra e la parte destra della regola di riscrittura sono stringhe qualsiasi costruite sui due vocabolari, con la sola restrizione che la parte sinistra deve contenere almeno un simbolo di VN .

  10. Derivazione da una GF • Una derivazione è una sequenza di stringhe che parte dall’assioma S e arriva fino a generare una stringa w1, …, wN del linguaggio tramite le regole, eliminando via via i simboli non terminali. • Modalità top-down: parte da S e cerca tutte le sostituzioni sufficienti a generare w1, …, wN • Modalità bottom-up: parte da w1, …, wN e ne riscrive i frammenti usando le regole sino a riscrivere l’assioma S

  11. Esempio: • G=< VT , VN , S, R> • VT : {a, b}, VN : {S, A, B} Assioma: S • Regole: • S → A B S S → ε AB → BA BA → AB A → a B → b • Esempio di derivazione: S >ABS >BAS >BAABS >BAAB >bAAB >baAB >baaB>baab • “ε” è la stringa vuota, l’elementi neutro rispetto alla concatenazione: ε  = ε = 

  12. Alberi • La rappresentazione del risultato del parsing e’ una struttura che deve esprimere • L’ordine degli elementi costituenti una espressione • Il tipo grammaticale dei costituenti • L’organizzazione gerarchica dei costituenti • Le strutture dati che garantiscono tali proprietà sono detti alberi

  13. Alberi (2) • Gli alberi sono strutture dati definite da una 5-pla <N,Q,D,P,L> dove • N e’ un insieme finito di nodi • Q e’ un insieme finito di etichette (label) • D e’ una relazione d’ordine parziale debole in NN detta relazione di dominanza • P e’ una relazione d’ordine parziale stretta in N  N, detta precedenza • L e’ la funzione di etichettatura da N a Q

  14. S 1 NP VP 2 3 NP V Det N 4 5 6 7 Det N 8 9 Il10 gatto11 beve12 il13 latte14 Alberi (3) esempio “Il gatto beve il latte” • N={1,2,3,4,5,6,7,8,9,10,11,12,13,14} • Q={S,NP,VP,Det,N,V} • D={<1,3>,<1,2>,<2,4>, <2,5>, <3,7>, <3,6>, <7,8>, <7,9>, …} • L={<1,S>, <3,VP>, …, <6,NP>, <8,Det>, …}

  15. 1 2 3 S NP VP 4 5 6 7 NP V Det N 8 9 Det N Il10 gatto11 beve12 il13 latte14 Grammatiche ed Alberi “Il gatto beve il latte” • Vn={S,NP,VP,Det,N}, Assioma: S • Produzioni: {S→NP VP, VP→V NP, NP→Det N} • Derivazioni • S > NP VP > Det N VP > Il N VP > Il gatto VP > Il gatto V NP > Il gatto beve NP > Il gatto beve Det N > Il gatto beve il N > Il gatto beve il latte

  16. S 1 NP VP 2 3 NP V Det N 4 5 6 7 Det N 8 9 Grammatiche ed Alberi “Il gatto beve il latte” • Vn={S,NP,VP,Det,N}, Assioma: S • Produzioni: {S→NP VP, VP→V NP, NP→Det N} • Derivazioni • S > NP VP > Det N VP > Il N VP > Il gatto VP > Il gatto V NP > Il gatto beve NP > Il gatto beve Det N > Il gatto beve il N > Il gatto beve il latte derivazione top-down Il10 gatto11 beve12 il13 latte14

  17. S 1 NP VP 2 3 NP V Det N 4 5 6 7 Det N 8 9 Grammatiche ed Alberi “Il gatto beve il latte” • VN={S,NP,VP,Det,N}, Assioma: S • Produzioni: {S→NP VP, VP→V NP, NP→Det N} • Derivazioni • Il gatto beve il latte > Det beve il latte > Det N beve il latte > NP beve il latte > NP V il latte > NP V Det latte > NP V Det N > NP V NP > NP VP > S derivazione bottom-up Il10 gatto11 beve12 il13 latte14

  18. Esercizi • Date le seguenti frasi scrivere una grammatica che le rappresenta e descrivere almeno in due casi l’albero sintattico di derivazione. • Mario mangia • Giovanni scrisse un poema • Il libro fu scritto da due autori • Le prime sezioni erano noiose

  19. Esercizi (2) • Estendere la grammatica precedente alle seguenti frasi • Mario mangia di notte • Giovanna di notte scrisse il primo capitolo del libro • Le ore insonni scorrevano attraverso la notte a Roma • Descrivere gli alberi sintattici generati dalla grammatica sulle tre frasi.

  20. Esercizi (3) • Quanti non terminali (categorie grammaticali) sono necessarie? • Quante frasi generano interpretazioni grammaticali multiple? • Quali informazioni semantiche sono necessarie per la disambiguazione? • Descriverne alcune in forma testuale.

  21. Riferimenti Bibliografici • Lyons, Introduzione alla Linguistica Teorica, II. Grammatica, • Capitoli 4.1, 4.2, 4.3, 6.1, 6.2, 8.1

More Related