430 likes | 571 Views
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 5 ο : Σημασιολογική ανάλυση. Οι διαφάνειες αυτού του μαθήματος βασίζονται στο κεφάλαιο 17 του βιβλίου: « Speech and Language Processing» των D. Jurafsky και J.H. Martin, 2 η έκδοση, Pearson, 2009. Σημασιολογία. Ορισμός:
E N D
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 5ο: Σημασιολογική ανάλυση Ακαδημαϊκό Έτος 2013-2014
Οι διαφάνειες αυτού του μαθήματος βασίζονται στο κεφάλαιο 17 του βιβλίου: «Speech and Language Processing» των D. Jurafskyκαι J.H. Martin, 2η έκδοση, Pearson, 2009 Ακαδημαϊκό Έτος 2013-2014
Σημασιολογία • Ορισμός: • Είναι η επιστημονική μελέτη του γλωσσικού νοήματος ενός εκφωνήματος • Τι είναι «σημασία» «έννοια» και «νόημα» • Αγγλικά: What is the meaning of the sentence X • Ελληνικά: Ποιο είναι το νόημα / η έννοια / η σημασία της πρότασης Χ Ακαδημαϊκό Έτος 2013-2014
Σημασιολογία (1) • Μέχρι στιγμής, έχουμε επικεντρωθεί στην δομή της γλώσσας, και όχι στο τι σημαίνουν τα στοιχεία της • Είδαμε ότι οι λέξεις μπορεί να έχουν διαφορετική σημασία, ανάλογα με το περιβάλλον μέσα στο οποίο έχουν χρησιμοποιηθεί Ακαδημαϊκό Έτος 2013-2014
Σημασιολογία (2) • Καθημερινές εργασίες που χρειάζονται σημασιολογική ανάλυση: • Απάντηση ερωτήματος σε διαγώνισμα • Γνώση θέματος, και πώς συνήθως απαντώνται • Παραγγελία φαγητού σε εστιατόριο διαβάζοντας τον κατάλογο, εκτέλεση συνταγής • Γνώση σχετική με φαγητό, την προετοιμασία, εστιατόρια,… • Αναγνώριση του ότι έχεις προσβληθεί.. • Εκμάθηση χρήσης λογισμικού διαβάζοντας το εγχειρίδιο • Γνώση σχετική με Η/Υ, εφαρμογές, GUI, … Ακαδημαϊκό Έτος 2013-2014
Σημασιολογική ανάλυση • Η μετατροπή μιας πρότασης φυσική γλώσσας σε μια σημασιολογική αναπαράσταση (ΣΑ) • Η οποία αποτελείται από «πράγματα» που χρησιμοποιούνται για την αναπαράσταση καθημερινής, συνηθισμένης γνώσης του κόσμου Ακαδημαϊκό Έτος 2013-2014
I have a car Ακαδημαϊκό Έτος 2013-2014
Σημασιολογικές αναπαραστάσεις (1) • Συνδέουν γλωσσικές μορφές με γνώση για τον κόσμο • Διττή αναπαράσταση: • Σημασίας για την πρόταση • Κατάστασης κάποιου κόσμου • Τι είναι; • Οτιδήποτε εξυπηρετεί τους σκοπούς ενός προγράμματος που εκτελεί σημασιολογική ανάλυση Ακαδημαϊκό Έτος 2013-2014
Σημασιολογικές αναπαραστάσεις (2) • Θα καλύψουμε: • Ποια είναι η σημασία μιας λέξης • Πώς μπορούμε να αναπαραστήσουμε την σημασία • Τι φορμαλισμοί μπορούν να χρησιμοποιηθούν • Γλώσσες αναπαράστασης σημασίας Ακαδημαϊκό Έτος 2013-2014
Αναπαράσταση σημασίας • Επιθυμητά στοιχεία: • Επαληθευσιμότητα (Verifiability) • Σαφής Αναπαράσταση (Unambiguous Representation) • Κανονική Μορφή (Canonical Form) • Συμπερασμός (Inference) • Εκφραστικότητα (Expressiveness) Ακαδημαϊκό Έτος 2013-2014
Επαληθευσιμότητα (1) • Η πλέον στοιχειώδης ιδιότητα: • Ποια η σχέση μεταξύ της έννοιας της πρότασης, και του κόσμου, όπως τον ξέρουμε; • Πρέπει να μπορούμε να καθορίσουμε το αληθές της αναπαράστασης • Ένα σύστημα πρέπει να μπορεί να συγκρίνει, ταιριάζει: • Την σημασιολογική αναπαράσταση με μια βάση γνώσης (ΒΓ) • Η οποία περιέχει πληροφορία για τον κόσμο Ακαδημαϊκό Έτος 2013-2014
Επαληθευσιμότητα (2) • Π.χ. Does Maharani serve vegetarian food? • Αν υποθέσουμε ότι η πρόταση σημαίνει: • Maharani serves vegetarian food • Μπορούμε να έχουμε την αναπαράσταση: • Serves(Maharani, vegetarian food) • Η οποία πρέπει να συγκριθεί με την βάση γνώσης • Η οποία περιέχει γεγονότα για εστιατόρια • Αν βρεθεί ταίριασμα => «Ναι», αλλιώς => «Όχι» • Επαληθευσιμότητα: ικανότητα σύγκρισης μιας αναπαράστασης με μια βάση γνώσης για κάποιο κόσμο Ακαδημαϊκό Έτος 2013-2014
Σαφής αναπαράσταση (1) • Μια πρόταση μπορεί να έχει διαφορετικές σημασιολογικές αναπαραστάσεις • Κάθε σημασιολογική αναπαράσταση περιγράφει μια σημασία • Ανεξάρτητα από την αμφισημία της εισόδου, η τελική αναπαράσταση της σημασίας δεν πρέπει να είναι αμφίσημη • Ενδιάμεσες αναπαραστάσεις μπορεί να φέρουν αμφισημία • “I wanna eat someplace that’s close to ICSI.” Ακαδημαϊκό Έτος 2013-2014
Σαφής αναπαράσταση (2) • Σχετική έννοια είναι και η ασάφεια (vagueness) • Η σημασιολογική αναπαράσταση δεν προσδιορίζει επακριβώς το πραγματικό γεγονός • «Θέλω να φάω Ιταλικό φαγητό» • Δεν προκύπτουν πολλαπλές αναπαραστάσεις λόγω ασάφειας • Όπως στην περίπτωση της αμφισημίας • Η ασάφεια μπορεί να είναι αποδεκτή για κάποιες εφαρμογές • Θεμιτή η ασάφεια στην σημασιολογική αναπαράσταση Ακαδημαϊκό Έτος 2013-2014
Ασάφεια ή αμφισημία • I went to the bank. • Bank: τράπεζα, όχθη • Αυτός είναι ψηλός. • Είναι ζεστό. Ακαδημαϊκό Έτος 2013-2014
Κανονική μορφή (1) • Πολλαπλές προτάσεις εισόδου μπορεί να έχουν την ίδια σημασία • Does Maharani have vegetarian dishes? • Do they have vegetarian food at Maharani? • Are vegetarian dishes served at Maharani? • Does Maharani serve vegetarian fare? • Εναλλακτική: • Τέσσερις σημασιολογικές αναπαραστάσεις • Αποθήκευση όλων των δυνατών αναπαραστάσεων στην βάση γνώσης (ΒΓ) Ακαδημαϊκό Έτος 2013-2014
Κανονική μορφή (2) • Λύση: ανάθεση σε όλες τις εισόδους με την ίδια σημασία, της ίδιας σημασιολογ. αναπαράστασης • Είναι εύκολο; • Όχι! • vegetarian fare, vegetarian dishes, vegetarian food • Σημαίνουν το ίδιο πράγμα σε αυτό το περιβάλλον χρήσης • Have, serve • Είναι ισοδύναμα, άσχετα με την διαφορετική σύνταξη • Τι μπορούμε να κάνουμε; Ακαδημαϊκό Έτος 2013-2014
Παραγωγή κανονικής μορφής • Αξιοποίηση θησαυρών για την συστηματική εξαγωγή ΣΑ • Π.χ. έννοιες λέξεων (word senses) • Food ___ • Dish ___ | ___ Υπάρχει κάποια κοινή έννοια; • Fare ___ | ___ | … • Αξιοποίηση συντακτικών δομών για την συστηματική εξαγωγή ΣΑ • [S [NP Maharani] serves [NP vegetarian dishes]] • [S [NP vegetarian dishes] are served at [NP Maharani]] Ακαδημαϊκό Έτος 2013-2014
Συμπερασμός (1) • Ένα πιο σύνθετο ερώτημα: • Can vegetarians eat at Maharani? • Αντί: Does Maharani serve vegetarian food? • Γιατί έχουν την ίδια απάντηση; • Μπορούμε να χρησιμοποιήσουμε την ίδια ΣΑ; (Όχι) • Δεν σημαίνουν το ίδιο πράγμα! • Απαντάμε το ίδιο επειδή: • Ξέρουμε τι τρώνε οι χορτοφάγοι • Ξέρουμε τι σερβίρουν τα χορτοφαγικά εστιατόρια • Κάνουμε την σύνδεση => Συμπερασμός Ακαδημαϊκό Έτος 2013-2014
Συμπερασμός (2) • Εξαγωγή συμπερασμάτων για την αλήθεια κατηγορημάτων (propositions) που δεν είναι ρητά εκφρασμένα στην ΓΒ • Δεν περιέχονται αυτούσια στην ΓΒ • serve(Maharani, VegetarianFood) =>CanEat(Vegetarians, AtMaharani) Ακαδημαϊκό Έτος 2013-2014
Εκφραστικότητα • Είναι επιθυμητό μια ΣΑ να μπορεί να περιγράψει μια ευρεία γκάμα από γεγονότα για τον κόσμο • Μια ΣΑ δεν πρέπει να θέτει σημαντικούς περιορισμούς • Ιδανικά θέλουμε μια ΣΑ ικανή να αναπαραστήσει οποιαδήποτε «λογική» πρόταση • Δεν είναι εύκολο να βρεθεί μια τέτοια ΣΑ • Υπάρχουν ωστόσο ΣΑ που είναι αρκετά εκφραστικές, επιτρέποντας την μοντελοποίηση αρκετών πραγμάτων • Πρωτοβάθμια Κατηγορηματική Λογική (First-Order Logic) Ακαδημαϊκό Έτος 2013-2014
Σημασιολογικήδομήγλώσσας(Meaning Structure of Language) • Αφορά τρόπους με τους οποίους η φυσική γλώσσα μεταφέρει σημασία • Οι φυσικές γλώσσες • Χρησιμοποιούν δομές κατηγόρημα-όρισμα (predicate – argument structure) • Χρησιμοποιούν μεταβλητές • Χρησιμοποιούν ποσοδείκτες (quantifiers) • Χρησιμοποιούν συνθετική σημασιολογία (compositional semantics) • Η σημασία κάθε έκφρασης ΦΓ υπολογίζεται ως συνάρτηση των σημασιών των επιμέρους μερών της Ακαδημαϊκό Έτος 2013-2014
Συνθετικότητα (compositionality) • Η αρχή της συνθετικότητας είναι σημαντική στην σημασιολογία: • Η σημασία μιας έκφρασης είναι αυστηρά μια συνάρτηση των σημασιών των επιμέρους μερών της • Επιτρέπει την δημιουργία ΣΑ με αυξητικό τρόπο (incrementally) • Ο κατηγορικός λογισμός (predicate logic) δεν τηρεί αυτή την αρχή Ακαδημαϊκό Έτος 2013-2014
Δομή κατηγόρημα-όρισμα (1) • Αναπαριστά έννοιες (concepts) και σχέσεις μεταξύ τους • Κάποιες λέξεις δρουν σαν ορίσματα, και κάποιες σαν κατηγορήματα: • Ουσιαστικά: έννοιες ή ορίσματα – κόκκινη(μπάλα) • Επίθετα, επιρρήματα, ρήματα: κατηγορήματα – κόκκινη(μπάλα) Ακαδημαϊκό Έτος 2013-2014
Δομή κατηγόρημα-όρισμα (2) • Τα ρήματα υπαγορεύουν περιορισμούς: • Αριθμό, γένος, πτώση • Γραμματικές κατηγορίες • Θέση των φράσεων που τα συνοδεύουν Ακαδημαϊκό Έτος 2013-2014
Δομή κατηγόρημα-όρισμα (3) • Το κατηγόρημα έχει δύο ορίσματα • Και τα δύο ορίσματα είναι τύπου ΟΦ (NP) • Το πρώτο όρισμα είναι πριν το ρήμα, και έχει τον ρόλο υποκειμένου • Το δεύτερο όρισμα είναι μετά το ρήμα, και έχει ρόλο του (άμεσου) αντικειμένου Ακαδημαϊκό Έτος 2013-2014
Σημασιολογικοί ρόλοι • Σημασιολογικοί/θεματικοί ρόλοι (semantic/thematic roles): συμμετέχουν σε ένα γεγονός • Ο υποκινητής μιας ενέργειας, ο αποδέκτης μιας ενέργειας, το αντικείμενο που μεταφέρει μια ενέργεια, κλπ. • Σημασιολογικοί περιορισμοί (selectional restrictions): περιορίζουν τους τύπους των ορισμάτων • Ο τρομοκράτης δολοφόνησε τον βουλευτή • *Η αράχνη δολοφόνησε την μύγα • • Subcategorisation ρημάτων: Επιτρέπουν την αντιστοίχιση ορισμάτων από την επιφανειακή δομή με τον συντακτικό τους ρόλο • Οι προθέσεις συμπεριφέρονται ανάλογα Ακαδημαϊκό Έτος 2013-2014
Ένα μοντέλο για τον κόσμο των εστιατορίων Ακαδημαϊκό Έτος 2013-2014
Πρωτοβάθμιος Κατηγορηματικός Λογισμός (1) • First-Order Predicate Calculus: • – Παρέχει στέρεα υπολογιστική βάση για επαληθευσιμότητα, συμπερασμό και εκφραστικότητα • Επιτρέπει τον προσδιορισμό της αλήθειας/ψεύδους ενός κατηγορήματος • Επιτρέπει την συνθετικότητα της σημασίας • Επιτρέπει την απάντηση ερωτημάτων (μέσω μεταβλητών) • Επιτρέπει συμπερασμό Ακαδημαϊκό Έτος 2013-2014
ΠΚΛ: Σύνταξη • Όροι (terms): • Σταθερές: Maharani • Συναρτήσεις: LocationOf(Maharani) • Μεταβλητές: x in LocationOf(x) • Κατηγορήματα (predicates): σχέσεις μεταξύ αντικειμένων • Serves(Maharani, VegetarianFood) • Λογικοί τελεστές: επιτρέπουν σύνθεση σημασίας • I only have $5 and I don’t have a lot of time • Have (I, $5) ∧ ¬�Have (I, lot of time) Ακαδημαϊκό Έτος 2013-2014
ΠΚΛ: Σημασιολογία • Εκφράσεις σε ΠΚΛ μπορούν να σχετιστούν με τις τιμές Αληθές (True) ή Ψευδές (False) Ακαδημαϊκό Έτος 2013-2014
Μεταβλητές και ποσοδείκτες • Existential (∃): Υπάρχει • A restaurant that serves Mexican food near UMD • (∃x)Restaurant(x) ∧ Serves(x.MexicanFood) ∧ Near(LocationOf(x),LocationOf(UMD)) • Universal (∀): Για κάθε • All vegetarian restaurants serve vegetarian food • (∀x)VegetarianRestaurant(x) ⇒ Serves(x,VegetarianFood) Ακαδημαϊκό Έτος 2013-2014
Παραδείγματα Ακαδημαϊκό Έτος 2013-2014
Γιατί χρειαζόμαστε μεταβλητές; • Προτάσεις με το ρήμα “eat” • I ate. • I ate a turkey sandwich. • I ate a turkey sandwich at my desk. • I ate at my desk. • I ate lunch. • I ate a turkey sandwich for lunch. • I ate a turkey sandwich for lunch at my desk. • • Επτά διαφορετικές αναπαραστάσεις: • Eating1 (Speaker) • Eating2 (Speaker, TurkeySandwich) • Eating3 (Speaker, TurkeySandwich, Desk) • Eating4 (Speaker, Desk) • Eating5 (Speaker, Lunch) • Eating6 (Speaker, TurkeySandwich, Lunch) • Eating7 (Speaker, TurkeySandwich, Lunch, Desk) Ακαδημαϊκό Έτος 2013-2014
Λύση με μεταβλητές Ακαδημαϊκό Έτος 2013-2014
Συμπερασμός (1) • Το κύριο κίνητρο για την χρήση της λογικής σαν ΣΑ, είναι επειδή επιτρέπει στέρεους (sound) και πλήρεις (complete) μεθόδους συμπερασμού • Στην κατηγορική λογική, ένα κατηγόρημα �, που περιέχει τις μεταβλητές Q1, … , Q𝑛, είναι έγκυρο αν το � είναι αληθές για όλες τις αληθείς τιμές των �Q1, … , Q𝑛 Ακαδημαϊκό Έτος 2013-2014
Συμπερασμός (2) • Αν υποθέσουμε ότι έχουμε: • Ένα σύνολο προτάσεων �S1, … , S𝑛 • Και τις αντίστοιχες ΣΑ �P1, … P𝑛 • Και θέλουμε να διαπιστώσουμε αν ένα �Qείναι έγκυρο • Αρκεί να ελέγξουμε αν το ακόλουθο είναι λογικά έγκυρο: • �P1 ∧ ⋯ ∧�P𝑛 ⇒ Q Ακαδημαϊκό Έτος 2013-2014
Σύνταξη και Σημασιολογία • Δύο τρόποι συνδυασμού μεταξύ συντακτικής ανάλυσης και σημασιολογικής ανάλυσης 1. Οι δύο αναλύσεις γίνονται ταυτόχρονα, εμπλουτίζοντας την γραμματική με σημασιολογία 2. Η συντακτική ανάλυση πραγματοποιείται ανεξάρτητα, και με βάση το συντακτικό δέντρο δημιουργείται η σημασιολογική ερμηνεία Ακαδημαϊκό Έτος 2013-2014
Σημασιολογικές προσαρτήσεις Ακαδημαϊκό Έτος 2013-2014
Σημασιολογία απλών προτάσεων Ακαδημαϊκό Έτος 2013-2014
Σημασιολογικές σχέσεις λέξεων • Ομώνυμα: ίδια γραφή, διαφορετικές σημασίες • Bank, γράμμα, άπειρος • Συνώνυμα: διαφορετικές λέξεις, με περίπου την ίδια σημασία • Αυτοκίνητο – αμάξι, big – large • Υπερώνυμο – υπώνυμο: ευρύτερη – στενότερη έννοια • Όχημα – αυτοκίνητο, θηλαστικό – άνθρωπος • Αντίθετα: αντίθετη έννοια • Μεγάλος – μικρός Ακαδημαϊκό Έτος 2013-2014
Wordnet • Το δημοφιλέστερο ιεραρχικά οργανωμένο λεξικό της Αγγλικής (http://wordnet.princeton.edu/) • Κάθε έννοια παριστάνεται από ένα σύνολο συνωνύμων (synset) που μπορούν να έχουν αυτή την έννοια • Ιεραρχίες υπερωνύμων-υπωνύμων ανά μέρος του λόγου (ουσιαστικά, επίθετα, ρήματα, επιρρήματα) • Παρέχει και άλλες σχέσεις • Π.χ. μερώνυμα (το «παράθυρο» μέρος του «σπιτιού») Ακαδημαϊκό Έτος 2013-2014
Αποσαφήνιση εννοιών λέξεων • Επιλογή της σωστής έννοιας μιας λέξης σε ένα κείμενο (word sense disambiguation – WSD) • Χρήσιμο και σε άλλες εφαρμογές • Επιλογή από τις δυνατές έννοιες μιας λέξης (Wordnet), ή κατασκευή των δυνατών εννοιών μιας λέξης (sense induction) • Δημοφιλής η χρήση μηχανικής μάθησης Ακαδημαϊκό Έτος 2013-2014