1 / 43

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 5 ο : Σημασιολογική ανάλυση. Οι διαφάνειες αυτού του μαθήματος βασίζονται στο κεφάλαιο 17 του βιβλίου: « Speech and Language Processing» των D. Jurafsky και J.H. Martin, 2 η έκδοση, Pearson, 2009. Σημασιολογία. Ορισμός:

cecile
Download Presentation

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 5ο: Σημασιολογική ανάλυση Ακαδημαϊκό Έτος 2013-2014

  2. Οι διαφάνειες αυτού του μαθήματος βασίζονται στο κεφάλαιο 17 του βιβλίου: «Speech and Language Processing» των D. Jurafskyκαι J.H. Martin, 2η έκδοση, Pearson, 2009 Ακαδημαϊκό Έτος 2013-2014

  3. Σημασιολογία • Ορισμός: • Είναι η επιστημονική μελέτη του γλωσσικού νοήματος ενός εκφωνήματος • Τι είναι «σημασία» «έννοια» και «νόημα» • Αγγλικά: What is the meaning of the sentence X • Ελληνικά: Ποιο είναι το νόημα / η έννοια / η σημασία της πρότασης Χ Ακαδημαϊκό Έτος 2013-2014

  4. Σημασιολογία (1) • Μέχρι στιγμής, έχουμε επικεντρωθεί στην δομή της γλώσσας, και όχι στο τι σημαίνουν τα στοιχεία της • Είδαμε ότι οι λέξεις μπορεί να έχουν διαφορετική σημασία, ανάλογα με το περιβάλλον μέσα στο οποίο έχουν χρησιμοποιηθεί Ακαδημαϊκό Έτος 2013-2014

  5. Σημασιολογία (2) • Καθημερινές εργασίες που χρειάζονται σημασιολογική ανάλυση: • Απάντηση ερωτήματος σε διαγώνισμα • Γνώση θέματος, και πώς συνήθως απαντώνται • Παραγγελία φαγητού σε εστιατόριο διαβάζοντας τον κατάλογο, εκτέλεση συνταγής • Γνώση σχετική με φαγητό, την προετοιμασία, εστιατόρια,… • Αναγνώριση του ότι έχεις προσβληθεί.. • Εκμάθηση χρήσης λογισμικού διαβάζοντας το εγχειρίδιο • Γνώση σχετική με Η/Υ, εφαρμογές, GUI, … Ακαδημαϊκό Έτος 2013-2014

  6. Σημασιολογική ανάλυση • Η μετατροπή μιας πρότασης φυσική γλώσσας σε μια σημασιολογική αναπαράσταση (ΣΑ) • Η οποία αποτελείται από «πράγματα» που χρησιμοποιούνται για την αναπαράσταση καθημερινής, συνηθισμένης γνώσης του κόσμου Ακαδημαϊκό Έτος 2013-2014

  7. I have a car Ακαδημαϊκό Έτος 2013-2014

  8. Σημασιολογικές αναπαραστάσεις (1) • Συνδέουν γλωσσικές μορφές με γνώση για τον κόσμο • Διττή αναπαράσταση: • Σημασίας για την πρόταση • Κατάστασης κάποιου κόσμου • Τι είναι; • Οτιδήποτε εξυπηρετεί τους σκοπούς ενός προγράμματος που εκτελεί σημασιολογική ανάλυση Ακαδημαϊκό Έτος 2013-2014

  9. Σημασιολογικές αναπαραστάσεις (2) • Θα καλύψουμε: • Ποια είναι η σημασία μιας λέξης • Πώς μπορούμε να αναπαραστήσουμε την σημασία • Τι φορμαλισμοί μπορούν να χρησιμοποιηθούν • Γλώσσες αναπαράστασης σημασίας Ακαδημαϊκό Έτος 2013-2014

  10. Αναπαράσταση σημασίας • Επιθυμητά στοιχεία: • Επαληθευσιμότητα (Verifiability) • Σαφής Αναπαράσταση (Unambiguous Representation) • Κανονική Μορφή (Canonical Form) • Συμπερασμός (Inference) • Εκφραστικότητα (Expressiveness) Ακαδημαϊκό Έτος 2013-2014

  11. Επαληθευσιμότητα (1) • Η πλέον στοιχειώδης ιδιότητα: • Ποια η σχέση μεταξύ της έννοιας της πρότασης, και του κόσμου, όπως τον ξέρουμε; • Πρέπει να μπορούμε να καθορίσουμε το αληθές της αναπαράστασης • Ένα σύστημα πρέπει να μπορεί να συγκρίνει, ταιριάζει: • Την σημασιολογική αναπαράσταση με μια βάση γνώσης (ΒΓ) • Η οποία περιέχει πληροφορία για τον κόσμο Ακαδημαϊκό Έτος 2013-2014

  12. Επαληθευσιμότητα (2) • Π.χ. Does Maharani serve vegetarian food? • Αν υποθέσουμε ότι η πρόταση σημαίνει: • Maharani serves vegetarian food • Μπορούμε να έχουμε την αναπαράσταση: • Serves(Maharani, vegetarian food) • Η οποία πρέπει να συγκριθεί με την βάση γνώσης • Η οποία περιέχει γεγονότα για εστιατόρια • Αν βρεθεί ταίριασμα => «Ναι», αλλιώς => «Όχι» • Επαληθευσιμότητα: ικανότητα σύγκρισης μιας αναπαράστασης με μια βάση γνώσης για κάποιο κόσμο Ακαδημαϊκό Έτος 2013-2014

  13. Σαφής αναπαράσταση (1) • Μια πρόταση μπορεί να έχει διαφορετικές σημασιολογικές αναπαραστάσεις • Κάθε σημασιολογική αναπαράσταση περιγράφει μια σημασία • Ανεξάρτητα από την αμφισημία της εισόδου, η τελική αναπαράσταση της σημασίας δεν πρέπει να είναι αμφίσημη • Ενδιάμεσες αναπαραστάσεις μπορεί να φέρουν αμφισημία • “I wanna eat someplace that’s close to ICSI.” Ακαδημαϊκό Έτος 2013-2014

  14. Σαφής αναπαράσταση (2) • Σχετική έννοια είναι και η ασάφεια (vagueness) • Η σημασιολογική αναπαράσταση δεν προσδιορίζει επακριβώς το πραγματικό γεγονός • «Θέλω να φάω Ιταλικό φαγητό» • Δεν προκύπτουν πολλαπλές αναπαραστάσεις λόγω ασάφειας • Όπως στην περίπτωση της αμφισημίας • Η ασάφεια μπορεί να είναι αποδεκτή για κάποιες εφαρμογές • Θεμιτή η ασάφεια στην σημασιολογική αναπαράσταση Ακαδημαϊκό Έτος 2013-2014

  15. Ασάφεια ή αμφισημία • I went to the bank. • Bank: τράπεζα, όχθη • Αυτός είναι ψηλός. • Είναι ζεστό. Ακαδημαϊκό Έτος 2013-2014

  16. Κανονική μορφή (1) • Πολλαπλές προτάσεις εισόδου μπορεί να έχουν την ίδια σημασία • Does Maharani have vegetarian dishes? • Do they have vegetarian food at Maharani? • Are vegetarian dishes served at Maharani? • Does Maharani serve vegetarian fare? • Εναλλακτική: • Τέσσερις σημασιολογικές αναπαραστάσεις • Αποθήκευση όλων των δυνατών αναπαραστάσεων στην βάση γνώσης (ΒΓ) Ακαδημαϊκό Έτος 2013-2014

  17. Κανονική μορφή (2) • Λύση: ανάθεση σε όλες τις εισόδους με την ίδια σημασία, της ίδιας σημασιολογ. αναπαράστασης • Είναι εύκολο; • Όχι! • vegetarian fare, vegetarian dishes, vegetarian food • Σημαίνουν το ίδιο πράγμα σε αυτό το περιβάλλον χρήσης • Have, serve • Είναι ισοδύναμα, άσχετα με την διαφορετική σύνταξη • Τι μπορούμε να κάνουμε; Ακαδημαϊκό Έτος 2013-2014

  18. Παραγωγή κανονικής μορφής • Αξιοποίηση θησαυρών για την συστηματική εξαγωγή ΣΑ • Π.χ. έννοιες λέξεων (word senses) • Food ___ • Dish ___ | ___ Υπάρχει κάποια κοινή έννοια; • Fare ___ | ___ | … • Αξιοποίηση συντακτικών δομών για την συστηματική εξαγωγή ΣΑ • [S [NP Maharani] serves [NP vegetarian dishes]] • [S [NP vegetarian dishes] are served at [NP Maharani]] Ακαδημαϊκό Έτος 2013-2014

  19. Συμπερασμός (1) • Ένα πιο σύνθετο ερώτημα: • Can vegetarians eat at Maharani? • Αντί: Does Maharani serve vegetarian food? • Γιατί έχουν την ίδια απάντηση; • Μπορούμε να χρησιμοποιήσουμε την ίδια ΣΑ; (Όχι) • Δεν σημαίνουν το ίδιο πράγμα! • Απαντάμε το ίδιο επειδή: • Ξέρουμε τι τρώνε οι χορτοφάγοι • Ξέρουμε τι σερβίρουν τα χορτοφαγικά εστιατόρια • Κάνουμε την σύνδεση => Συμπερασμός Ακαδημαϊκό Έτος 2013-2014

  20. Συμπερασμός (2) • Εξαγωγή συμπερασμάτων για την αλήθεια κατηγορημάτων (propositions) που δεν είναι ρητά εκφρασμένα στην ΓΒ • Δεν περιέχονται αυτούσια στην ΓΒ • serve(Maharani, VegetarianFood) =>CanEat(Vegetarians, AtMaharani) Ακαδημαϊκό Έτος 2013-2014

  21. Εκφραστικότητα • Είναι επιθυμητό μια ΣΑ να μπορεί να περιγράψει μια ευρεία γκάμα από γεγονότα για τον κόσμο • Μια ΣΑ δεν πρέπει να θέτει σημαντικούς περιορισμούς • Ιδανικά θέλουμε μια ΣΑ ικανή να αναπαραστήσει οποιαδήποτε «λογική» πρόταση • Δεν είναι εύκολο να βρεθεί μια τέτοια ΣΑ • Υπάρχουν ωστόσο ΣΑ που είναι αρκετά εκφραστικές, επιτρέποντας την μοντελοποίηση αρκετών πραγμάτων • Πρωτοβάθμια Κατηγορηματική Λογική (First-Order Logic) Ακαδημαϊκό Έτος 2013-2014

  22. Σημασιολογικήδομήγλώσσας(Meaning Structure of Language) • Αφορά τρόπους με τους οποίους η φυσική γλώσσα μεταφέρει σημασία • Οι φυσικές γλώσσες • Χρησιμοποιούν δομές κατηγόρημα-όρισμα (predicate – argument structure) • Χρησιμοποιούν μεταβλητές • Χρησιμοποιούν ποσοδείκτες (quantifiers) • Χρησιμοποιούν συνθετική σημασιολογία (compositional semantics) • Η σημασία κάθε έκφρασης ΦΓ υπολογίζεται ως συνάρτηση των σημασιών των επιμέρους μερών της Ακαδημαϊκό Έτος 2013-2014

  23. Συνθετικότητα (compositionality) • Η αρχή της συνθετικότητας είναι σημαντική στην σημασιολογία: • Η σημασία μιας έκφρασης είναι αυστηρά μια συνάρτηση των σημασιών των επιμέρους μερών της • Επιτρέπει την δημιουργία ΣΑ με αυξητικό τρόπο (incrementally) • Ο κατηγορικός λογισμός (predicate logic) δεν τηρεί αυτή την αρχή Ακαδημαϊκό Έτος 2013-2014

  24. Δομή κατηγόρημα-όρισμα (1) • Αναπαριστά έννοιες (concepts) και σχέσεις μεταξύ τους • Κάποιες λέξεις δρουν σαν ορίσματα, και κάποιες σαν κατηγορήματα: • Ουσιαστικά: έννοιες ή ορίσματα – κόκκινη(μπάλα) • Επίθετα, επιρρήματα, ρήματα: κατηγορήματα – κόκκινη(μπάλα) Ακαδημαϊκό Έτος 2013-2014

  25. Δομή κατηγόρημα-όρισμα (2) • Τα ρήματα υπαγορεύουν περιορισμούς: • Αριθμό, γένος, πτώση • Γραμματικές κατηγορίες • Θέση των φράσεων που τα συνοδεύουν Ακαδημαϊκό Έτος 2013-2014

  26. Δομή κατηγόρημα-όρισμα (3) • Το κατηγόρημα έχει δύο ορίσματα • Και τα δύο ορίσματα είναι τύπου ΟΦ (NP) • Το πρώτο όρισμα είναι πριν το ρήμα, και έχει τον ρόλο υποκειμένου • Το δεύτερο όρισμα είναι μετά το ρήμα, και έχει ρόλο του (άμεσου) αντικειμένου Ακαδημαϊκό Έτος 2013-2014

  27. Σημασιολογικοί ρόλοι • Σημασιολογικοί/θεματικοί ρόλοι (semantic/thematic roles): συμμετέχουν σε ένα γεγονός • Ο υποκινητής μιας ενέργειας, ο αποδέκτης μιας ενέργειας, το αντικείμενο που μεταφέρει μια ενέργεια, κλπ. • Σημασιολογικοί περιορισμοί (selectional restrictions): περιορίζουν τους τύπους των ορισμάτων • Ο τρομοκράτης δολοφόνησε τον βουλευτή • *Η αράχνη δολοφόνησε την μύγα • • Subcategorisation ρημάτων: Επιτρέπουν την αντιστοίχιση ορισμάτων από την επιφανειακή δομή με τον συντακτικό τους ρόλο • Οι προθέσεις συμπεριφέρονται ανάλογα Ακαδημαϊκό Έτος 2013-2014

  28. Ένα μοντέλο για τον κόσμο των εστιατορίων Ακαδημαϊκό Έτος 2013-2014

  29. Πρωτοβάθμιος Κατηγορηματικός Λογισμός (1) • First-Order Predicate Calculus: • – Παρέχει στέρεα υπολογιστική βάση για επαληθευσιμότητα, συμπερασμό και εκφραστικότητα • Επιτρέπει τον προσδιορισμό της αλήθειας/ψεύδους ενός κατηγορήματος • Επιτρέπει την συνθετικότητα της σημασίας • Επιτρέπει την απάντηση ερωτημάτων (μέσω μεταβλητών) • Επιτρέπει συμπερασμό Ακαδημαϊκό Έτος 2013-2014

  30. ΠΚΛ: Σύνταξη • Όροι (terms): • Σταθερές: Maharani • Συναρτήσεις: LocationOf(Maharani) • Μεταβλητές: x in LocationOf(x) • Κατηγορήματα (predicates): σχέσεις μεταξύ αντικειμένων • Serves(Maharani, VegetarianFood) • Λογικοί τελεστές: επιτρέπουν σύνθεση σημασίας • I only have $5 and I don’t have a lot of time • Have (I, $5) ∧ ¬�Have (I, lot of time) Ακαδημαϊκό Έτος 2013-2014

  31. ΠΚΛ: Σημασιολογία • Εκφράσεις σε ΠΚΛ μπορούν να σχετιστούν με τις τιμές Αληθές (True) ή Ψευδές (False) Ακαδημαϊκό Έτος 2013-2014

  32. Μεταβλητές και ποσοδείκτες • Existential (∃): Υπάρχει • A restaurant that serves Mexican food near UMD • (∃x)Restaurant(x) ∧ Serves(x.MexicanFood) ∧ Near(LocationOf(x),LocationOf(UMD)) • Universal (∀): Για κάθε • All vegetarian restaurants serve vegetarian food • (∀x)VegetarianRestaurant(x) ⇒ Serves(x,VegetarianFood) Ακαδημαϊκό Έτος 2013-2014

  33. Παραδείγματα Ακαδημαϊκό Έτος 2013-2014

  34. Γιατί χρειαζόμαστε μεταβλητές; • Προτάσεις με το ρήμα “eat” • I ate. • I ate a turkey sandwich. • I ate a turkey sandwich at my desk. • I ate at my desk. • I ate lunch. • I ate a turkey sandwich for lunch. • I ate a turkey sandwich for lunch at my desk. • • Επτά διαφορετικές αναπαραστάσεις: • Eating1 (Speaker) • Eating2 (Speaker, TurkeySandwich) • Eating3 (Speaker, TurkeySandwich, Desk) • Eating4 (Speaker, Desk) • Eating5 (Speaker, Lunch) • Eating6 (Speaker, TurkeySandwich, Lunch) • Eating7 (Speaker, TurkeySandwich, Lunch, Desk) Ακαδημαϊκό Έτος 2013-2014

  35. Λύση με μεταβλητές Ακαδημαϊκό Έτος 2013-2014

  36. Συμπερασμός (1) • Το κύριο κίνητρο για την χρήση της λογικής σαν ΣΑ, είναι επειδή επιτρέπει στέρεους (sound) και πλήρεις (complete) μεθόδους συμπερασμού • Στην κατηγορική λογική, ένα κατηγόρημα �, που περιέχει τις μεταβλητές Q1, … , Q𝑛, είναι έγκυρο αν το � είναι αληθές για όλες τις αληθείς τιμές των �Q1, … , Q𝑛 Ακαδημαϊκό Έτος 2013-2014

  37. Συμπερασμός (2) • Αν υποθέσουμε ότι έχουμε: • Ένα σύνολο προτάσεων �S1, … , S𝑛 • Και τις αντίστοιχες ΣΑ �P1, … P𝑛 • Και θέλουμε να διαπιστώσουμε αν ένα �Qείναι έγκυρο • Αρκεί να ελέγξουμε αν το ακόλουθο είναι λογικά έγκυρο: • �P1 ∧ ⋯ ∧�P𝑛 ⇒ Q Ακαδημαϊκό Έτος 2013-2014

  38. Σύνταξη και Σημασιολογία • Δύο τρόποι συνδυασμού μεταξύ συντακτικής ανάλυσης και σημασιολογικής ανάλυσης 1. Οι δύο αναλύσεις γίνονται ταυτόχρονα, εμπλουτίζοντας την γραμματική με σημασιολογία 2. Η συντακτική ανάλυση πραγματοποιείται ανεξάρτητα, και με βάση το συντακτικό δέντρο δημιουργείται η σημασιολογική ερμηνεία Ακαδημαϊκό Έτος 2013-2014

  39. Σημασιολογικές προσαρτήσεις Ακαδημαϊκό Έτος 2013-2014

  40. Σημασιολογία απλών προτάσεων Ακαδημαϊκό Έτος 2013-2014

  41. Σημασιολογικές σχέσεις λέξεων • Ομώνυμα: ίδια γραφή, διαφορετικές σημασίες • Bank, γράμμα, άπειρος • Συνώνυμα: διαφορετικές λέξεις, με περίπου την ίδια σημασία • Αυτοκίνητο – αμάξι, big – large • Υπερώνυμο – υπώνυμο: ευρύτερη – στενότερη έννοια • Όχημα – αυτοκίνητο, θηλαστικό – άνθρωπος • Αντίθετα: αντίθετη έννοια • Μεγάλος – μικρός Ακαδημαϊκό Έτος 2013-2014

  42. Wordnet • Το δημοφιλέστερο ιεραρχικά οργανωμένο λεξικό της Αγγλικής (http://wordnet.princeton.edu/) • Κάθε έννοια παριστάνεται από ένα σύνολο συνωνύμων (synset) που μπορούν να έχουν αυτή την έννοια • Ιεραρχίες υπερωνύμων-υπωνύμων ανά μέρος του λόγου (ουσιαστικά, επίθετα, ρήματα, επιρρήματα) • Παρέχει και άλλες σχέσεις • Π.χ. μερώνυμα (το «παράθυρο» μέρος του «σπιτιού») Ακαδημαϊκό Έτος 2013-2014

  43. Αποσαφήνιση εννοιών λέξεων • Επιλογή της σωστής έννοιας μιας λέξης σε ένα κείμενο (word sense disambiguation – WSD) • Χρήσιμο και σε άλλες εφαρμογές • Επιλογή από τις δυνατές έννοιες μιας λέξης (Wordnet), ή κατασκευή των δυνατών εννοιών μιας λέξης (sense induction) • Δημοφιλής η χρήση μηχανικής μάθησης Ακαδημαϊκό Έτος 2013-2014

More Related