ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ
Download
1 / 43

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ - PowerPoint PPT Presentation


  • 120 Views
  • Uploaded on

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 5 ο : Σημασιολογική ανάλυση. Οι διαφάνειες αυτού του μαθήματος βασίζονται στο κεφάλαιο 17 του βιβλίου: « Speech and Language Processing» των D. Jurafsky και J.H. Martin, 2 η έκδοση, Pearson, 2009. Σημασιολογία. Ορισμός:

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ' - cecile


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ

Μάθημα 5ο: Σημασιολογική ανάλυση

Ακαδημαϊκό Έτος 2013-2014


Οι διαφάνειες αυτού του μαθήματος βασίζονται

στο κεφάλαιο 17 του βιβλίου:

«Speech and Language Processing»

των D. Jurafskyκαι J.H. Martin, 2η έκδοση, Pearson, 2009

Ακαδημαϊκό Έτος 2013-2014


Σημασιολογία μαθήματος βασίζονται

  • Ορισμός:

    • Είναι η επιστημονική μελέτη του γλωσσικού νοήματος ενός εκφωνήματος

  • Τι είναι «σημασία» «έννοια» και «νόημα»

    • Αγγλικά: What is the meaning of the sentence X

    • Ελληνικά: Ποιο είναι το νόημα / η έννοια / η σημασία της πρότασης Χ

Ακαδημαϊκό Έτος 2013-2014


Σημασιολογία (1) μαθήματος βασίζονται

  • Μέχρι στιγμής, έχουμε επικεντρωθεί στην δομή της γλώσσας, και όχι στο τι σημαίνουν τα στοιχεία της

  • Είδαμε ότι οι λέξεις μπορεί να έχουν διαφορετική σημασία, ανάλογα με το περιβάλλον μέσα στο οποίο έχουν χρησιμοποιηθεί

Ακαδημαϊκό Έτος 2013-2014


Σημασιολογία (2) μαθήματος βασίζονται

  • Καθημερινές εργασίες που χρειάζονται σημασιολογική ανάλυση:

    • Απάντηση ερωτήματος σε διαγώνισμα

      • Γνώση θέματος, και πώς συνήθως απαντώνται

    • Παραγγελία φαγητού σε εστιατόριο διαβάζοντας τον κατάλογο, εκτέλεση συνταγής

      • Γνώση σχετική με φαγητό, την προετοιμασία, εστιατόρια,…

    • Αναγνώριση του ότι έχεις προσβληθεί..

    • Εκμάθηση χρήσης λογισμικού διαβάζοντας το εγχειρίδιο

      • Γνώση σχετική με Η/Υ, εφαρμογές, GUI, …

Ακαδημαϊκό Έτος 2013-2014


Σημασιολογική ανάλυση μαθήματος βασίζονται

  • Η μετατροπή μιας πρότασης φυσική γλώσσας σε μια σημασιολογική αναπαράσταση (ΣΑ)

    • Η οποία αποτελείται από «πράγματα» που χρησιμοποιούνται για την αναπαράσταση καθημερινής, συνηθισμένης γνώσης του κόσμου

Ακαδημαϊκό Έτος 2013-2014


I have a car
I have a car μαθήματος βασίζονται

Ακαδημαϊκό Έτος 2013-2014


Σημασιολογικές αναπαραστάσεις (1)

  • Συνδέουν γλωσσικές μορφές με γνώση για τον κόσμο

  • Διττή αναπαράσταση:

    • Σημασίας για την πρόταση

    • Κατάστασης κάποιου κόσμου

  • Τι είναι;

    • Οτιδήποτε εξυπηρετεί τους σκοπούς ενός προγράμματος που εκτελεί σημασιολογική ανάλυση

Ακαδημαϊκό Έτος 2013-2014


Σημασιολογικές αναπαραστάσεις (2)

  • Θα καλύψουμε:

    • Ποια είναι η σημασία μιας λέξης

    • Πώς μπορούμε να αναπαραστήσουμε την σημασία

    • Τι φορμαλισμοί μπορούν να χρησιμοποιηθούν

      • Γλώσσες αναπαράστασης σημασίας

Ακαδημαϊκό Έτος 2013-2014


Αναπαράσταση σημασίας (2)

  • Επιθυμητά στοιχεία:

    • Επαληθευσιμότητα (Verifiability)

    • Σαφής Αναπαράσταση (Unambiguous Representation)

    • Κανονική Μορφή (Canonical Form)

    • Συμπερασμός (Inference)

    • Εκφραστικότητα (Expressiveness)

Ακαδημαϊκό Έτος 2013-2014


Επαληθευσιμότητα (1) (2)

  • Η πλέον στοιχειώδης ιδιότητα:

    • Ποια η σχέση μεταξύ της έννοιας της πρότασης, και του κόσμου, όπως τον ξέρουμε;

      • Πρέπει να μπορούμε να καθορίσουμε το αληθές της αναπαράστασης

  • Ένα σύστημα πρέπει να μπορεί να συγκρίνει, ταιριάζει:

    • Την σημασιολογική αναπαράσταση με μια βάση γνώσης (ΒΓ)

      • Η οποία περιέχει πληροφορία για τον κόσμο

Ακαδημαϊκό Έτος 2013-2014


Επαληθευσιμότητα (2) (2)

  • Π.χ. Does Maharani serve vegetarian food?

    • Αν υποθέσουμε ότι η πρόταση σημαίνει:

      • Maharani serves vegetarian food

    • Μπορούμε να έχουμε την αναπαράσταση:

      • Serves(Maharani, vegetarian food)

    • Η οποία πρέπει να συγκριθεί με την βάση γνώσης

      • Η οποία περιέχει γεγονότα για εστιατόρια

      • Αν βρεθεί ταίριασμα => «Ναι», αλλιώς => «Όχι»

  • Επαληθευσιμότητα: ικανότητα σύγκρισης μιας αναπαράστασης με μια βάση γνώσης για κάποιο κόσμο

Ακαδημαϊκό Έτος 2013-2014


Σαφής αναπαράσταση (1) (2)

  • Μια πρόταση μπορεί να έχει διαφορετικές σημασιολογικές αναπαραστάσεις

  • Κάθε σημασιολογική αναπαράσταση περιγράφει μια σημασία

  • Ανεξάρτητα από την αμφισημία της εισόδου, η τελική αναπαράσταση της σημασίας δεν πρέπει να είναι αμφίσημη

    • Ενδιάμεσες αναπαραστάσεις μπορεί να φέρουν αμφισημία

      • “I wanna eat someplace that’s close to ICSI.”

Ακαδημαϊκό Έτος 2013-2014


Σαφής αναπαράσταση (2) (2)

  • Σχετική έννοια είναι και η ασάφεια (vagueness)

    • Η σημασιολογική αναπαράσταση δεν προσδιορίζει επακριβώς το πραγματικό γεγονός

      • «Θέλω να φάω Ιταλικό φαγητό»

  • Δεν προκύπτουν πολλαπλές αναπαραστάσεις λόγω ασάφειας

    • Όπως στην περίπτωση της αμφισημίας

  • Η ασάφεια μπορεί να είναι αποδεκτή για κάποιες εφαρμογές

    • Θεμιτή η ασάφεια στην σημασιολογική αναπαράσταση

Ακαδημαϊκό Έτος 2013-2014


Ασάφεια ή αμφισημία (2)

  • I went to the bank.

    • Bank: τράπεζα, όχθη

  • Αυτός είναι ψηλός.

  • Είναι ζεστό.

Ακαδημαϊκό Έτος 2013-2014


Κανονική μορφή (1) (2)

  • Πολλαπλές προτάσεις εισόδου μπορεί να έχουν την ίδια σημασία

    • Does Maharani have vegetarian dishes?

    • Do they have vegetarian food at Maharani?

    • Are vegetarian dishes served at Maharani?

    • Does Maharani serve vegetarian fare?

  • Εναλλακτική:

    • Τέσσερις σημασιολογικές αναπαραστάσεις

    • Αποθήκευση όλων των δυνατών αναπαραστάσεων στην βάση γνώσης (ΒΓ)

Ακαδημαϊκό Έτος 2013-2014


Κανονική μορφή (2) (2)

  • Λύση: ανάθεση σε όλες τις εισόδους με την ίδια σημασία, της ίδιας σημασιολογ. αναπαράστασης

  • Είναι εύκολο;

    • Όχι!

    • vegetarian fare, vegetarian dishes, vegetarian food

      • Σημαίνουν το ίδιο πράγμα σε αυτό το περιβάλλον χρήσης

    • Have, serve

  • Είναι ισοδύναμα, άσχετα με την διαφορετική σύνταξη

  • Τι μπορούμε να κάνουμε;

Ακαδημαϊκό Έτος 2013-2014


Παραγωγή κανονικής μορφής (2)

  • Αξιοποίηση θησαυρών για την συστηματική εξαγωγή ΣΑ

    • Π.χ. έννοιες λέξεων (word senses)

      • Food ___

      • Dish ___ | ___ Υπάρχει κάποια κοινή έννοια;

      • Fare ___ | ___ | …

  • Αξιοποίηση συντακτικών δομών για την συστηματική εξαγωγή ΣΑ

    • [S [NP Maharani] serves [NP vegetarian dishes]]

    • [S [NP vegetarian dishes] are served at [NP Maharani]]

Ακαδημαϊκό Έτος 2013-2014


Συμπερασμός (1) (2)

  • Ένα πιο σύνθετο ερώτημα:

    • Can vegetarians eat at Maharani?

    • Αντί: Does Maharani serve vegetarian food?

  • Γιατί έχουν την ίδια απάντηση;

    • Μπορούμε να χρησιμοποιήσουμε την ίδια ΣΑ; (Όχι)

    • Δεν σημαίνουν το ίδιο πράγμα!

    • Απαντάμε το ίδιο επειδή:

      • Ξέρουμε τι τρώνε οι χορτοφάγοι

      • Ξέρουμε τι σερβίρουν τα χορτοφαγικά εστιατόρια

  • Κάνουμε την σύνδεση => Συμπερασμός

Ακαδημαϊκό Έτος 2013-2014


Συμπερασμός (2) (2)

  • Εξαγωγή συμπερασμάτων για την αλήθεια κατηγορημάτων (propositions) που δεν είναι ρητά εκφρασμένα στην ΓΒ

    • Δεν περιέχονται αυτούσια στην ΓΒ

  • serve(Maharani, VegetarianFood) =>CanEat(Vegetarians, AtMaharani)

Ακαδημαϊκό Έτος 2013-2014


Εκφραστικότητα (2)

  • Είναι επιθυμητό μια ΣΑ να μπορεί να περιγράψει μια ευρεία γκάμα από γεγονότα για τον κόσμο

    • Μια ΣΑ δεν πρέπει να θέτει σημαντικούς περιορισμούς

    • Ιδανικά θέλουμε μια ΣΑ ικανή να αναπαραστήσει οποιαδήποτε «λογική» πρόταση

  • Δεν είναι εύκολο να βρεθεί μια τέτοια ΣΑ

    • Υπάρχουν ωστόσο ΣΑ που είναι αρκετά εκφραστικές, επιτρέποντας την μοντελοποίηση αρκετών πραγμάτων

      • Πρωτοβάθμια Κατηγορηματική Λογική (First-Order Logic)

Ακαδημαϊκό Έτος 2013-2014


Meaning structure of language
Σημασιολογική (2)δομήγλώσσας(Meaning Structure of Language)

  • Αφορά τρόπους με τους οποίους η φυσική γλώσσα μεταφέρει σημασία

  • Οι φυσικές γλώσσες

    • Χρησιμοποιούν δομές κατηγόρημα-όρισμα (predicate – argument structure)

    • Χρησιμοποιούν μεταβλητές

    • Χρησιμοποιούν ποσοδείκτες (quantifiers)

    • Χρησιμοποιούν συνθετική σημασιολογία (compositional semantics)

      • Η σημασία κάθε έκφρασης ΦΓ υπολογίζεται ως συνάρτηση των σημασιών των επιμέρους μερών της

Ακαδημαϊκό Έτος 2013-2014


Compositionality
Συνθετικότητα ( (2)compositionality)

  • Η αρχή της συνθετικότητας είναι σημαντική στην σημασιολογία:

    • Η σημασία μιας έκφρασης είναι αυστηρά μια συνάρτηση των σημασιών των επιμέρους μερών της

  • Επιτρέπει την δημιουργία ΣΑ με αυξητικό τρόπο (incrementally)

  • Ο κατηγορικός λογισμός (predicate logic) δεν τηρεί αυτή την αρχή

Ακαδημαϊκό Έτος 2013-2014


Δομή κατηγόρημα-όρισμα (1) (2)

  • Αναπαριστά έννοιες (concepts) και σχέσεις μεταξύ τους

  • Κάποιες λέξεις δρουν σαν ορίσματα, και κάποιες σαν κατηγορήματα:

    • Ουσιαστικά: έννοιες ή ορίσματα – κόκκινη(μπάλα)

    • Επίθετα, επιρρήματα, ρήματα: κατηγορήματα – κόκκινη(μπάλα)

Ακαδημαϊκό Έτος 2013-2014


Δομή κατηγόρημα-όρισμα (2) (2)

  • Τα ρήματα υπαγορεύουν περιορισμούς:

    • Αριθμό, γένος, πτώση

    • Γραμματικές κατηγορίες

    • Θέση των φράσεων που τα συνοδεύουν

Ακαδημαϊκό Έτος 2013-2014


Δομή κατηγόρημα-όρισμα (3) (2)

  • Το κατηγόρημα έχει δύο ορίσματα

  • Και τα δύο ορίσματα είναι τύπου ΟΦ (NP)

  • Το πρώτο όρισμα είναι πριν το ρήμα, και έχει τον ρόλο υποκειμένου

  • Το δεύτερο όρισμα είναι μετά το ρήμα, και έχει ρόλο του (άμεσου) αντικειμένου

Ακαδημαϊκό Έτος 2013-2014


Σημασιολογικοί ρόλοι (2)

  • Σημασιολογικοί/θεματικοί ρόλοι (semantic/thematic roles): συμμετέχουν σε ένα γεγονός

    • Ο υποκινητής μιας ενέργειας, ο αποδέκτης μιας ενέργειας, το αντικείμενο που μεταφέρει μια ενέργεια, κλπ.

  • Σημασιολογικοί περιορισμοί (selectional restrictions): περιορίζουν τους τύπους των ορισμάτων

    • Ο τρομοκράτης δολοφόνησε τον βουλευτή

    • *Η αράχνη δολοφόνησε την μύγα

  • • Subcategorisation ρημάτων: Επιτρέπουν την αντιστοίχιση ορισμάτων από την επιφανειακή δομή με τον συντακτικό τους ρόλο

    • Οι προθέσεις συμπεριφέρονται ανάλογα

Ακαδημαϊκό Έτος 2013-2014


Ένα μοντέλο για τον κόσμο των εστιατορίων

Ακαδημαϊκό Έτος 2013-2014


Πρωτοβάθμιος Κατηγορηματικός Λογισμός (1)

  • First-Order Predicate Calculus:

    • – Παρέχει στέρεα υπολογιστική βάση για επαληθευσιμότητα, συμπερασμό και εκφραστικότητα

      • Επιτρέπει τον προσδιορισμό της αλήθειας/ψεύδους ενός κατηγορήματος

      • Επιτρέπει την συνθετικότητα της σημασίας

      • Επιτρέπει την απάντηση ερωτημάτων (μέσω μεταβλητών)

      • Επιτρέπει συμπερασμό

Ακαδημαϊκό Έτος 2013-2014


ΠΚΛ: Σύνταξη Λογισμός (1)

  • Όροι (terms):

    • Σταθερές: Maharani

    • Συναρτήσεις: LocationOf(Maharani)

    • Μεταβλητές: x in LocationOf(x)

  • Κατηγορήματα (predicates): σχέσεις μεταξύ αντικειμένων

    • Serves(Maharani, VegetarianFood)

  • Λογικοί τελεστές: επιτρέπουν σύνθεση σημασίας

    • I only have $5 and I don’t have a lot of time

    • Have (I, $5) ∧ ¬�Have (I, lot of time)

Ακαδημαϊκό Έτος 2013-2014


ΠΚΛ: Σημασιολογία Λογισμός (1)

  • Εκφράσεις σε ΠΚΛ μπορούν να σχετιστούν με τις τιμές Αληθές (True) ή Ψευδές (False)

Ακαδημαϊκό Έτος 2013-2014


Μεταβλητές και ποσοδείκτες Λογισμός (1)

  • Existential (∃): Υπάρχει

    • A restaurant that serves Mexican food near UMD

    • (∃x)Restaurant(x) ∧ Serves(x.MexicanFood) ∧ Near(LocationOf(x),LocationOf(UMD))

  • Universal (∀): Για κάθε

    • All vegetarian restaurants serve vegetarian food

    • (∀x)VegetarianRestaurant(x) ⇒ Serves(x,VegetarianFood)

Ακαδημαϊκό Έτος 2013-2014


Παραδείγματα Λογισμός (1)

Ακαδημαϊκό Έτος 2013-2014


Γιατί χρειαζόμαστε μεταβλητές; Λογισμός (1)

  • Προτάσεις με το ρήμα “eat”

    • I ate.

    • I ate a turkey sandwich.

    • I ate a turkey sandwich at my desk.

    • I ate at my desk.

    • I ate lunch.

    • I ate a turkey sandwich for lunch.

    • I ate a turkey sandwich for lunch at my desk.

  • • Επτά διαφορετικές αναπαραστάσεις:

    • Eating1 (Speaker)

    • Eating2 (Speaker, TurkeySandwich)

    • Eating3 (Speaker, TurkeySandwich, Desk)

    • Eating4 (Speaker, Desk)

    • Eating5 (Speaker, Lunch)

    • Eating6 (Speaker, TurkeySandwich, Lunch)

    • Eating7 (Speaker, TurkeySandwich, Lunch, Desk)

Ακαδημαϊκό Έτος 2013-2014


Λύση με μεταβλητές Λογισμός (1)

Ακαδημαϊκό Έτος 2013-2014


Συμπερασμός Λογισμός (1) (1)

  • Το κύριο κίνητρο για την χρήση της λογικής σαν ΣΑ, είναι επειδή επιτρέπει στέρεους (sound) και πλήρεις (complete) μεθόδους συμπερασμού

  • Στην κατηγορική λογική, ένα κατηγόρημα �, που περιέχει τις μεταβλητές Q1, … , Q𝑛, είναι έγκυρο αν το � είναι αληθές για όλες τις αληθείς τιμές των �Q1, … , Q𝑛

Ακαδημαϊκό Έτος 2013-2014


Συμπερασμός (2) Λογισμός (1)

  • Αν υποθέσουμε ότι έχουμε:

    • Ένα σύνολο προτάσεων �S1, … , S𝑛

    • Και τις αντίστοιχες ΣΑ �P1, … P𝑛

  • Και θέλουμε να διαπιστώσουμε αν ένα �Qείναι έγκυρο

    • Αρκεί να ελέγξουμε αν το ακόλουθο είναι λογικά έγκυρο:

    • �P1 ∧ ⋯ ∧�P𝑛 ⇒ Q

Ακαδημαϊκό Έτος 2013-2014


Σύνταξη και Λογισμός (1)Σημασιολογία

  • Δύο τρόποι συνδυασμού μεταξύ συντακτικής ανάλυσης και σημασιολογικής ανάλυσης

    1. Οι δύο αναλύσεις γίνονται ταυτόχρονα, εμπλουτίζοντας την γραμματική με σημασιολογία

    2. Η συντακτική ανάλυση πραγματοποιείται ανεξάρτητα, και με βάση το συντακτικό δέντρο δημιουργείται η σημασιολογική ερμηνεία

Ακαδημαϊκό Έτος 2013-2014


Σημασιολογικές προσαρτήσεις Λογισμός (1)

Ακαδημαϊκό Έτος 2013-2014


Σημασιολογία απλών προτάσεων Λογισμός (1)

Ακαδημαϊκό Έτος 2013-2014


Σημασιολογικές σχέσεις λέξεων Λογισμός (1)

  • Ομώνυμα: ίδια γραφή, διαφορετικές σημασίες

    • Bank, γράμμα, άπειρος

  • Συνώνυμα: διαφορετικές λέξεις, με περίπου την ίδια σημασία

    • Αυτοκίνητο – αμάξι, big – large

  • Υπερώνυμο – υπώνυμο: ευρύτερη – στενότερη έννοια

    • Όχημα – αυτοκίνητο, θηλαστικό – άνθρωπος

  • Αντίθετα: αντίθετη έννοια

    • Μεγάλος – μικρός

Ακαδημαϊκό Έτος 2013-2014


Wordnet
Wordnet Λογισμός (1)

  • Το δημοφιλέστερο ιεραρχικά οργανωμένο λεξικό της Αγγλικής (http://wordnet.princeton.edu/)

  • Κάθε έννοια παριστάνεται από ένα σύνολο συνωνύμων (synset) που μπορούν να έχουν αυτή την έννοια

  • Ιεραρχίες υπερωνύμων-υπωνύμων ανά μέρος του λόγου (ουσιαστικά, επίθετα, ρήματα, επιρρήματα)

  • Παρέχει και άλλες σχέσεις

    • Π.χ. μερώνυμα (το «παράθυρο» μέρος του «σπιτιού»)

Ακαδημαϊκό Έτος 2013-2014


Αποσαφήνιση εννοιών λέξεων Λογισμός (1)

  • Επιλογή της σωστής έννοιας μιας λέξης σε ένα κείμενο (word sense disambiguation – WSD)

    • Χρήσιμο και σε άλλες εφαρμογές

    • Επιλογή από τις δυνατές έννοιες μιας λέξης (Wordnet), ή κατασκευή των δυνατών εννοιών μιας λέξης (sense induction)

    • Δημοφιλής η χρήση μηχανικής μάθησης

Ακαδημαϊκό Έτος 2013-2014


ad