1 / 50

Κορφιάτης Γιώργος Παλιούρας Γιώργος

Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσμιο Ιστό με χρήση μεθόδων Συμπερασμού Γραμματικών. Κορφιάτης Γιώργος Παλιούρας Γιώργος. Αντικείμενο. Κατασκευή μοντέλου ικανού να περιγράψει την πλοήγηση των χρηστών στον Παγκόσμιο Ιστό Χρήση του μοντέλου για πρόταση σελίδων. Περιεχόμενα.

tyrone
Download Presentation

Κορφιάτης Γιώργος Παλιούρας Γιώργος

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσμιο Ιστό με χρήση μεθόδων Συμπερασμού Γραμματικών Κορφιάτης Γιώργος Παλιούρας Γιώργος

  2. Αντικείμενο • Κατασκευή μοντέλου ικανού να περιγράψει την πλοήγηση των χρηστών στον Παγκόσμιο Ιστό • Χρήση του μοντέλου για πρόταση σελίδων

  3. Περιεχόμενα • Εξατομίκευση • Μέθοδοι Συμπερασμού Γραμματικών • Μέθοδος μοντελοποίησης της πλοήγησης στον Ιστό • Πειραματική Αξιολόγηση • Συμπεράσματα

  4. Παγκόσμιος Ιστός Ανεξάντλητη πηγή πληροφοριών αλλά… • Έλλειψη δομής • Υπερσυσσώρευση πληροφοριών • Χρήστες μη ειδικοί

  5. Παγκόσμιος Ιστός Ανάγκη υποβοήθησης του χρήστη στον εντοπισμό χρήσιμης πληροφορίας Λύση: Εξατομίκευση των υπηρεσιών

  6. Εξατομίκευση Σε επίπεδο ιστοχώρου: • Αναγνώριση χρήστη • Προσαρμογή ιστοσελίδας στα μέτρα του χρήστη • Καθοδήγηση (πρόταση συνδέσμων) Μοντελοποίηση χρήστη με τεχνικές Εξόρυξης Γνώσης από Δεδομένα (Data Mining)

  7. Ανακάλυψη Προτύπων Πλοήγησης • Στόχος η πρόταση συνδέσμων • Μοντελοποίηση της πλοήγησης • Διαδικασία εξόρυξης γνώσης από δεδομένα χρήσης

  8. Προσεγγίσεις • Ντετερμινιστικές • Εύρεση συχνά επαναλαμβανόμενων ακολουθιών σελίδων • Κανόνες διαδοχής, Κοινότητες χρηστών • Στοχαστικές • Κατασκευή μοντέλου πιθανοτήτων • Χρήση μαρκοβιανών μοντέλων • Χρήση Συμπερασμού Γραμματικών

  9. Προσεγγίσεις Κατάλληλες για έναν ιστοχώρο αλλά… Ακατάλληλες για τον Παγκόσμιο Ιστό • Μεγάλος όγκος • Ανομοιογένεια περιεχομένου

  10. Μοντελοποίηση της πλοήγησης σε όλο τον Παγκόσμιο Ιστό Τα δεδομένα χρήσης δεν επαρκούν Χρειάζεται επιπλέον πληροφορία π.χ. σύγκριση περιεχομένου των σελίδων

  11. Η προσέγγισή μας • Περιγραφή πλοήγησης με γραμματική • Χρήση μεθόδων Συμπερασμού Γραμματικών • Αξιοποίηση δεδομένων χρήσης και πληροφορίας για ομοιότητα περιεχομένου σελίδων

  12. G0 Δεδομένα G Παραγωγή Συμπερασμός Συμπερασμός Γραμματικών • Κλάδος της Μηχανικής Μάθησης • Επαγωγική εκμάθηση γραμματικής από δεδομένα

  13. Κανονικές Γραμματικές • Απλούστερη κλάση γραμματικών • Κανόνες της μορφής: A→aB| a| ε

  14. Πιθανοτικές Κανονικές Γραμματικές • Πιθανότητα εμφάνισης συμβολοσειράς • Πιθανότητες πάνω στις μεταβάσεις και στους κόμβους

  15. Μέθοδος Alergia • Συμπερασμός πιθανοτικής κανονικής γραμματικής (αυτομάτου) • Ξεκινά από δενδρική δομή (PPTA) Εφαρμογή: Σύμβολα ↔ Ιστοσελίδες Συμβολοσειρές ↔ Σύνοδοι χρήσης

  16. Alergia: Αρχικό PPTA

  17. Alergia • Συγχωνεύει κόμβους • Κριτήριο Συμβατότητας: όμοιες μεταβάσεις

  18. Alergia: Εκτέλεση

  19. Alergia: Εκτέλεση

  20. Alergia: Εκτέλεση

  21. Alergia: Εκτέλεση

  22. Alergia: Εκτέλεση

  23. Μέθοδος Blue Fringe • Παρόμοια με τον Alergia • Πιο έξυπνη επιλογή συγχωνεύσεων • Σύνολα κόκκινων και μπλε κόμβων • Βαθμολογεί τα ζευγάρια κόκκινων-μπλε • Επιλέγει το καλύτερο ζευγάρι • Μεγαλύτερη χρονική πολυπλοκότητα

  24. Blue Fringe: Εκτέλεση

  25. Blue Fringe: Εκτέλεση

  26. Blue Fringe: Εκτέλεση

  27. Blue Fringe: Εκτέλεση

  28. Blue Fringe: Εκτέλεση

  29. Αξιοποίηση για μοντελοποίηση πλοήγησης στον Ιστό

  30. Νέα μέθοδος CANUMGI Content-Aware Navigational User Modeling with Grammatical Inference • Τροποποίηση μεθόδων Alergia και Blue Fringe • Κατασκευή του μοντέλου off-line • Υπολογισμός συμβατότητας καταστάσεων • Μετρικό χρήσης (όμοιες μεταβάσεις) • Μετρικό περιεχομένου (ομοιότητα περιεχομένου σελίδων)

  31. Ομοιότητα περιεχομένου Ιστοσελίδες ↔ Διάνυσμα λέξεων-κλειδιών Χρήση μετρικού συνημιτόνου

  32. Ομοιότητα περιεχομένου Παράδειγμα:

  33. CANUMGI-A • Βασίζεται στον Alergia • Τα δύο μετρικά λογικές τιμές • Συνδυασμός μετρικών • Σύζευξη • Διάζευξη

  34. CANUMGI-B • Βασίζεται στον Blue Fringe • Τα δύο μετρικά πραγματικές τιμές • Συνδυασμός μετρικών • Ελάχιστη τιμή • Μέγιστη τιμή • Σταθμισμένο άθροισμα

  35. CANUMGI-C • Μείωση Διαστασιμότητας • Αρχική ομαδοποίηση των σελίδων ως προς το περιεχόμενο • Στόχος: Εκ των προτέρων χωρισμός σελίδων σε θεματικές κατηγορίες • Χρήση ομάδων αντί για σελίδες • Ακολουθεί η επαγωγική διαδικασία

  36. CANUMGI-C Παράδειγμα:

  37. CANUMGI-C PPTA χωρίς μείωση διαστασιμότητας

  38. CANUMGI-C PPTA με μείωση διαστασιμότητας

  39. Χρήση του μοντέλου • On-line λειτουργία • Εξατομικευμένη πλοήγηση • Πρόταση σελίδων στους χρήστες • Διαδικασία σε δύο στάδια: • Διάσχιση του γράφου • Επιλογή σελίδων

  40. Διάσχιση του γράφου • Αλληλουχία σελίδων ↔ μεταβάσεις στο γράφο • Αν δεν υπάρχει ρητή μετάβαση, επιλογή του πιο όμοιου κόμβου-παιδιού • Αν δεν υπάρχει αρκετά όμοιος κόμβος, επιστροφή στον κόμβο εκκίνησης

  41. Επιλογή σελίδων • Προσέγγιση 1 • Επιλογή κόμβου-παιδιού με μεγαλύτερη πιθανότητα μετάβασης • Επιλογή σελίδων πιο κοντά στο κέντρο βάρους • Προσέγγιση 2 Επιλογή σελίδων με μεγαλύτερο γινόμενο πιθανότητας μετάβασης επί εγγύτητα στο κέντρο βάρους

  42. Πειραματική αξιολόγηση • Δεδομένα χρήσης από αρχεία καταγραφής εταιρείας ISP • Προεπεξεργασία • Χωρισμός σε συνόδους χρήσης • Εύρεση λέξεων-κλειδιών • Χωρισμός δεδομένων σε δύο σύνολα • Δείγμα εκπαίδευσης (κατασκευή μοντέλου) • Δείγμα ελέγχου (αξιολόγηση)

  43. Πειραματική αξιολόγηση Διαδικασία • Αξιοποίηση συνόδων χρήσης δείγματος ελέγχου • Αποκρύβουμε τελευταία σελίδα συνόδου χρήσης • Χρησιμοποιούμε τις υπόλοιπες για διάσχιση του γράφου και επιλογή σελίδων

  44. Πειραματική αξιολόγηση Μέτρο αξιολόγησης Αναμενόμενη χρησιμότητατης λίστας προτεινόμενων σελίδων ομοιότητα περιεχομένου για όλες τις προτεινόμενες σελίδες κρυμμένη σελίδα

  45. Πειραματική αξιολόγηση Βάση σύγκρισης • Απλό μοντέλο με δημιουργία ομάδων σελίδων βάσει ομοιότητας περιεχομένου • Πρόταση σελίδων • Εύρεση ομάδων πιο όμοιων με τις σελίδες που ήδη επισκέφτηκε ο χρήστης • Επιλογή των πιο χαρακτηριστικών σελίδων από τις ομάδες αυτές

  46. Πειραματική αξιολόγηση

  47. Συμπεράσματα • Η νέα μέθοδος δεν ξεπέρασε το μοντέλο σύγκρισης • Η γνώση της σειράς επίσκεψης μάλλον δε συμβάλλει στην πρόταση σελίδων Μεγάλη ανομοιογένεια δεδομένων χρήσης • Πλοήγηση μέσα σε μία θεματική κατηγορία

  48. Συμπεράσματα Αυτομεταβάσεις με υψηλή πιθανότητα

  49. Συμπεράσματα • CANUMGI-B αποδίδει καλύτερα από τις άλλες Πιο έξυπνη επιλογή κόμβων • Η μείωση διαστασιμότητας δε βελτίωσε τα αποτελέσματα Δε βοηθά η ομαδοποίηση • Η γνώση των λίγων προηγούμενων επισκέψεων πιο χρήσιμη

  50. Μελλοντικές Κατευθύνσεις • Δυναμικός προσδιορισμός παραμέτρων • Μελέτη του μετρικού αξιολόγησης • Προσεγγίσεις με μαρκοβιανά μοντέλα • Επιλεκτική χρησιμοποίηση δεδομένων χρήσης + μοντέλο με βάση το περιεχόμενο • Χρήση πιθανοτικών γραμματικών υπερκειμένου (HPG)

More Related