1 / 21

Optimizing Web Search Using Social Annotations

Optimizing Web Search Using Social Annotations. Παρουσίαση: Λάζος Άγγελος. Εισαγωγή. Πολλοί χρήστες αφιερώνουν κοινωνικά σχόλια σε ιστοσελίδες Π.χ στο www.del . icio . us για το Amazon αγορά, μουσική, βιβλία κατάστημα Εκμετάλλευση από τους SSR και SPR

ilori
Download Presentation

Optimizing Web Search Using Social Annotations

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Optimizing Web Search Using Social Annotations Παρουσίαση:Λάζος Άγγελος

  2. Εισαγωγή • Πολλοί χρήστες αφιερώνουν κοινωνικά σχόλια σε ιστοσελίδες • Π.χ στο www.del.icio.us για το Amazon • αγορά, μουσική, βιβλία κατάστημα • Εκμετάλλευση από τους SSR και SPR • SSR: Ομοιότητα μεταξύ σχολίων (similarity ranking) • SPR: Μέτρηση δημοτικότητας μιας σελίδας (static ranking) • Προηγούμενοι αλγόριθμοι: • Έμφαση σε: Anchor text, link analysis, click-thought data

  3. Σκοπός • Η χρήση των κοινωνικών σχολίων στο web search • SSR: • Ορίζει την ομοιότητα μεταξύ των σχολίων • Λύνει το πρόβλημα του ακριβούς ταιριάσματος • SPR • Υπολογισμός της ποιότητας μιας σελίδας από τα σχόλια • Διαφορετικά σχόλια έχουν διαφορετικό βάρος

  4. Αναζήτηση με τη χρήση κοινωνικών σχολίων • 3 ομάδες χρηστών στο web • Δημιουργοί σελίδων • Σχολιαστές ( annotators ) • Απλοί χρήστες • Κάθε μία παρέχει διαφορετική πληροφορία • Ενδιαφερόμαστε για την άποψη των annotator

  5. Social Similarity Ranking • Απλοϊκή προσέγγιση των κοινωνικών σχολίων σύνολο σχολίων Α(p)={α1, .αn} ερώτηση q={q1,q2,. . .,qn} • Πρόβλημα στα συνώνυμα • O SSR λύνει το πρόβλημα

  6. Social Similarity Ranking (συνέχεια)

  7. Social Similarity Ranking (συνέχεια) • Για παράδειγμα τη σελίδα b χαρακτηρίζουν τα σχόλια “ubuntu” και “linux” από τους Ua και Ub αντίστοιχα. • Έτσι υπάρχει ένας βαθμός ομοιότητας μεταξύ τους.

  8. Social Similarity Ranking (συνέχεια) • Πολυπλοκότητα αλγορίθμου • Για κάθε βήμα του αλγορίθμου Ο(ΝΑ2ΝP2) • Η συνολική πολυπλοκότητα του αλγορίθμου ανάλογη με τα βήματα ώστε ο SSR να συγκλίνει. • Ομοιότητα ερώτησης-σελίδας βασισμένη στον SSR σύνολο σχολίων Α(p)={α1, .αn} ερώτηση q={q1,q2,. . .,qn}

  9. Social Page Rank • Eνημερωμένοι χρήστες προτιμούν δημοφιλείς σελίδες, οι οποίες αποκομίζουν θερμά σχόλια

  10. Social Page Rank(συνέχεια) • (5.1) η δημοτικότητα των χρηστών αντλείται από τις σελίδες που σχολιάζουν. • (5.2) η δημοτικότητα των σχολίων από τη δημοτικότητα των χρηστών. • (5.3)των σελίδων από των σχολίων. • (5.4) των σχολίων από των σελίδων. • (5.5)των χρηστών από των σχολίων. • (5.6) ξανά των σελίδων από των χρηστών. • Πολυπλοκότητα • Σε κάθε επανάληψη Ο(ΝUNP + ΝANP+ ΝUNA).

  11. Πειραματικά αποτελέσματα • Σύνολο 1.736.628 σελίδων και 269.566 σχολίων από το del.icio.us από το Μάιο του 2006. • Λέξεις με μη έγκυρη για τους αλγορίθμους μορφή • χωρισμός τους σε στάνταρ όρους με τη βοήθεια του WordNet πριν την εκτέλεση των πειραμάτων. • (π.χ. java.programming ή java/programming)

  12. Εκτίμηση της ομοιότητας σχολίων με τον SSR • Για τον αλγόριθμο SSR χρειάστηκαν 12 επαναλήψεις ώστε να συγκλίνει.

  13. Εκτίμηση των SPR αποτελεσμάτων • 7 επαναλήψεις μέχρι τη σύγκλιση. • Το PageRank κάθε σελίδας υπολογίστηκε επίσης από το API του Google toolbar. Στις περισσότερες περιπτώσεις, είναι πιθανόν πολλοί χρήστες να αφιερώνουν πολλά σχόλια σε σελίδες με υψηλότερο PageRank

  14. Εκτίμηση των SPR αποτελεσμάτων (συνέχεια) Σελίδες με PageRank 0 έχουν περισσότερα σχόλια και χρήστες από σελίδες με PageRank 10.

  15. Δυναμική διάταξη με τη χρήση κοινωνικών σχολίων • Αποτελέσματα από σύνολα ερωτήσεων • Manual ή automatic • “DocSimilarity” ως baseline • MAP: • NDCG:

  16. Δυναμική διάταξη με τη χρήση κοινωνικών σχολίων(συνέχεια) MAP MAP

  17. Παράδειγμα • Ερώτηση “airfare” Στο www.excellent-romantic-vacations.com/best-airfare-search-engine.html το kayak έρχεται πρώτο σε προτιμήσεις Top-4 από 318 Λόγω SSR ομοιότητα με “ticket”, ”flight”, ”hotel”,”airline”. Επιπλέον σχετικές σελίδες

  18. Πλεονεκτήματα-Μειονεκτήματα • Σημαντική βελτίωση των αποτελεσμάτων από την αναζήτηση • Οι δύο αλγόριθμοι συγκλίνουν γρήγορα • Λόγω των αραιών πινάκων • Πολυπλοκότητα πολύ μικρότερη από την εκτιμώμενη. ______________________________________________ • Χρήστες και σχόλια έχουν εκθετικό ρυθμό ανάπτυξης • πιο αργή σύγκλιση των αλγορίθμων • Έλλειψη σχολίων για νέες σελίδες • Αδυναμία αποσαφήνισης σχολίων με δισημία

  19. Επεκτάσεις • Βελτιστοποίηση του αλγορίθμου SSR για την αντιμετώπιση των εκθετικά αυξανόμενων σχολίων και χρηστών. • Για την αντιμετώπιση σχολίων spam θα μπορούσε πριν από την εκτέλεση των βασικών αλγορίθμων να γίνεται γλωσσολογική ανάλυση και αγνόηση τους. • Υλοποίηση αλγορίθμου για εύρεση ομοιότητας μεταξύ σχολίων και μεταδεδομένων από τον δημιουργό σελίδας. • π.χ. annotation – anchor text

  20. Ερώτηση • Ποια η σημαντικότερη διαφορά των αλγορίθμων όπως ο PageRank με τον SPR; • Με ποιο τρόπο οι αλγόριθμοι SSR και SPR συνεισφέρουν στην αναζήτηση των σχετικών σελίδων για μία ερώτηση;

More Related