1 / 23

Επισκόπηση Θεμάτων

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ. «Τεχνικές Σημασιολογικού Ιστού για πολλαπλές προβολές σε ετερογενείς συλλογές Ινστιτούτων Πολιτιστικής Κληρονομιάς»

marlon
Download Presentation

Επισκόπηση Θεμάτων

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ:ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ «Τεχνικές Σημασιολογικού Ιστού για πολλαπλέςπροβολές σε ετερογενείς συλλογές Ινστιτούτων Πολιτιστικής Κληρονομιάς» Σοφία Καρδαμύλα Εργασία στο μάθημα: Ηλεκτρονική Δημοσίευση Διδάσκον καθηγητής: Σαράντος Καπιδάκης Αθήνα 2007

  2. Επισκόπηση Θεμάτων • Συλλογή Illuminated Manuscript • Συλλογή ARIA Masterpieces • Μεθοδολογία πρόσβασης στις συλλογές χρησιμοποιώντας τις δυνατότητες & τα όρια της τρέχουσας τεχνολογίας του Σημασιολογικού Ιστού • Αποτελέσματα • Συμπεράσματα • Προβληματισμοί

  3. Τα Ινστιτούτα Πολιτιστικής Κληρονομιάς (CH) φέρουν σημαντικές πληροφορίες για την ανάπτυξη του πολιτισμού. • Οι συλλογές των Ινστιτούτων Πολιτιστικής Κληρονομιάς (CH) είναι ετερογενείς: Περιέχουνδιαφορετικά είδη αντικειμένων, με διαφορετική θεματολογία, περιγράφονται με την χρήση διαφορετικών σχημάτων περιγραφής και ελεγχόμενων λεξιλογίων και μπορεί να έχουναποθηκευτεί και είναι προσιτές μέσω διαφορετικών πληροφοριακών συστημάτων. • Πρότυπα, πρωτόκολλα και κοινά σχήματα μεταδεδομένων Ενοποίηση συλλογών • Δημιουργία πύλης Πρόσβαση στις ενοποιημένες συλλογές

  4. Illuminated Manuscript • Συλλογή Εθνικής Ολλανδικής Βιβλιοθήκη (KB) • Περιέχει: 10.000 μεσαιωνικές εικονογραφήσεις οι οποίες εκτός από τις πρότυπες βιβλιογραφικές πληροφορίες σχολιάζονται καιαπό θεματικά ευρετήρια που περιγράφουν το περιεχόμενοτης εικόνας • Τα ευρετήρια ακολουθούν το Σχήμα Ταξινόμησης Iconclass • Iconclass: Λεξιλόγιο 25.000 στοιχείων με κύριο σκοπό την εικονογραφική ανάλυση • Ένα αντικείμενο στο Iconclass αποτελείται από: • Μία Υποσημείωση (25F9) • Μία συσχέτιση κειμένου (=παραμορφωμένα ζώα: τέρατα) • Συνδέσμους θεματικών παραπομπών (cross-reference) • Μηχανισμούς εξειδίκευσης θέματος (keys) • Λέξεις κλειδιά (keywords) • Τα θέματα είναι οργανωμένα σε 9 ιεραρχικά επίπεδα

  5. Δομή Iconclass

  6. Αποτελέσματα αναζήτησης στη συλλογή «Illuminated Manuscript» της KB

  7. ARIA Masterpieces • Συλλογή Μουσείου Rijks στο Άμστερνταμ • Περιέχει: 700 αντικείμενα (πίνακες & γλυπτά) • Τα θέματα στα ευρετήρια δημιουργούνται με βάση τον κατάλογο Aria • Aria: ελεγχόμενο λεξιλόγιο, αποτελούμενο από 500 όρους και 3 υπολεξιλόγια, θεωρούμενο κυρίως ως πηγή αναζήτησης 1ο Υπολεξιλόγιο: προορίζεται για μη ειδικούς. Περιέχει θέματα όπως π.χ. ο Άντρας 2ο Υπολεξιλόγιο: προορίζεται για πιο εξειδικευμένους χρήστες. Περιέχει παρόμοια αλλά πιο υψηλής ποιότητας θέματα π.χ. Αντρικά πορτραίτα 3ο Υπολεξιλόγιο: Περιέχει μία πιο μικρή λίστα με 6 κατηγορίες αντικειμένων όπως π.χ. Γλυπτική • Η μοναδική σημασιολογική πληροφορία που υπάρχει στον κατάλογο είναι κάποιοι εξειδικευμένοι σύνδεσμοι μεταξύ των δύο πρώτων λεξιλογίων (σχέσεις ευρύτερης έννοιας) • Οι ιεραρχίες είναι δύο επιπέδων

  8. Μεθοδολογία

  9. 1ο βήμα: Τυποποίηση συλλογής • Μετατροπή ελεγχόμενων λεξιλογίων • Μετατροπή στοιχείων συλλογών 1. Τυποποίηση συλλογής Αρχικά Λεξιλόγια Iconclass ARIA Πρότυπη SW απεικόνιση λεξιλογίων Συντακτική διαλειτουργικότητα λεξιλογίων Αρχικές συλλογές ARIA Masterpieces KB Manuscripts Πρότυπη SW απεικόνιση συλλογών Συντακτική και σημασιολογική διαλειτουργικότητα δομής μεταδεδομένων

  10. Μετατροπή ελεγχόμενων λεξιλογίων • Ανάλυση στοιχείων • Τυποποίηση γνώσης που περιέχουν • Πρότυπη τυποποίηση: • Επιλογή πρότυπου μοντέλου κωδικοποίησης λεξιλογίων σε γλώσσες SW • Πρωτοβουλία SKOS (Simple Knowledge Organization System): Παρέχει ένα πρότυπο μοντέλο κωδικοποίησης των πιο διαδεδομένων πλάνων οργάνωσης της γνώσης (θησαυροί, ταξ. Συστήματα) σε γλώσσες SW. SKOS: rdf λεξιλόγιο (W3C SW)

  11. Μετατροπή στοιχείων συλλογών • Διατήρηση αρχικών δομών συλλογών • Μη χρησιμοποίηση κοινού σχήματος περιγραφής μεταδεδομένων • Κατασκευή μικρών οντολογιών μεταδεδομένων σε σχήμα rdf Title: Mary Magdalene Year: 1487 Artist: Carlo Crivelli

  12. 2ο βήμα: Ενοποίηση συλλογής • Προβλήματα • Η σύνθετη φύση της γραφικής παράστασης RDF • Η ετερογένεια στις δομές και την γλωσσολογία (ετικέτες) • Λύση • Εφαρμογή χαρτογράφων οντολογιών Σημασιολογική διαλειτουργικότητα των λεξιλογίων Γνώση Χαρτογράφησης Αποθήκευση SW περιγραφής σε ένα κοινό interface και αναζήτηση πληροφοριώνμέσω αυτού • Τυποποίηση • συλλογής 2. Ενοποίηση συλλογής

  13. Χαρτογράφος Falcon • Εργαλείο ευθυγράμμισης πολύπλοκων rdf/owl οντολογιών • Αναπτύχθηκε από το South East University of China • Ενσωματώνει δύο χαρτογράφους: τους LMO & GMO • LMO: Η ευθυγράμμιση στηρίζεται στο γλωσσικό ταίριασμα (σύγκριση συνώνυμων όρων κ.ά) • GMO: Η ευθυγράμμιση στηρίζεται στο δομικό ταίριασμα των γραφικών παραστάσεων. • Ο χαρτογράφος Falcon ενσωματώνει τις ευθυγραμμίσεις των LMO και GMO για να εξάγει αποτελέσματα Προσδοκούμενα αποτελέσματα: Δημιουργία ισοδύναμων συνδέσμων μεταξύ των εννοιών και των σχέσεων των οντολογιών που συγκρίνονται

  14. Χαρτογράφος S-Match • Γενικός χαρτογράφος ο οποίος χρησιμοποιείται για ευθυγράμμιση λεξιλογίων με δενδροειδή δομή • Αναπτύχθηκε από το University of Trento(Italy) • Χρησιμοποιεί το πλήρες μονοπάτι ενός δενδροειδές λεξιλογίου για την χαρτογράφησή του. ‘Έτσι η απόδοση σχεδόν πάντα αποτελείται από συνδέσμους εξειδίκευση από τις Iconclass έννοιες στις aria έννοιες • Οι χαρτογραφήσεις υπολογίζονται με την επιλογή της ισχυρότερης σημασιολογικής σχέσης, η οποία ανακαλύπτεται με έναν αλγόριθμο μεταξύ των εννοιών μίας οντολογίας • Δεν παρέχει ένα βαθμό ομοιότητας μεταξύ των εννοιών της οντολογίας αλλά τις σημασιολογικές τους σχέσεις (ισοδυναμία, πιο γενικός, λιγότερο γενικός, επικάλυψη κ.α) Χαρτογράφηση με S-Match

  15. 3ο βήμα: Πρόσβαση στη συλλογή • Χρήση multi-faceted browsing • Η mfb περιλαμβάνει τον προσδιορισμό των τμημάτων μίας συλλογής • Για αναζήτηση στις ενοποιημένες συλλογές, χρησιμοποιούνται 3 όψεις: απλή, συνδυασμένη και ενοποιημένη Εκτίμηση προδιαγραφών Ορισμός προσδιοριστικών τμημάτων (φασέτες) Αναζήτηση 2. Ενοποίηση συλλογής 3. Πρόσβαση στη συλλογή

  16. Απλή όψη αναζήτησης • Παρουσιάζει τις ενοποιημένες συλλογές από την πλευρά της μίας συλλογής • Τα στοιχεία της άλλης συλλογής είναι προσβάσιμα μέσω την αντιστοίχησης των θεματικών τους σχολιασμών και των εννοιών με την τρέχουσα συλλογή Αναζήτησηστις ενοποιημένες συλλογές με την χρησιμοποίηση του καταλόγου ARIA Ευθυγράμμιση έννοιας «Animal Pieces» του ARIA και έννοιας «25F:animals» του Iconclass

  17. Συνδυασμένη όψη αναζήτησης • Παρέχει ταυτόχρονη πρόσβαση στις συλλογές μέσω της αντιστοίχησης των λεξιλογίων τους αναζητάμε στις ενοποιημένες συλλογές σαν να είναι μία συλλογή χρησιμοποιώντας δύο ευρετήρια Αναζήτησηστις ενοποιημένες συλλογές με την χρησιμοποίηση των καταλόγων ARIA και Iconclass Αναζήτησηστον ARIA με την έννοια «Animal Pieces» και περιορισμός αναζήτησης στο θέμα από τον Iconclass με «Classical Mythology and Ancient History» (βιολογικό & μυθολογικό κριτήριο)

  18. Ενοποιημένη όψη αναζήτησης • Παρέχει πρόσβαση στις ενοποιημένες συλλογές μέσω ενός συγχωνευμένου λεξιλογίου • Η αυτόματη διαδικασία χαρτογράφησης δημιουργεί συνδέσμους μεταξύ των δύο λεξιλογίων Η ενοποιημένη όψη παρέχει και Aria έννοιες όπως “Birds” και μία έννοια Iconclass “29A: animals acting as human beings” για την περαιτέρω βελτίωση της αναζήτησης

  19. Λεπτομέρειες Browser • Το σχέδιο του browser εμπνεύστηκε από το περιβάλλον αναζήτησης Flamenco • Δοκιμή στον browser: http://stitch.cs.vu.nl/demo.html • STITCH(SemanTic Interoperability To access Cultural Heritage) • Ερευνητικό πρόγραμμα • Χρηματοδοτείται από τον Ολλανδικό Οργανισμό για την Επιστημονική Έρευνα (Netherlands Organisation for Scientific Research ) • Στόχος: Η αξιολόγηση της εφαρμογής τεχνικών και εργαλείων του Σημασιολογικού Ιστού για την ενοποίηση ετερογενών συλλογών CH

  20. Αποτελέσματα Αποτελέσματα πρότυπης τυποποίησης Σχεδόν πλήρως συμβατή Αποτελέσματα Χαρτογράφησης ARIASKOS IconclassSKOS γραφική αναπαράσταση κλειδιών Εν μέρει συμβατή ακρίβεια S-Match 46% Falcon 16% ακρίβεια

  21. Συμπεράσματα • Η μετατροπή λεξιλογίων χρησιμοποιώντας τυποποιημένα πρότυπα είναι δυνατή και βοηθά στην ανάπτυξή τους • Αν όλες οι συλλογές και τα λεξιλόγιά τους ήταν διαθέσιμα σε τυποποιημένη μορφή π.χ. skos,rdf, το περιβάλλον θα μας παρείχε έναν πολύ πιο εύκολο τρόπο ενοποίησης ετερογενών συλλογών • Προβλήματα τυποποίησης (απώλεια πληροφοριών) • Βασιζόμενοι σε τέτοιες απεικονίσεις και σε αυτόματες χαρτογραφήσεις, μπορούμε να εκτελέσουμε αναζήτηση μέσω ενός κοινού interface σε ετερογενείς συλλογές • Δύσκολη χαρτογράφηση και όχι πάντα ακριβής • Για την εκτέλεση σημασιολογικής ενοποίησης CH συλλογών με τον τρόπο που αναφέραμε στο πείραμα, οι αυτόματες τεχνικές χαρτογράφησης είναι απαραίτητες, αλλά πρέπει οπωσδήποτε να προσαρμοστούν • Η χρήση του Multi-Faceted Browsing παρέχει πολλαπλές προβολές ή σημεία πρόσβασης για το ίδιο σετ μεταδεδομένων. Έτσι οι χρήστες μπορούν να επιλέξουν το λεξιλόγιο με το οποίο είναι περισσότερο άνετοι και έτσι η ολοκληρωμένη πρόσβαση είναι δεδομένη

  22. Προβληματισμοί • Τελικά αξίζει να χρησιμοποιήσουμε τις αυτόματες τεχνικές χαρτογράφησης για τα CH λεξιλόγια; • Κατά πόσο είναι εύκολο να χρησιμοποιηθεί η ίδια μεθοδολογία για ενοποίηση περισσότερων των δύο συλλογών; Τι αποτελέσματα θα έχουμε;

More Related