1 / 17

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας». “ Ανάκτηση τεκμηρίων με τη μέθοδο Document Image Retrieval”.

tanika
Download Presentation

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» “Ανάκτηση τεκμηρίων με τη μέθοδο Document Image Retrieval” Εργασία για το μάθημα « Ψηφιακές Βιβλιοθήκες » Διδάσκων: Σαράντος Καπιδάκης Ασημάκης Μπούτλας Εξάμηνο Α’ Αθήνα 2008 Ασημάκης Μπούτλας

  2. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή Ψηφιακές Βιβλιοθήκες Image Retrieval – Μέθοδοι Document Image Retrieval Σύστημα AIDI Εφαρμογές Συμπεράσματα - Προβληματισμοί 2 Ασημάκης Μπούτλας

  3. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» Εισαγωγή Document Image Retrieval (DIR): Μέθοδος ανάκτησης ψηφιοποιημένων τεκμηρίων με υπολογισμό κοινών χαρακτηριστικών γνωρισμάτων τους (π.χ. σχεδιάγραμμα κειμένου, σχήμα χαρακτήρων) Document Image Analysis: Ηλεκτρονική επεξεργασία τεκμηρίων (ψηφιοποίηση, ευρετηρίαση κλπ) για δημιουργία συλλογής ψηφιακής βιβλιοθήκης. 3 Ασημάκης Μπούτλας

  4. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» • Ψηφιακές Βιβλιοθήκες • Οργανωμένες συλλογές ψηφιακών αντικειμένων (εικόνα, βίντεο, ήχος) • Αυτοματοποιημένη επεξεργασία, πρόσβαση και ανάκτηση τεκμηρίων • Ανάπτυξη ποικίλων μεθόδων ανάκτησης • Από τους χειρόγραφους δελτιοκαταλόγους, στους ηλεκτρονικούς • καταλόγους ανοικτής πρόσβασης και στις ψηφιακές βιβλιοθήκες 4 Ασημάκης Μπούτλας

  5. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» • Image Retrieval • Μέθοδοι • Optical Character Recognition (OCR) • «Ελεύθερη» αναγνώριση χαρακτήρων • ευρετηρίαση κειμένων - επισήμανση λέξεων-κλειδιών • ανάκτηση γραφικών στοιχείων • ανάκτηση χειρογράφων κειμένων • Document Image Retrieval (DIR) 5 Ασημάκης Μπούτλας

  6. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» Document Image Retrieval (DIR) Ανάκτηση τεκμηρίων βάση του σχεδιαγράμματος του κειμένου ή του σχήματος των αλφαριθμητικών χαρακτήρων (παρόμοια μέθοδος – το ξεφύλλισμα των τεκμηρίων είτε επιτόπου στα ράφια της βιβλιοθήκης είτε ηλεκτρονικά με την παράθεση σαρωμένων εγγράφων στην οθόνη του Η/Υ) Εφαρμογή σε συλλογές ψηφιοποιημένων τεκμηρίων: με διαφορετική ανάλυση σάρωσης με πολύγλωσσα κείμενα με πολύπλοκα σχεδιαγράμματα και εικόνες με χειρόγραφα κείμενα 6 Ασημάκης Μπούτλας

  7. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» Το σύστημα AIDI (Automatic Indexing of Document Retrieval) Πανεπιστήμιο της Φλωρεντίας, Ιταλία. Τμήμα Πληροφορικής Αρχιτεκτονική συστήματος Ανάλυση σχεδιαγράμματος κειμένων Εξαγωγή λέξεων-κλειδιών και κωδικοποίηση τους με ετικέτες Δημιουργία 2 διαφορετικών ευρετηρίων 7 Ασημάκης Μπούτλας

  8. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» Το σύστημα AIDI 8 Ασημάκης Μπούτλας

  9. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» Το σύστημα AIDI (Automatic Indexing of Document Retrieval) Πανεπιστήμιο της Φλωρεντίας, Ιταλία. Τμήμα Πληροφορικής Ευρετηρίαση Λέξεων Προβλήματα χρήσης OCR Χρήση DIR συνολική απεικόνιση λέξης (κωδικοποίηση βάση των εμφανέστερων χαρακτηριστικών γνωρισμάτων της) κωδικοποίηση χαρακτήρων (character object) 9 Ασημάκης Μπούτλας

  10. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» Το σύστημα AIDI 10 Ασημάκης Μπούτλας

  11. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» • Το σύστημα AIDI • (Automatic Indexing of Document Retrieval) • Πανεπιστήμιο της Φλωρεντίας, Ιταλία. Τμήμα Πληροφορικής • Ανάκτηση βάση του σχεδιαγράμματος των εγγράφων • σημειώσεις και σχολιασμοί στα περιθώρια της σελίδας • σχεδιάγραμμα ή εικόνα σε συγκεκριμένη θέση μέσα στο κείμενο • εγγραφα με πολλές στήλες (π.χ. εφημερίδες) 11 Ασημάκης Μπούτλας

  12. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» • Ανάκτηση βάση του σχεδιαγράμματος των εγγράφων • Μέθοδοι • Απεικόνιση σε δενδροειδή μορφή (TF-IDF, τα παρόμοια σχεδιαγράμματα περιέχουν παρόμοιες υποκατηγορίες κατά την απεικόνιση σε δενδροειδή μορφή, δηλ. τα φύλλα των δέντρων τους είναι παρόμοια) • Διανυσματικής απεικόνιση (υπολογισμός χαρακτηριστικών γνωρισμάτων συγκεκριμένων περιοχών, οι οποίες καλύφθηκαν με ένα πλέγμα, που τοποθετήθηκε στη σελίδα) • Υπολογισμός χαρακτηριστικών δενδροειδούς απεικόνισης 12 Ασημάκης Μπούτλας

  13. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» • Το σύστημα AIDI • (Automatic Indexing of Document Retrieval) • Πανεπιστήμιο της Φλωρεντίας, Ιταλία. Τμήμα Πληροφορικής • Αποτελέσματα πειραμάτων 13 Ασημάκης Μπούτλας

  14. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» • Άλλες εφαρμογές Document Image Retrieval • Χρήση χειρόγραφων υπογραφών ως ερωτήματα • Ανάκτηση τεκμηρίων με διαφορετικούς, και ενδεχομένως μη προτυποποιημένους • αλφαριθμητικούς χαρακτήρες(π.χ. Κινέζικα, Ινδικά, Ελληνικά) • Ανάκτηση χειρόγραφων τεκμηρίων 14 Ασημάκης Μπούτλας

  15. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» Χρήση χειρόγραφων υπογραφών ως ερωτήματα στάδια εφαρμογής αφαίρεση τυπωμένου κειμένου εξαγωγή χαρακτηριστικών ανάκτηση 15 Ασημάκης Μπούτλας

  16. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» • Συμπεράσματα – Προβληματισμοί • Νέα προσέγγιση στην ανάλυση ψηφιοποιημένων τεκμηρίων • Ανάγκη ανάπτυξης και εφαρμογής παρόμοιων μεθόδων από χώρες με δύσκολο αλφάβητο • Επίλυση προβλημάτων που προκύπτουν με προγενέστερες μεθόδους • Απαραίτητη η εφαρμογή για συλλογές χειρογράφων τεκμηρίων ή τεκμηρίων με πολύπλοκα σχεδιαγράμματα και πολύγλωσσα κείμενα. • Ανάγκη εφαρμογής της μεθόδου στη Ελλάδα (πολλά χειρόγραφα κείμενα, αλλαγή αλφαβήτου και χαρακτήρων – αρχαιότητα, βυζαντινά κείμενα, ΓΑΚ) • Εφαρμογή μελλοντικά σε άλλες περιπτώσεις συλλογών (τρισδιάστατα αντικείμενα, ταυτοποίηση φωτογραφιών κλπ) 16 Ασημάκης Μπούτλας

  17. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «Επιστήμη της Πληροφορίας - Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» Ευχαριστώ για την προσοχή σας! 16 Ασημάκης Μπούτλας

More Related