120 likes | 293 Views
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ. ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΜΕ ΘΕΜΑ: A Comparison of Methodic Segmentation Techniques for Music Information Retrieval ΣΥΓΚΡΙΣΗ ΤΕΧΝΙΚΩΝ ΚΑΤΑΤΜΗΣΗΣ ΜΕΛΩΔΙΩΝ ΓΙΑ ΑΝΑΚΤΗΣΗ ΜΟΥΣΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ Giovanna Neve and Nicola Orio
E N D
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΜΕ ΘΕΜΑ: A Comparison of Methodic Segmentation Techniques for Music Information Retrieval ΣΥΓΚΡΙΣΗ ΤΕΧΝΙΚΩΝ ΚΑΤΑΤΜΗΣΗΣ ΜΕΛΩΔΙΩΝ ΓΙΑ ΑΝΑΚΤΗΣΗ ΜΟΥΣΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ Giovanna Neve and Nicola Orio Department of Information Engineering – University of Padova Via Gradenigo, 6/b – 35131 Padova, Italy {mcic, orio}@dei.unipd.it
ΕΙΣΑΓΩΓΗ • McLean (1996), Εφαρμογή καθιε- ρωμένων αρχών ανάκτησης πλη- ροφοριών κειμένου στη μουσική αναπαράσταση. • Ανάκτηση πληροφοριών κειμένου: Λέξεις (αποτελούν όρους ευρετηρίου) • Ανάκτηση μουσικών εγγράφων: Ειδικοί αλγόριθμοι κατάτμησης για παραγωγή μουσικών λεξικολογικών μονάδων.
Πρόσβαση με βάση το περιεχόμενο σε μουσικές ψηφιακές βιβλιοθήκες Σημαντικό γνώρισμα περιγραφής μουσικών πληροφοριών: η Μελωδία Ερώτημα με παράδειγμα (τραγουδώντας) Ομοιότητα μεταξύ εγγράφων Σύσταση μουσικής Αναζήτηση σε μουσικές συλλογές
Δύο κατηγορίες ανάκτησης μουσικών πληροφοριών • Τεχνικές επιγραμμικής (on- line) αναζήτησης • Τεχνικές ευρετηρίασης, που εξάγουν μη επιγραμμικά (off- line)πληροφορίες • Οι μελωδίες ευρετηριάστηκαν με: • Χρήση Ν γραμμάτων, όπου Ν αλληλουχία Ν διαστημάτων τόνου • Αυτόματα επισημασμένες λεξικολογικές μονάδες (μελωδικά & ρυθμικά μοτίβα) με αυτόματο αλγόριθμο κατάτμησης βάση μουσικής θεωρίας
Προσεγγίσεις κατάτμησης μελωδιών Η μουσική είναι συνεχής ροή γεγονότων χωρίς σαφείς διαχωριστές, γίνετε απαραίτητη η αυτόματη ανίχνευση λεξιλογικών μονάδων ενός μουσικού εγγ- ράφου, για όρους ευρετηρίου.
ΣΤΡΑΤΗΓΗΚΕΣ ΚΑΤΑΤΜΗΣΗΣ ΜΕΛΩΔΙΩΝ (1/2) • Κατάτμηση σταθερού μεγέθους (Fixed- Length Segmentation - FL).Εξαγωγή από μία μελωδία υποακολουθιών Ν νοτών (Ν γράμματα). • Κατάτμηση από τα δεδομένα (Data- Driven Seg- mentation - DD).Πραγματοποιείται θεωρώντας ότι συνήθη περάσματα μιας μελωδίας επαναλαμβάνονται πολλές φορές. • Κατάτμηση με βάση την αντίληψη (Perception- Based Segmentation - PB).Οι ακροατές κατατέμνουν το μη δομημένο ακουστικό ρεύμα σε μικρότερες μονάδες (μελωδικές φράσεις, μοτίβα ή μουσικές κινήσεις).
ΣΤΡΑΤΗΓΗΚΕΣ ΚΑΤΑΤΜΗΣΗΣ ΜΕΛΩΔΙΩΝ (2/2) • Κατάτμηση προσανατολισμένη στη μουσικολογία(Musicological- oriented Segmentation - MO).Βασίζεται σε γνώσεις σχετικά με τη μουσική θεωρία, • Μεικτή κατάτμηση και συγχώνευση δεδομένων (Mixed Segmentation and Data Fusion - FUS).Κάθε τεχνική κατάτμησης επιτρέπει την περιγραφή της μελωδίας με ένα διαφορετικό σύνολο ακολουθιών νοτών. Τα έγγραφα ευρε- τηριάζονται με τη χρήση μονάδων που περιέχουν μόνο πληροφορίες ρυθμού ή τόνου ή των συνδυασμό και των δύο. • Κατάτμηση με ερωτήματα (Query Segmentation - QS)
Πειραματική σύγκριση τεχνικών κατάτμησης (1/3) • Μοντέλο ανάκτησης πληροφοριών Cranfield: συλλογή μουσικών τεστ λαϊκής μουσικής από 2310 αρχεία MIDI ως μουσικά έγγραφα • Επιλέχθηκε ο υψηλότερος τόνος ως τμήμα της μελωδίας για πολυφωνικές παρτιτούρες • 40 ερωτήματα. Το θέμα από το οποίο λαμβανόταν το ερώτημα θεωρούνταν σχετικό • Δοκιμές με μηχανή ανάκτησης, που βασίζεται στο Διανυσματικό Μοντέλο • Ανθεκτικότητα σε σφάλματα: με τροποποίηση τόνου & διάρκεια νοτών • Αποτέλεσμα μήκους ερωτημάτων; Με συντόμευση αρχικών ερω τημάτων
Πειραματική σύγκριση τεχνικών κατάτμησης (2/3) Πίνακας 1Βασικά χαρακτηριστικά λεξικολογικών μονάδων για διαφορετικές κατατμήσεις
Πειραματική σύγκριση τεχνικών κατάτμησης (3/3) Πίνακας 2 Αποτελεσματικότητα ανάκτησης διαφορετικών προσεγγίσεων
Συμπεράσματα (1/2) • Η πρόσβαση και ανάκτηση της μουσικής βρίσκονται σε πρώιμο στάδιο. • Αντικείμενο επιστημονικής έρευνας, ένας αρι- θμός μεθοδολογιών και τεχνικών από την α -ναγνώριση των κατάλληλων γνωρισμάτων,ως δείκτες περιγραφής περιεχομένου. • Οι προσεγγίσειςκατάτμησης (FL) με επικαλυ- πτόμενεςμονάδες έδωσαν καλύτερα αποτε- λέσματα από προσεγγίσεις με βάση τη μουσι- κή αντίληψη(PB) ή τη μουσική θεωρία (MO).
Συμπεράσματα (2/2) • Η κατάτμηση σταθερούμήκους(FL) πιο αν- θεκτική σε σφάλματα ερωτημάτων και σε σύντομα ερωτήματα από την κατάτμησηδεδομένων(DD). • Για τη μουσική μια απλή προσέγγιση, που δεν φιλτράρει καμία πληροφορία, βελτιώνει το πο- σοστό αποτελεσμάτων χωρίς υποβάθμιση της ακρίβειας(FUS,FL). • Για μία εργασία ανάκτησης μουσικής η αντι- γραφή των πληροφοριών βοηθά στην επα- κόλουθη βελτίωση των επιδόσεων του συ- στήματος.