180 likes | 304 Views
Statistische Suche nach melodi schen Prototypen. Musikwissenschaftliches Institut Hamburg WS 2005/06 Klaus Frieler. Einleitung Der melodische Bogen. Huron (1996) untersuchte 36,075 Phrasen aus 6,251 Volkslieder aus der Essen Datenbank (EsAC) in Hiblick auf ihre grobe Kontur:
E N D
Statistische Suche nach melodischen Prototypen Musikwissenschaftliches Institut Hamburg WS 2005/06 Klaus Frieler
Einleitung Der melodische Bogen • Huron (1996) untersuchte 36,075 Phrasen aus 6,251 Volkslieder aus der Essen Datenbank (EsAC) in Hiblick auf ihre grobe Kontur: • Nimm die erste und die letzte Note und den Mittelwert der dazwischen liegenden Noten. • Betrachte die Intervallrealtionen +, -, 0 • 9 möglichen Kombinationen, z.B. +- = konvex, ++ = aufsteigend, -- = fallend, -+ = konkav, 00 = horizontal • Wir machten dasselbe mit unseren Daten
Einleitung Idee • Untersuche die Kontur von melodischen Phrasen mit Polynom-Fits und Cluster-verfahren • Polynom-Fit zuerst vorgeschlagen vonSteinbeck 1982:
2. DatenDie ausgewählten Lieder • 50 Songs von internationalenBoy-und Girlgroups • Jeder Song war in den offiziellen Top 50 Deutsch Single Charts zwischen 1990 and 2005 • Melodienwurden aus Lead- und Backingvocals der Songs extrahiert. • Insgesamt 17,000 Noten
2. DatenSegmentierung Ein Song kann in vier hierarchische Formebenen aufgegliedert werden: • Ebene 1 – Der Song als ganzes • Ebene 2– Formeinheiten (Strophe, Refrain ,Bridge etc.) • Ebene 3 – Phrasengruppen • Ebene 4 – Phrasen
2. DatenSegmentierung • Existierende Segmentierungswerkzeuge (z.B. Temperley & Sleator, 1999, Cambouropoulos 2001) ergaben keine hinreichend guten Resultate, also wurden die Songs von Hand segmentiert Das ergab 1516 Phrasen • Aussonderung von identische Phrasenin jedem Song • Aussonderung von von Rap-Phrasenohne erkennbare Tonhöhenkontour Es blieben 989 Phrasen. • Phrasenlängen zwischen 2 und 26 Noten, Maximum bei 5 Noten pro Phrase
2. Daten Vorverarbeitung • Verwendete Informationen: • Anzahl der Noten in jeder Phrase • Polynom-Fits zu Serien normierterTonhöhen und Einsatzzeiten
2. DatenNormierung der Phrasen • Alle Einsatzzeiten der Phrasenwurden in den Bereich von 0-1 skaliert • Allle Phrasen wurden so transponiert, dass die mittlere Tonhöhe bei 0 lag. • Tranponierte Tonhöhen wurden durch 12 geteilt Skalierung einer Oktave auf den Wert 1 p‘ = (p– pmittel) / 12 • (Normierung des Ambitus auf [-1,1] wurde untersucht, aber fallen gelassen)
2. DataPolynom-Fit • Polynom: p(t) = antn + an-1tn-1 +…+a1t + a0 • n ist die Ordnung des Polynoms. • Polynom-Fit: Suche Koeffizienten an…a0, so dass die Kurven maximal nah beieinander sind • Problem: Welche Polynomordnung soll man wählen? • Trade-off zwischen zu genau und zu grob. • Nach Vorversuchen, Fits 2., 4. und 6. Ordnung ausgewählt.
3. ClusterungAlgorithmen • Wir benutzten folgende Methoden: • Ward-und nachfolgende k-means-Clusterung (SPSS), inklusive Zahl der Noten (ZdN) • Einfaches k-means Verfahren ohne ZdN (WEKA) • „Cluster feature tree“ mit nachfolgender hierarchischerClusterung (mit ZdN, SPSS) • Erwartungsmaximierungs-(EM)Clusterung (R mit ZdN, WEKA ohne ZdN)
3. ClusterungResultate • Viele, viele verschiedene Clusterlösungen gefunden. • Lösungen zu Polynomen 4. Und 6. Ordnung hart zu interpretieren • Cluster feature tree war am schlechtesten • Beste Ergebnisse: 2. Ordnung/EM (ohne ZdN) und einfaches k-Means (4 Cluster ohen ZdN): Ergab ungefähr dieselben Cluster.
4. ErgebnisseEinige Beispiele (Clusterschwerpunkte) Ward/kMeans (ZdN), 2. Ord. EM (ZdN), 4. Ord. EM, 4. Ord. EM, 6.Ord k-Means, 6. Ord. Ward/k-Means (ZdN, 6. Ord)
4. Ergebnisse EM/k-Means 2. Ordnung • Jeweils 4 Cluster mit sehr ähnlichen Clustern! (Beide ohne ZdN)
4. Ergebnisse EM(2.Ordnung)– Clusterplots Cluster 1 (Konkav, fallend) Cluster 1 + 2 (Mischcluster) Cluster 1, 2 + 3 (Großer Bogen) Cluster 1, 2, 3 + 4 (Kleiner Bogen)