1 / 73

Prominenz und Rhythmus

Prominenz und Rhythmus. Klaus J. Kohler IPDS, Kiel. Kolloquium WS2007/8 7. November 2007ff. Was konstituiert Rhythmus?. regularisierte Abfolge prominenter und weniger prominenter Silben (siehe Einleitung zum Hörexperiment) prominent = gehörsmäßig hervortretend

haroun
Download Presentation

Prominenz und Rhythmus

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Prominenz und Rhythmus Klaus J. Kohler IPDS, Kiel Kolloquium WS2007/8 7. November 2007ff

  2. Was konstituiert Rhythmus? • regularisierte Abfolge prominenter und weniger prominenter Silben (siehe Einleitung zum Hörexperiment) • prominent = gehörsmäßig hervortretend • Welche phonetischen Parameter verantwortlich? • 1f • 2f

  3. 1r • 2rf • 3rf • 3d • 3e

  4. Begriffsbestimmungen zu Akzent und Prominenz linguistisch, messphonetisch, perzeptorisch • linguistisch • Wortakzent: August, übersetzen • Satzakzent: Anna hat eine Email abgeschickt. • emphatischer Akzent • rhythmische Muster: Jambus, Trochäus, Dactylus • messphonetisch • f0 • Dauer • Energie • dB

  5. perzeptorisch • harmonische Tonhöhe: Halbtöne, Tonheit: mel Bark • wahrgenommene Lautdauer • Lautstärke: phon, Lautheit: sone • Prominenz: syntagmatische Kontraste, gebildet aus Tonhöhen-, Dauer- und Lautheitswahrnehmung • messphonetische Korrelate der 3 auditiven Faktoren für Prominenz (f0, Dauer, dB) signalisieren auch Tonregister, Sprechgeschwindigkeit, Lautstärke • Wahrnehmung synthetisch erzeugter Muster kann auf zwei Ebenen dekodiert werden • siehe Ergebnisse des Hörtests

  6. Skalierung der Prominenz • 1. Hörexperiment • Originalstimulus • erste Silbe dupliziert • gelängt, 1.15, ebenes f0 124 Hz

  7. Manipulation des Tonhöhenverlaufs

  8. Manipulation der Dauer • zweite Silbe in 3 Schritten zu 10% gelängt und gekürzt • die letzten 4 Perioden von Längung ausgenommen

  9. Manipulation der Energie • 3 Zeitpunkte in zweiter Silbe • Anfang des Plosivs • nach Plosivburst • Vokalende • in CoolEdit Amplituden-Einhüllende über dem zweiten Vokal manipuliert • 1. Punkt 100%, 2., 3. Punkt in 1dB-Schritten nach oben und nach unten

  10. Kombination von Pitch- und Dauer- sowie von Pitch- und Amplitudenmanipulation • 7 Tonhöhenmuster, einschl. eben • 6 Dauern • 6 Amplituden • jeweils 5 Wiederholungen • 7 x 6 x 5 = 210 Stimuli in einem Dauerset und 210 Stimuli in einem Amplitudenset • separat randomisiert und in zwei Hörtests präsentiert • Amplitudenset zuerst

  11. Hypothesen • Erhöhen oder erniedrigen von Pitch, Energie und Dauer im zweiten ba gegenüber dem Referenzstimulus erhöht oder erniedrigt die Prominenz gegenüber dem ersten ba. • In der Kombination von Pitch und Energie bzw. Dauer ändert sich der Umkipppunkt mit dem Tonhöhenmuster. • Pitch hat den stärksten, Energie den schwächsten Effekt.

  12. Nomenklatur • drei Komponenten im Namen: pitch p22, p21, p01, p00, p11, p12, p14 energy Auswahl von 6 aus e22, e21, e00, e11, e12, e13, e14, e15, e16 duration Auswahl von 6 aus d24, d23, d22, d21, d00, d11, d12, d13

  13. Zusammenfassung der Ergebnisse (6 Vpn) • Pitch + Energie • Progression der Prominenz von zweiter zu erster Silbe für p22 – p21 – p01 – p11 – p12 – p14 • kein Progressionsmuster für Energiezunahme/ abnahme innerhalb einer Tonklasse • Pitch ist verantwortlich für die perzeptive Skalierung der Prominenz in diesen Stimuli • aber es zeigt sich eine Skalierung in der Klasse p00 (ebenes Muster) von e22 nach e13

  14. Pitch + Dauer • entsprechende Progession über die Tonklassen hinweg • keine interne Progression • gilt auch für p00 • überwiegend Prominenz auf erster Silbe • Interpretation der Ergebnisse • Manipulation der Einhüllenden und der Dauer nur in der zweiten Silbe bringt Interferenz mit den Perzeptionsebenen Lautstärke und Sprechtempo • Implementation deutscher Sprachproduktion > Perzeption muss beide Silben verändern

  15. Neues Experiment – Experiment 2 • Pitch p21, p01, p00, p11, p14 • nach den Ergebnissen des ersten Tests kann p22 durch keinen anderen Parameter zum Umkippen gebracht werden • die Unterschiede in Dauer oder Energie müssten so groß sein, dass wieder die anderen Perzeptionsebenen intervenieren • p11 und p14 bilden ein kontrastives Paar, daher p12 und p13 zunächst ausgeklammert, um Zahl der Stimuli zu begrenzen

  16. p00 p21 p01 p11 p14

  17. Dauer • +20%-20%, +10%-10%, 0-0, -10%+10%, -20%+20% • p21 +25-25, nicht -20%+20% • p14 -25+25, nicht +20-20 • 5 Stimuli pro Serie • Energie • 4 Punkte (1) Anfang Stimmhaftigkeit (2) Mitte erster Vokal (3) Mitte zweiter Vokal (4) Ende Stimmhaftigkeit

  18. Einhüllende systematisch verändert an diesen Punkten • (1), (2) 126% (+2dB), 112% (+1dB), 79% (-2dB), 70% (-3dB) • komplementär (3), (4) 70%, 79%, 112%, 126% • p21 nicht 70–126, 79–112, aber 100–89, 126-56 • p14 nicht 126 – 70, aber 56 – 128 • 5 Strimuli pro Serie, incl. Original (1) (2) (3) (4) 126 112 100 89 79 70

  19. Anzahl der Stimuli pro Testserie • 5 Pitch * 5 Dauer/Energie * 5 Wiederh. = 125 * 2

  20. Ergebnisse: 18 Vpn für Energie, 19 für Pitch • Kein prinzipieller Unterschied zum 1. Exp. • Pitch zeigt einen Effekt • Dauer und Energie nur marginale Effekte • selbst bei ebenem Pitch eher zufällige Antworten, was bedeuten kann, dass gleichbleibender Tonverlauf gleiche Prominenzwahrnehmung hervorruft, die dann zu zufälligen Antworten führt, weil Hörer nicht "gleich" urteilen können • große Streuung zwischen Vpn, daher verdecken die Gruppenergebnisse individuelle Strategien

  21. offenbar kein einheitliches Entscheidungskriterium für Prominenz in derartigen Experimenten • Kategorie ist den Vpn vielleicht nicht klar • sie können sich auf unterschiedliche Parameter konzentrieren, sowohl von Hörer zu Hörer als auch von Wiederholung zu Wiederholung, was zu großer Variabilität führt • Skalierung der Prominenz ist auf diesem Wege der kategorialen Klassifikation nicht erreichbar, wenn so viele stärker und schwächer differenzierte Stimuli gemischt werden

  22. Drei Möglichkeiten • Kategorisierung, aber nur mit drei Serien, die auch nur in einem Parameter variiert werden • 7 Pitch-Werte, e00 d00 • 7 Energiewerte, p00 d00 • 7 Dauerwerte, p00 e00 • ergibt bei 5 Wiederholungen 105 Stimuli • also starke Verkürzung des Tests

  23. Pfitzinger's phonometrische perzeptuelle Skalierung, nach der Hörer einen numerischen Wert der 2. vs. der 1. Silbe zuordnen und die zu bewertenden Stimuli entlang einer geraden Linie anordnen • die Hörer definieren also ihr Kriterium selbst, ohne dass es ihnen verbalisiert vorgesetzt wird • aus der Anordnung lassen sich Ähnlichkeiten ableiten • die drei Parameter werden zunächst einzeln variiert

  24. Prominenz wird abgeleitet aus der Wirkung auf Rhythmuswahrnehmung • Silbenketten ba werden durch f0, Dauer und Energie systematisch gruppiert • Hörer sollen entscheiden, ob ein 1er- 2er- oder 3er-Rhythmus vorliegt • darüber hinaus, ob er anschwellend oder abschwellend ist (Jambus, Trochaeus, Daktylus) • also neue Experimentserien

  25. Experiment 3 • Je 1 Serie für Pitch, Energie und Dauer mit 7 Stufen • Pitch-Muster p14, p13, p12, p11, p01, p21, p22, wie in den ersten beiden Experimenten • Dauer nur im zweiten Vokal verändert, auf p00 • wie in Exper1, letzten 4 Perioden ausgenommen • keine komplementäre Kürzung/Längung in 1./2. Silbe, wie in Exper2 • keine Veränderung des mittleren Konsonanten, da Längung Zögerungseffekte hervorruft • -10%, 0, 10%, 20%, 30%, 40%, 50%

  26. Energie als Amplitudeneinhüllende manipuliert • auch nur für die 2. Silbe, wie in Exper1 • 4 Punkte festgelegt in Stimulus p00 • Beginn des 1. Vokals 100% • Beginn des mittleren Konsonanten 100% • Mitte des 2. Vokals: 100%, +1dB=112%, +2dB=126%, +3dB=141%, +3.5dB=150%, -1dB=89%, -2dB=79% • Ende der Stimmh. 100% bzw. 89%, 79%

  27. Drei Gruppen von Vpp • Gruppe 1 • 8 Vpp • Reihenfolge Pitch, Energie, Dauer • Gruppe 2 • 8 Vpp • Reihenfolge Energie, Dauer, Pitch • Gruppe 3 • bislang nur 2 Vpp, 1 Vp hat fast nur 1. Silbe • Reihenfolge Dauer, Energie, Pitch

  28. Ergebnisse • starker Pitcheffekt • schwächerer, aber deutlicher Dauereffekt • kein Energieeffekt • Positionseffekt in der Experimentabfolge

  29. für Energie und Dauer bei Vergleich der Gruppen1,2 • für beide Parameter über sämtliche Stimuli mehr Antworten für Prominenz auf 1. Silbe, wenn Pitchserie den ersten Teiltest stellte • da deutliche Prominenz durch Pitch auf 2. Silbe fehlt, tendiert das Urteil stärker zur 1. Silbe, umso mehr, wenn vorher Pitchtest • kein Positionseffekt für Pitch • unterstreicht die Robustheit des Parameters

  30. in Pitchserie p11 50% Urteile in beiden Gruppen • d.h. die beiden Silben sind gleich prominent • daraus lässt sich folgern, dass p11 besser geeignet ist für Dauer- und Energiemanipulation • p00 hat bereits ein Bias zur ersten Silbe • die Neutralisierung der fehlenden finalen Längung durch Pitchbewegung entfällt • muss durch Dauer oder Energie bewirkt werden • Dauer wird für 2. Silbe so erst versetzt wirksam • gilt umso mehr für Energie, wenn schwächerer Parameter

  31. Experiment 4 Stimuli • Pitch-Serie wie in Exper3: 7 Stimuli • Dauer wieder komplementär in 1. und 2. Silbe verändert, um globale Geschwindigkeit konstant zu halten • vom Basisstimulus p11e00d00 aus • 3 Längungs- bzw. Kürzungsstufen um jeweils 10% komplementär in den beiden Silben • nur Vokaldauer ohne die Plosivlösung , die 1. Periode und die letzten 4 Perioden • 7 Stimuli

  32. Manipulation des Tonhöhenverlaufs

  33. Amplitudeneinhüllende ebenfalls komplementär in 1. und 2. Silbe verändert • dynamische Veränderung der Einhüllenden über jeder Silbe, um globale Lautheit konstant zu halten • für Amplitudenverstärkung lineare Abnahme von erhöhtem Wert am Vokalanfang auf 100% am Vokalende • für komplementäre Abschwächung linear von erniedrigtem Wert am Vokalanfang um -1dB am Ende • lineare Verbindung über den Verschluss

  34. vom Basisstimulus p11e00d00 aus • 3 1dB-Schritte nach oben bzw. nach unten • komplementär über jeder Silbe • 7 Stimuli • dieselben Dauer- und Amplitudenmanipulationen über dem monotonen Basisstimulus p00e00d00 • jeweils 7 Stmuli • 5 Stimulusserien mit je 7 • 5 Wiederholungen • insgesamt 5*7*5 = 175 Stimuli • in 5 Teiltests für jede jeweils eine Serie

  35. Hypothesen • Der Basisstimulus p11e00d00 hat equiprominente Silben, daher Zufallsurteil 50%. • Die 6 Pitch Veränderungen bewirken einen monotonen Übergang von Prominenz auf 1. zu 2. Silbe, der sich in Urteilen abbildet. • Diese Übergänge finden sich auch in der Dauer- und der Amplitudenserie von p11.

  36. Der Basisstimulus p00e00d00 zeigt ein Bias zur Prominenz auf der 1. Silbe • wegen fehlender finaler Längung • die in der Pitchserie durch Tonbewegung kompensiert wird • aber in p00 ducrh Dauer- bzw. Amplitude erst ausgeglichen wird • daher Zufallsurteil erst für den nächsten Stimulus in den beiden Serien bei Verstärkung der Dauer bzw. der Amplitude in der 2. Silbe. • Die Pitchserie weist den schärfsten Übergang auf.

  37. Durchführung des Hörtests • 2 Gruppen zu je 8 Hörern mit RMG im Studio • in Gruppe 1 hatten 2 Hörer an einem vorangehenden Rhythmushörtest teilgenommen, in Gruppe 2 waren es 5 n = no previous test, t = test • folgende Gruppenbildungen für Datenanalyse: Gr1 - Gr2, Gr1n, Gr2n, Gr1t, Gr2t, Grn - Grt • jeweils 5 separate Teiltests in einer Sitzung • Gruppe 1: p11-Dauer, p11-Amplitude, p00-Dauer p00-Amplitude, Pitch • Grupp2: Pitch zwischen den p11 und p00-Serien

More Related