1 / 25

Stimmliche Charakteristika bei globaler und lokaler Lautstärkevariation

Stimmliche Charakteristika bei globaler und lokaler Lautstärkevariation. Christine Mooshammer & Jennifer Schneeberg Institut für Phonetik und digitale Sprachverarbeitung Christian-Albrechts- Universität Kiel Deutschland. Einführung. Globale Lautstärkeerhöhung

ziv
Download Presentation

Stimmliche Charakteristika bei globaler und lokaler Lautstärkevariation

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Stimmliche Charakteristika bei globaler und lokaler Lautstärkevariation Christine Mooshammer & Jennifer Schneeberg Institut für Phonetik und digitale Sprachverarbeitung Christian-Albrechts-Universität Kiel Deutschland

  2. Einführung • Globale Lautstärkeerhöhung • primär: größerer subglottaler Luftdruck • Schnelleres Schließen der Stimmlippen (höhere f0) • Flacher abfallendes Quellspektrum • sekundär: supralaryngale Artikulation • Längung der Vokale • Tieferer Kiefer bei Vokalen und damit höherer F1 DAGA 2005 München

  3. Einführung • Lokale Lautstärkeänderung: = linguistisch bedingt: Akzentuierung • Wortakzent in Sprachen mit dynamischen Akzent (z.B. „Tenor“) • Intensität als Hauptmerkmal neben Dauer und Grundfrequenz(s. Sweet 1906, Sluijter et al. 1996) • kontrolliert durch subglottalen Luftdruck • Nachweis: Änderung des spectral tilts • Gilt auch in deakzentuierter Position, d.h. ohne Grundfrequenzunterschiede DAGA 2005 München

  4. Einführung  Satzbetonung: realisiert durch melodische Unterschiede mittels Anpassung der Stimmlippenspannung Hypothesen: • Nur lexikalischer Wortakzent bewirkt ähnliche Änderungen in den stimmlichen Parametern wie globale Lautstärkeänderungen, nicht aber der Satzakzent. • Unterschiede in der Wortbetonung sind unabhängig davon, ob das Wort satzbetont ist oder nicht. DAGA 2005 München

  5. Korpus 1. Wortakzent DAGA 2005 München

  6. Korpus 2. Satzbetonung: Frage-Antwort Paradigma (durch Variation des Fokus + Emphase) FOCUS [+F] Q: Wolltest Du Dir Friedas Buch ausleihen? A: Nein, ich wollte Lenas Buch ausleihen. NON-FOCUS [-F] Q: Wie findest Du Lena? A: Ich hasse Lena und ihre Schusseligkeit. DAGA 2005 München

  7. Korpus 3. Globale Lautstärkevariation Sätze mit wortbetonten, fokussierten Testsequenzen wurden in drei Lautstärkebedingungen gesprochen: • Normal (N) • laut: „Sprich laut ohne zu schreien“ (L) • leise: „Sprich leise ohne zu flüstern“ (S) 8 bis 9 Wiederholungen DAGA 2005 München

  8. Aufnahmen • 6Sprecher aus Norddeutschland (20-30 Jahre alt, Nichtraucher, männlich) • Akustik und Glottissignal (Lx) mittels Laryngographie (Glottal Enterprises) • Die erste Ableitung des Lx-Signals (DEGG) wurde mittels Differenzierung berechnet. • Akustische Etikettierung mit Praat DAGA 2005 München

  9. Messungen Lx • Halbautomatische Etikettierung mittels EMU/R • Alle Perioden während des Vokals /e/ Analysierte Parameter: a) f0 basierend auf dem DEGG Signal b) RMS basierend auf dem Audio-Signal c) Open Quotient OQ d) Speed Quotient SQ e) Steigungen der Öffnungs- und Schließungsbewegungen (Oslope, Cslope) DAGA 2005 München

  10. T top2 1. Negativer Gipfel der ersten Ableitung = top1 2. 4/7 Schwellwert (Howard‘s method) = top2 top1 Messungen • Open Quotient: 100*top/T • Problem: Festlegung des Zeitpunkts der Öffnung: DAGA 2005 München

  11. Schließung Öffnung Oslope Cslope • Cslope • Oslope tcl top Messungen • Speed Quotient: 100*tcl/top (10% Schwellwert) DAGA 2005 München

  12. Problem: Trennung der Einflüsse des subglottalen Luftdrucks und der Stimmlippenspannung auf die EGG Parameter  Vorhersagen(basierend auf Marasek (1997), Zwei-Massen-Modell -> Lx-Signal aus Glottisfläche) DAGA 2005 München

  13. Intensität Grundfrequenz • Bei lautem Sprechen: höhere f0 und größerer Bereich • Signifikant tiefere f0 bei leisem Sprechen • Für alle Sprecher signifikante Unterschiede zwischen den Lautstärkeniveaus Stimmparameter: globale Lautstärke DAGA 2005 München

  14. Open Quotient Steigung der Öffnungsbewegung • OQ vergrößert sich von laut und normal nach leise • Konsistent für alle Sprecher • Signifikant steilere Steigungen für lautes Sprechen • Konsistent für laut-normal • Nur 3 Spr. für normal-leise Stimmparameter: globale Lautstärke DAGA 2005 München

  15. Grundfrequenz Intensität Fokus Non-Fokus Fokus Non-Fokus • /l/: Wortakzent bewirkt höhere Intensität bei +F und –F • /z/: höhere Intensität bei –F nur bei 3 Sprechern Stimmparameter: Prominenz • Konsonanteneffekt bei [-F]: • /l/: F0 unterscheidet sich für Wortakzent (aufgrund von 2 Sprechern)f0_stress.jpg • /z/: F0 Neutralisation DAGA 2005 München

  16. Fokus Non-Fokus Stimmparameter: Prominenz Open Quotient • Vorhersagen: • Wortakzent: [+S]<[-S] • Fokus: [+F]>[-F] • Wortakzent: • niedrigerer OQ für [+S] • ähnlich laut-normal • Fokus: • meist niedriger für [+F] • entgegen Vorhersage DAGA 2005 München

  17. Steigung der Öffnungsbewegung • Vorhersagen: • Wortakzent: [+S]>[-S] • Fokus: [+F]=[-F] Non-Fokus Fokus Stimmparameter: Prominenz • Wortakzent: • [+F]: vier Sprecher zeigen steilere Steigungen für [+S] • [-F]: 4 Sprecher /l/, nur 1 Sprecher /z/ • Fokus: • In beiden Bedingungen meist signifikanter Anstieg der Steigung für [+F] DAGA 2005 München

  18. Zsf.: Stimmparameter • Lautes Sprechen: erhöhter subglottaler Luftdruck • Leises Sprechen: weniger konsistente Druckunterschiede Änderung der Stimmqualität zu behaucht? • Wortakzent: Evidenz für höheren subglottalen Luftdruck nur bei fokussierten Wörter und hauptsächlich nach /l/ • Fokus: kaum Hinweise auf geänderte Stimmlippen-spannung, dafür Evidenz für erhöhten Luftdruck Tentative Erklärung: • Bestimmung des Zeitpunkts der glottalen Öffnung • Verwendete Parameter könnten abhängig von der Grundfrequenz sein (z.B. Steigungen). DAGA 2005 München

  19. 2. Formanalyse  Alternativer holistischer Ansatz: gesamte Wellenform bildet die Basis, z.B. PCA (Mokhtari et al. 2003) oder Functional Data Analysis (FDA, z.B. Ramsay) • Input: • Mittlere zwei Perioden • Zeit- und amplituden- normalisiert • 317 Items • Verarbeitung: • Berechnung von Spline Funktionen DAGA 2005 München

  20. Hauptkomponente (64.3 %) Lautstärke X Lenor X Lena X Hauptkomponentenanalyse: Positiv: längere Geschlossenphase, steile Verschließbewegung, linksschief Negativ: lange Offenphase, langsamere Verschließbewegung, symmetrischer Impuls • Faktorscores • Lautstärke: • Laut: pos. Werte • Normal: Werte um null • Leise: neg. Werte • Wortakzent: • „Lena“: positive Werte • „Lenor“: negative Werte • Fokus: kein Unterschied DAGA 2005 München

  21. Lautstärke Signifikant für 5 Sprecher X X X X X Lena Lenor Lena Lenor Prominenz: keine signifikanten Effekte DAGA 2005 München

  22. Lautstärke: signifikante Effekte bei 5 Sprechern Prominenz:signifikanten Effekte bei DP Sehnen Senat Sehnen Senat DAGA 2005 München

  23. Schlussfolgerungen • Globale Lautstärkeveränderung: verändert die Form des glottalen Pulses • Wortakzent: • Sehr inkonsistente Effekte • Nur für einen Sprecher in die erwartete Richtung • Nachdem f0- und Amplitudenunterschiede entfernt wurden, ergeben sich keine Effekte für Wortakzent DAGA 2005 München

  24. Schlussfolgerungen (cont.) • Warum keine Effekte bei Prominenz? • Unterschiede könnten zu subtil sein, um sich signifikant niederzuschlagen.  Keine klare Tendenz erkennbar • Unterschiede zeigen sich nicht im Lx Signal aufgrund der bekannten Probleme  Lautstärkeeffekte sind sehr konsistent 3. Wortakzent wird nicht durch Änderung des subglottalen Luftdrucks realisiert  Neue Hypothese: Flacherer Abfall bei wortbetonten Vokalen ist eine Folge der laryngalen und/oder supralaryngalen Artikulation DAGA 2005 München

  25. Ausblick • Parameter des spektralen Abfalls • spectral balance, spectral tilt und spectral emphasis ??? Abhängig von Grundfrequenz ??? • Systematischer Vergleich zwischen verschiedenen Maßen mittels Synthese • Supralaryngale Artikulation: Parameter wie Dauern und Formanten • Vorläufige Ergebnisse: • große Unterschiede bei Wortakzent, aber nicht in Richtung lautes Sprechen • nur selten konsistente Unterschiede für Fokus • Erhebung von artikulatorischen Daten DAGA 2005 München

More Related