1 / 8

Bayerisches Archiv für Sprachsignale

Bayerisches Archiv für Sprachsignale. Florian Schiel & Christoph Draxler schiel | draxler @bas.uni-muenchen.de Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München http://www.bas.uni-muenchen.de/Bas. BAS Überblick. Motivation.

avedis
Download Presentation

Bayerisches Archiv für Sprachsignale

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bayerisches Archiv für Sprachsignale Florian Schiel & Christoph Draxler schiel | draxler @bas.uni-muenchen.de Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München http://www.bas.uni-muenchen.de/Bas

  2. BAS Überblick Motivation ELDA/LDC-Kataloge:85% aller deutschen Sprachkorpora20% aller deutschen Aussprachelexika

  3. BAS Neueste Korpora Motivation

  4. BAS Vision Motivation • Akuter Bedarf: Transnationales Corpus für Deutsch (TCD) • Vorbilder BNC (Großbritannien), CGN (Belgien/Niederlande) • Schweiz, Österreich, Deutschland, Luxemburg, Italien • Umfang • mindestens 10 Mio Wörter Sprachaufnahmen, davon • 1 Mio Wörter transliteriert/segmentiert • Terminologien/Ontologien für 10 Domänen • Organisation • Konsortium der beteiligten Staaten • öffentlich verfügbar • Finanzbedarf ca. 20 Mio EUR • Dauer 4 Jahre (+ 1 Jahr Planungsphase)

  5. Ph@ttSessionz Motivation Sprachaufnahmen über das Internet • Training von Spracherkennungssystemen • Untersuchung regionaler Variation • 41 Schulen (Gymnasien) in Deutschland • 90 h Sprachdaten in hoher Qualität

  6. BAS ALC Motivation • Kooperation mit Rechtsmedizin (LMU) • 150 Sprecher (75f+75m) alkoholisiert/nüchtern • Atemalkohol- und Blutalkoholtests • Sprachtypen: gelesen, Monolog, Dialog, Command&Control • Vision: automatische Detektion im Fahrzeug

  7. BAS SmartWeb Motivation • Realistische Interaktion mit SmartPhone / PDA • Sprachgesteuerter Web-Zugriff vom fahrenden Motorrad • Triaden-Kommunikation: Mensch - Mensch - Maschine • OnFocus / OffFocus durch Gesichtsvideo

  8. BAS SIGNUM Motivation • Erstes deutsches Gebärdensprachkorpus • Kooperation mit Universität Aachen • 25 Gebärder mit 450 Glossen und 780 'Sätzen' • 1 TByte Videodaten

More Related