1 / 14

Riaditeľ Ing. Ladislav Hluchý, CSc. Paralelného a distribuovaného spracovania informácií

Riaditeľ Ing. Ladislav Hluchý, CSc. Paralelného a distribuovaného spracovania informácií Ing. L. Hluchý, CSc. Modelovanie a riadenie diskrétnych systémov Ing. Ivana Budinská Návrh a testovanie číslicových systémov M. Fischerová Elektrónová litografia RNDr. I. Kostič

ardara
Download Presentation

Riaditeľ Ing. Ladislav Hluchý, CSc. Paralelného a distribuovaného spracovania informácií

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Riaditeľ Ing. Ladislav Hluchý, CSc. Paralelného a distribuovaného spracovania informácií Ing. L. Hluchý, CSc. Modelovanie a riadenie diskrétnych systémov Ing. Ivana Budinská Návrh a testovanie číslicových systémov M. Fischerová Elektrónová litografia RNDr. I. Kostič Numerické metódy a algoritmy Doc. RNDr. L. Halada, CSc. Spracovanie reči Ing. M. Rusko Senzorické systémy Ing. Š. Havlík, DrSc.

  2. Speech databasesfor basic research, for training & testing of ASR and TTS

  3. Voice operated information systemsteleservices Speech recognition server Telephone server Speech synthesis server

  4. Speech synthesis (TTS)Text to speech, telephone applications, tools for the blind

  5. Syntéza reči Súčasný stav: „Unit selection“ syntetizátor s modelovaním prozódie pomocou CART stromov Ukážka: Kempelen 2.1

  6. Model tvorby reči na princípe Zdroj - Filter

  7. HMM syntéza - Motivácia • Jeden z hlavných problémov korpusovej syntézy reči je „data sparsity“. Syntéza je veľmi kvalitná ak syntetizované jednotky majú pokrytie v korpuse, a naopak podstatne horšia ak požadované jednotky korpus neobsahuje. Inými slovami, problémom je generalizovanie „unseen data“. • ASR založené na HMM-GMM majú práve túto vlastnosť generalizovania výborne rozpracovanú v tréningu AMs.

  8. HMM syntéza používa natrénované AMs modely a reč generuje priamo z nich HMMs modelujú spektrum a navyše - čo nie je v ASR – aj F0.

  9. Úplný model reči má veľkosť do 1MB, na rozdiel od korpusovej syntézy, ktorá má x100MB Kontextuálne zhlukovanie (ako v ASR) je oveľa flexibilnejšie ako výber jednotiek Výborný framework pre modifikáciu a konverziu hlasov (možno meniť kvalitu hlasu!) Dobrá plynulosť generovanej reči, ale stále nízka kvalita reči (reč zneje stále roboticky) Výhody a nevýhody HMM syntézy

  10. Dramatic Piece Reader (DRAPER) Architecture of Draper

  11. Automatic speech recognition (ASR)Speech to text, dictation, media monitoring

  12. Speech recognition schematic diagram

  13. Automatický prepis diktátu pre MSSR (APD) • Objednávka MSSR na vytvorenie softvéru na automatické prepisovanie diktátu do textu (napríklad diktovanie súdnych rozhodnutí sudcami) Systém vykonáva: • On-line prepis reči (Diktačný systém) • Off-line prepis z diktafónových nahrávok reči

  14. Ďakujeme za pozornosť Oddelenie analýzy a syntézy reči UI SAV

More Related