1 / 18

معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف ‌ نگاري در جهت بازشناسي گفتار

معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف ‌ نگاري در جهت بازشناسي گفتار ارائه کننده: وحيد اسماعيل ‌ زاده استاد : دکتر حسين صامتي بهار 87. رئوس مطالب. مقدمه معرفي رويکرد داده گمشده نقاب طيف نگاري و جايگاه آن در رويکرد داده گمشده معرفي روشهاي تخمين نقاب طيف نگاري

ray-gilliam
Download Presentation

معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف ‌ نگاري در جهت بازشناسي گفتار

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار ارائه کننده: وحيد اسماعيل‌زاده استاد : دکتر حسين صامتي بهار 87

  2. رئوس مطالب • مقدمه • معرفي رويکرد داده گمشده • نقاب طيف نگاري و جايگاه آن در رويکرد داده گمشده • معرفي روشهاي تخمين نقاب طيف نگاري • رويکردهاي بر اساس تحليل سيگنال و معيارهاي بکار رفته • نتايج شبيه سازي 1 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  3. مقدمه • سيستمهاي بازشناسي گفتار پيشين • تأثير نويز در افت کارايي سيستمهاي بازشناسي گفتار 2 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  4. رويکرد داده گمشده دو رويکرد اصلي در تئوري داده گمشده : Data Marginalization Data imputation 3 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  5. نقاب طيف‌نگاري تعريف نقاب طيف‌نگاري انواع نقاب طيف‌نگاري : - نقاب سخت - نقاب نرم مهمترين و حياتي‌ترين بخش تئوري ويژگي‌گمشده تخمين نقاب طيف‌نگاري 4 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  6. روشهاي تخمين نقاب طيف نگاري • رويكردهاي براساس تحليل سيگنال ( روشهاي bottom-up) • رويکردهاي براساس مدلهاي آماري ( روشهاي top-down ) • رويکردهاي براساس تحليل سيگنال و مدلهاي آماري(ترکيب دو روش بالا) • رويكردهاي بر اساس CASA 5 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  7. رويکردهاي بر اساس تحليل سيگنال هدف نهايی : تخمين دقيق SNR در هر مولفه زمان-فرکانس معيارهاي تخمين مستقيم SNR • الگوريتم هاي تخمين نويزکلي • الگوريتم هاي تخمين نويز محلي و تخمين SNR محلي معيارهاي تخمين غير مستقيم SNR بر اساس ويژگيهاي سيگنال گفتار 6 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  8. معيارهاي تخمين غير مستقيم SNR بر اساس ويژگيهاي سيگنال گفتار • Spectral Entropy Measure • Sparsity Measure • Comb Filter Ratio (CFR) • AutoCorrelation Peak Ratio (ACPR) • Kurtosis • Flatness 7 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  9. Spectral Entropy Measure • تعريف entropy • enrtropy به عنوان معياري براي peakness • هدف : محاسبه آنتروپي short time fourier transform spectrum • تبديل spectrum به PMF : • محاسبه آنتروپي براي هر فريم : 8 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  10. نتايج(spectral entropy) Hit Ratio = 0.5 Voiced Hit Ratio = 0.76 9 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  11. Sparsity Measure proposed Sparsity measure: If we assume the number of samples of signal is M then: 10 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  12. Sparsity Measure 11 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  13. Comb filter ratio 12 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  14. AutoCorrelation Peak Ratio 13 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  15. Kurtosis • سيگنالهاي صوت اطراف ما، شامل گفتار، به عنوان سيگنالهاي سوپرگاوسين در نظر گرفته مي‌شوند. • Kurtosis معياري براي تعيين تيز بودن نقطه بيشينه مي‌باشد . اميدهاي رياضي از ميانگين نمونه‌ها در هر زير باند از هر فريم بدست آمده است. 14 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  16. نتايج 15 از 15 معيارهاي مبتني بر سيگنال براي تخمين نقاب طيف‌نگاري در جهت بازشناسي گفتار

  17. منابع Morris, A., Barker, J., Bourlard, H., 2001. “From missing data to maybe useful data: soft data modelling for noise robust ASR.” In: Proc.WISP-01. Stratford-upon-Avon, England, April, pp. 153–164. M. L. Seltzer, B. Raj, and R. M. Stern, 2004. “A Bayesian classifier for spectrographic mask estimation for missing-feature speech recognition,” Speech Communication, 43(4), pp. 379-393. Kim, W., Stern, R. M., May 2006. “Band-independent mask estimation for missing-feature reconstruction in the presence of unknown background noise.” In: ICASSP. vol. 1. Toulouse, France, pp. 305– 308. Yantorno, R.E., Smolenski, B.Y., Chandra, N., 2003. “Usable speech measures and their fusion.” In: Proc. ISCAS. London. England. pp. 34-51. H. Misra, S. Ikbal, H. Bourlard, and H. Hermansky, “Spectral entropy based feature for robust asr,” in Proc. ICASSP, May 2004, pp. 193–196.

  18. ?

More Related