1 / 14

음성인식 2013.12.02

음성인식 2013.12.02. 김 성 Multimedia DSP LAB. Humor or . 목차. ☞ Endpoint Detection 1. STE 이론 2. ZCR 이론 3. STE-ZCR Endpoint Detection ☞ Pattern Recognition. 이상 음향 감지 / 분류 1 차 분류 : 사람의 음성 / 비음성 2 차 분류 사람의 음성 → ( 공포 , 평상 ) 감성 분류 비음성 신호 → 자동차 충돌소리 , 폭발소리 등.

blaze
Download Presentation

음성인식 2013.12.02

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 음성인식2013.12.02 김 성 Multimedia DSP LAB

  2. Humor or

  3. 목차 ☞ Endpoint Detection 1. STE 이론 2.ZCR이론 3. STE-ZCR Endpoint Detection ☞ Pattern Recognition

  4. 이상 음향 감지/분류 • 1차 분류 : 사람의 음성/비음성 • 2차 분류 • 사람의 음성 → (공포, 평상) 감성 분류 • 비음성 신호 → 자동차 충돌소리, 폭발소리 등

  5. EDNPOINT DETECTIONSTE란? Short-Time-Energy 유성음의 에너지는 무성음의 에너지보다 크게 나타나는 특징을 이용하여 유성음(Voiced Speech)과 무성음(Unvoiced Speech)의 구별에 사용된다.

  6. STE수행결과

  7. Zero-Crossing Rate 신호의 부호가 바뀌는 비율 특징 ZCR이 높으면 빠르게 변하는 신호이며 이것은 높은 주파수 ZCR이 낮으면 느리게 변하는 신호이며 이것은 낮은 주파수 EDNPOINT DETECTIONZCR이란?

  8. ZCR수행결과

  9. Endpoint Detection STE-ZCR ② ① ⑥ ③ ④ 음성 구간 설정 ④ ⑤ ⑤ ⑤ ⑥ ⑥ 음성 구간 재 설정 25frame 25frame Speech interval *

  10. 초기 준비과정 가정: 처음 100ms구간 동안 배경잡음만 존재 배경잡음에 대한 통계적 특성 추출 및 Threshold 설정 Maximum magnitude, Minimum magnitude Zero Crossing rate Short time average magnitude filtering average magnitude ≥ 구간 찾음 발견된 구간 전후 average magnitude ≥ 인 구간 찾고 음성 구간으로 설정( ) 설정된 음성 구간의 전후 25frame에 대해 zero-crossing rate 계산 zero-crossing rate ≥ 구간 찾음 우에서 설정한 음성 구간과 함께 최종 음성 구간으로 설 정 ( )

  11. 수행결과

  12. 패턴인식 • 원리 • 전처리부분 • DAQ • 인식구간추출.잡음처리 • 인식부 • 특징추출 • 비교(DTW,HMM.ANN) • 인식결과 출력

  13. References L. R. RABINER and M. R. SAMBUR, "An Algorithm for Determining the Endpoints of Isolated Utterances", June 10, 1974 G. Saha, Sandipan and SumanSenapati,"A New Silence Removal and Endpoint Detection Algorithm for Speech and Speaker Recognition Applications", Department of Electronics and electrical Communication Engineering Indian Institute of Technology WWW.NAVER.COM WWW.GOOGLE.COM

  14. Q&A 감사합니다~

More Related