140 likes | 700 Views
음성인식 2013.12.02. 김 성 Multimedia DSP LAB. Humor or . 목차. ☞ Endpoint Detection 1. STE 이론 2. ZCR 이론 3. STE-ZCR Endpoint Detection ☞ Pattern Recognition. 이상 음향 감지 / 분류 1 차 분류 : 사람의 음성 / 비음성 2 차 분류 사람의 음성 → ( 공포 , 평상 ) 감성 분류 비음성 신호 → 자동차 충돌소리 , 폭발소리 등.
E N D
음성인식2013.12.02 김 성 Multimedia DSP LAB
목차 ☞ Endpoint Detection 1. STE 이론 2.ZCR이론 3. STE-ZCR Endpoint Detection ☞ Pattern Recognition
이상 음향 감지/분류 • 1차 분류 : 사람의 음성/비음성 • 2차 분류 • 사람의 음성 → (공포, 평상) 감성 분류 • 비음성 신호 → 자동차 충돌소리, 폭발소리 등
EDNPOINT DETECTIONSTE란? Short-Time-Energy 유성음의 에너지는 무성음의 에너지보다 크게 나타나는 특징을 이용하여 유성음(Voiced Speech)과 무성음(Unvoiced Speech)의 구별에 사용된다.
Zero-Crossing Rate 신호의 부호가 바뀌는 비율 특징 ZCR이 높으면 빠르게 변하는 신호이며 이것은 높은 주파수 ZCR이 낮으면 느리게 변하는 신호이며 이것은 낮은 주파수 EDNPOINT DETECTIONZCR이란?
Endpoint Detection STE-ZCR ② ① ⑥ ③ ④ 음성 구간 설정 ④ ⑤ ⑤ ⑤ ⑥ ⑥ 음성 구간 재 설정 25frame 25frame Speech interval *
초기 준비과정 가정: 처음 100ms구간 동안 배경잡음만 존재 배경잡음에 대한 통계적 특성 추출 및 Threshold 설정 Maximum magnitude, Minimum magnitude Zero Crossing rate Short time average magnitude filtering average magnitude ≥ 구간 찾음 발견된 구간 전후 average magnitude ≥ 인 구간 찾고 음성 구간으로 설정( ) 설정된 음성 구간의 전후 25frame에 대해 zero-crossing rate 계산 zero-crossing rate ≥ 구간 찾음 우에서 설정한 음성 구간과 함께 최종 음성 구간으로 설 정 ( )
패턴인식 • 원리 • 전처리부분 • DAQ • 인식구간추출.잡음처리 • 인식부 • 특징추출 • 비교(DTW,HMM.ANN) • 인식결과 출력
References L. R. RABINER and M. R. SAMBUR, "An Algorithm for Determining the Endpoints of Isolated Utterances", June 10, 1974 G. Saha, Sandipan and SumanSenapati,"A New Silence Removal and Endpoint Detection Algorithm for Speech and Speaker Recognition Applications", Department of Electronics and electrical Communication Engineering Indian Institute of Technology WWW.NAVER.COM WWW.GOOGLE.COM
Q&A 감사합니다~