1 / 14

端點偵測介紹

端點偵測介紹. 端點偵測. 端點偵測( End-point Detection , EPD ) : 決定音訊開始和結束的位置,又稱 Speech Detection 或是 VAD (Voice Activity Detection) 。. 端點偵測. 時域端點偵測-絕對值能量法、平方和能量法和越零率 絕對值能量法: 平方和能量法: 越零率 ( Zero Crossing Rate , ZCR )是在訊號中,音訊通越零點的次數. 其中 E(n) 為第 n 個分析框的能量估算值, p 為該分析框的中心點位置, N 為分析框寬度. 能量法與越零率.

baxter
Download Presentation

端點偵測介紹

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 端點偵測介紹

  2. 端點偵測 • 端點偵測(End-point Detection, EPD):決定音訊開始和結束的位置,又稱 Speech Detection 或是 VAD (Voice Activity Detection)。

  3. 端點偵測 • 時域端點偵測-絕對值能量法、平方和能量法和越零率 • 絕對值能量法: • 平方和能量法: • 越零率(Zero Crossing Rate, ZCR)是在訊號中,音訊通越零點的次數 其中E(n)為第n 個分析框的能量估算值,p 為該分析框的中心點位置,N 為分析框寬度

  4. 能量法與越零率

  5. 頻域端點偵測 • 訊號轉換:離散傅立葉轉換 其中N為分析視窗長度,X(k)為轉換後頻率成分k之能量

  6. 平均能量熵值 • 平均能量熵值 • 限制頻帶 計算整段平均能量 • 其中,u為整段訊號的平均能量點,A(n)為第n個點的振幅值,N為訊號總點數 or

  7. 平均能量熵值 • 將平均能量加入機率密度 其中,β為調整值,u為平均能量

  8. 平均能量熵值 • 計算加入平均能量後的負熵值 • 其中,Hi為第i個音框下重新計算後的負熵值

  9. 平均能量熵值

  10. 決定門檻值

  11. 決定門檻值 • 取前N個音框之平均值 • 此方法假設一開始是靜音,但若一開始就有聲音此做法就很容易發生錯誤 • 取音框中最大數值的0.1倍 • 此方法在音量忽大忽小時或雜訊太強時,會發生錯誤 • 取音框中最小數值的5倍 • 此方法在雜訊太強時,會發生錯誤

  12. 結合越零率 • 先訂出三個門檻值分別為: • 高能量門檻值(τu) • 低能量門檻值(τl) • 越零率門檻值(τzc)

  13. 結合越零率 • 先以低能量門檻值(τl)為主,找出語音的起點 • 經過B個音框後,能量更是大於τu,則視N1為聲音的起始點,反之在B個音框內有小於τl或是低於τu,則放棄N1繼續往下找

  14. 結合越零率 • 找到N1之後,往回檢查前幾個音框的越零率,是否大於τzc ,若是就繼續往回搜尋,直到越零率小於τzc為止 • 此時的 與N2為此訊號的端點

More Related