1 / 26

稀疏性雙反旋積非負矩陣分解法結合 遮罩之 單通道盲訊號分離

稀疏性雙反旋積非負矩陣分解法結合 遮罩之 單通道盲訊號分離. 大綱. 蛙類純音辨識 非負矩陣分 解法 稀疏性雙反旋積非負矩陣分 解法 遮罩. 蛙類純音 辨識. 預處理. 預強調. 音框化. 窗函數. 訊號. 預處理後訊號. 端點偵測. 平均熵值法. 預處理後訊號. 訊號轉換. 計算平均能量值. 機率密度函數. 平均熵值. 擷取端點. 多段式平均頻譜法. 狀態. 狀態三. 狀態二. 狀態一. 音框. 音框一. 音框二. 音框三. 音框四. 音框七. 音框五. 音框六. 辨識與分類. 日本樹蛙. 排序. 非負矩陣分解法.

Download Presentation

稀疏性雙反旋積非負矩陣分解法結合 遮罩之 單通道盲訊號分離

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 稀疏性雙反旋積非負矩陣分解法結合遮罩之單通道盲訊號分離稀疏性雙反旋積非負矩陣分解法結合遮罩之單通道盲訊號分離

  2. 大綱 • 蛙類純音辨識 • 非負矩陣分解法 • 稀疏性雙反旋積非負矩陣分解法 • 遮罩

  3. 蛙類純音辨識

  4. 預處理 預強調 音框化 窗函數 訊號 預處理後訊號

  5. 端點偵測 • 平均熵值法 預處理後訊號 訊號轉換 計算平均能量值 機率密度函數 平均熵值 擷取端點

  6. 多段式平均頻譜法 狀態 狀態三 狀態二 狀態一 音框 音框一 音框二 音框三 音框四 音框七 音框五 音框六

  7. 辨識與分類 日本樹蛙 排序

  8. 非負矩陣分解法 • 由原始矩陣V藉由不同的限制條件,而分解成兩個矩陣相乘的形式 • 限制條件為:矩陣內的元素值必須都大於等於零 其中[W]為基底矩陣,[H]為係數矩陣

  9. 非負矩陣分解法 • 為了要使矩陣W與矩陣H相乘後的訊號能夠相似於原始信號,作者提出一個基於KL散度的目標函數來當作指標 • 目標函數如下

  10. 非負矩陣分解法 其中 當V = WH時,目標函數才有最小值0

  11. 非負矩陣分解法 • 更新規則 • 其中為同位素(Element-Wise)的相乘,其除法也是進行同位素的運算,1則是元素值都為1的矩陣,且其維度與原始信號的維度相等

  12. 稀疏性雙反旋積非負矩陣分解法 • 經由非負矩陣分解法所分析出的資料雖然能局部化、稀疏化(Sparseness)的呈現,但是稀疏性只是屬於其演算法的附屬品,並不能對資料的稀疏性去做程度上的控制 • 非負矩陣分解法延伸版本—稀疏性雙反旋積非負矩陣分解法 • 控制非負矩陣分解法之稀疏程度 • 取得基底資訊之時間上的變化和係數資訊上的頻譜改變

  13. 稀疏性雙反旋積非負矩陣分解法 • 目標函數改寫成如下所示: • 其中 且

  14. 稀疏性雙反旋積非負矩陣分解法 • 與 是執行移動(Shift)的動作,指的是移動矩陣i個列向量或是移動j個行向量,其執行示意圖如下:

  15. 稀疏性雙反旋積非負矩陣分解法 • 更新規則

  16. 稀疏性雙反旋積非負矩陣分解法 原始音檔(拉都希氏+梭德氏) 重建音檔(拉都希氏)

  17. 遮罩

  18. 遮罩 • 將重建的訊號利用Otsu演算法(Otsu Method)[]找尋適合的門檻值(Threshold),將其轉變成一個二元式的遮罩(Binary Mask) • 建立直方圖

  19. 遮罩 • 計算各元素值的機率值,其公式如下: 其中N為元素值的總數,ni為第i個元素值所得的數量,Pi為元素值的機率值。 • 利用一門檻值T將值方圖的機率分布分成兩個部分

  20. 遮罩 • 並計算各部分的機率總和與平均值 T

  21. 遮罩 其中W1與W2各為門檻值T之前、後部分的機率總和,M1與M2各為門檻值T之前、後部分的平均值

  22. 遮罩 • 利用下列的公式,將每個元素值逐步帶入,找出差異值D最大時的T值: • 利用門檻值T將重建訊號G(x , y)轉換成二元式的遮罩M(x , y)

  23. 遮罩 • 進行遮蔽動作來擷取局部訊號S(x , y) • 假設混音的數學表示如下所示 • 對於將混音訊號除以個別訊號則可得到個別訊號在混音當中所佔的比例

  24. 遮罩 • 利用總重建訊號與各自重建訊號進行同位素的相除,找出各混合成分的比例R(x , y) • 再將混合比例與擷取後的局部訊號進行同位素的相乘 , ,

  25. 遮罩 • 進行修正步驟 • 防止負值出現而導致錯誤發生,因此要對所有的負值修改為零 ,

  26. 分離結果 原始音檔(拉都希氏+梭德氏) 利用SNMF2D重建音檔(拉都希氏) 遮罩後的重建音檔(拉都希氏)

More Related