240 likes | 401 Views
淺談音訊壓縮. 程之奇. 大綱. 破壞性壓縮 ( 以 MP3 為例 ) MP3 之特性 為何能壓那麼小? demo 無失真壓縮 ( 以 monkey’s audio 為例 ) 基本概念 demo. 破壞性壓縮 ( 以 MP3 為例 ). MP3 之特性 為何能壓那麼小? demo. 破壞性壓縮. 在可攜性 、 複雜度與品質間取得平衡 日常見到的 VCD, DVD, MP3 都經過破壞性壓縮 大多可同步播放. MP3 之特性. Normally 128Kbps only 約 1/10 的大小 不錯的聲音! 如何做到?. 用這五招把音樂壓小.
E N D
淺談音訊壓縮 程之奇
大綱 • 破壞性壓縮(以MP3為例) • MP3之特性 • 為何能壓那麼小? • demo • 無失真壓縮(以monkey’s audio為例) • 基本概念 • demo
破壞性壓縮(以MP3為例) MP3之特性 為何能壓那麼小? demo
破壞性壓縮 • 在可攜性、複雜度與品質間取得平衡 • 日常見到的VCD, DVD, MP3都經過破壞性壓縮 • 大多可同步播放
MP3之特性 • Normally 128Kbps only • 約1/10的大小 • 不錯的聲音! • 如何做到?
用這五招把音樂壓小 • 最小聽覺門檻 • 遮蔽效應 • 位元儲存槽 • Joint Stereo • Huffman編碼
最小聽覺門檻 • 人耳聽覺的frequency response集中於2KHz~5KHz的音訊 • 利用類似BPF的手法使壓縮後的音訊集中於此頻段,進而減少資料量
最小聽覺門檻 BEFORE AFTER
遮蔽效應 • 由聽覺心理學的模型而來:
遮蔽效應 • 由聽覺心理學的模型而來: 太陽
位元儲存槽 • 可以產生類似VBR的效果: • 波形簡單時用較低的bit rate • 將省下的空間留給波形複雜時用 • 維持整個流量的大小
Joint Stereo • 主要分為Intensity Stereo(IS)和Mid/Side (M/S)stereo兩種 • IS:減少高頻的音場資訊( ex. 鋼琴獨奏 ) • Mid/Side (M/S)stereo:以左右聲道都有收到的訊號為主,對左右不同的訊號加以處理 • 一般MP3兩者交互使用
Huffman Coding • 一種常見的無失真壓縮的方法 • 利用使用機率來編碼 • 實際使用約可節省20%之空間
demo 128kbps (105KB) 原始檔(1.12MB) 96Kbps(78.9KB) 64kbps (52.6KB)
demo 原始檔(1.42MB) 96kbps(99.6KB)
無失真壓縮(以APE為例) 基本原理 demo
基本原理 • APE的壓縮技巧基本上有三大技巧: • Mid/Side Coding • Predictor • Rice Coding
Mid/Side Coding • 像先前提到的Mid/Side Stereo,將訊號分為兩喇叭的mean和difference進行編碼
Predictor • 在時域上的音樂訊號彼此的correlation 都不小 • 我們可以利用adapting的predictor(如adapting Wiener filter)將訊號中可預測的部份取出
Rice Coding • 猜測編碼所需要的位元數 • 沒有overflow的訊號就用這幾個位元編碼 • Overflow的訊號再外加特殊的識別碼表示之
demo 原始檔(1.7MB) 壓縮後(587KB)
結論 • 處理器複雜度 V.S. 音質 • 處理速度 V.S. 音質 • 儲存容量 V.S. 音質 • 影像品質 V.S. 音質 讓我們各取所需吧!