一、音频编码基础和标准

一、音频编码基础和标准 • 低码率、短延时、高质量 • 3.1频编码基础 • 信号的冗余：编码本身包含全部可能，及全部声音。但结合语音的特点，听觉特点；在编码时可以剔除一些不必要的，简化一些常见的，对语音信号进行压缩。（根据语音的特点去编码，能简洁些有效些）

幅度的非均匀分布： • 小幅度样本概率高 • 人耳的特性 CCITT A律（13:8） CCITT m律（14:8） m律将对数曲线化成八段直线，便于计算；100<=m<=500 A律前一段为直线，将后面对数曲线化成七段直线，便于计算；A=87.56

（1）时域信息的冗余度

l周期之间相关：语音中，特定时间主要频率相关。l周期之间相关：语音中，特定时间主要频率相关。 l基音之间相关：浊音，清音。 l静止系数：停顿，对话。长时自相关函数：当取样频率为8kHz时相邻取样的长时统计平均相关系数高达0.9。

(2)频率信息的冗余度 l非均匀的长时功率谱密度:非平坦性,高频低,低频高,直流分量非最高. l语音特有的短时功率密度谱:出现某些共振峰频率,整体随频率递减.

(3)人的听觉感知机理 l掩蔽效应:强盖弱 l低频较高频敏感,同样声强时,实际感觉随频率而变 l对相位变化不敏感结论是:多数情况可以预测,可以计算,可以适应,有规可循.

于是产生许多不同的压缩编码方法,对应有音频编码的分类:于是产生许多不同的压缩编码方法,对应有音频编码的分类:

(1)基于音频数据的统计特性进行编码:最基本的是波形编码,脉冲编码调制PCM(Pule Code Modulation). • 改进的有:增量调制DM,(按极性增加一个量化阶比较),自适应增量调制ADM(再考虑斜率),差值量化DPCM(Differential),自适应量化APCM(Adaptive),和自适应预测编码ADPCM(Adaptive differential)

(2)基于音频的声学参数进行参数编码:进一步降低数据率(2)基于音频的声学参数进行参数编码:进一步降低数据率 • (3)基于人的听觉特性性进行编码:从人的听觉系统出发,利用掩蔽效应,设计心理学模型,从而实现更高效率的数字音频压缩.其中,以MPEG标准中的高频编码和Dolby AC-3最有影响.

3.2音频编码的标准 国际电报电话咨询委员会(CCITT)和国际标准化组织(ISO)建议 • A律 • m律 • (1)G.711(P31) • (2)G.721自适应预测编码ADPCM(Adaptive differential) • (3)G.722 • (4)G.728

(5)MPEG:(P34)

(6)AC-3

一、 音频编码基础和标准