200 likes | 386 Views
一、 音频编码基础和标准. 低码率、短延时、高质量 3.1 频编码基础 信号的冗余:编码本身包含全部可能,及全部声音。但结合语音的特点,听觉特点;在编码时可以剔除一些不必要的,简化一些常见的,对语音信号进行压缩。(根据语音的特点去编码,能简洁些有效些). 幅度的非均匀分布: 小幅度样本概率高 人耳的特性 CCITT A 律( 13:8 ) CCITT m 律( 14:8 ) m 律 将对数曲线化成八段直线,便于计算; 100 <= m<=500 A 律前一段为直线, 将 后面 对数曲线化成七段直线,便于计算; A=87.56. ( 1 ) 时域信息的冗余度.
E N D
一、音频编码基础和标准 • 低码率、短延时、高质量 • 3.1频编码基础 • 信号的冗余:编码本身包含全部可能,及全部声音。但结合语音的特点,听觉特点;在编码时可以剔除一些不必要的,简化一些常见的,对语音信号进行压缩。(根据语音的特点去编码,能简洁些有效些)
幅度的非均匀分布: • 小幅度样本概率高 • 人耳的特性 CCITT A律(13:8) CCITT m律(14:8) m律将对数曲线化成八段直线,便于计算;100<=m<=500 A律前一段为直线,将后面对数曲线化成七段直线,便于计算;A=87.56
l周期之间相关:语音中,特定时间主要频率相关。l周期之间相关:语音中,特定时间主要频率相关。 l基音之间相关:浊音,清音。 l静止系数:停顿,对话。 长时自相关函数:当取样频率为8kHz时相邻取样的长时统计平均相关系数高达0.9。
(2)频率信息的冗余度 l非均匀的长时功率谱密度:非平坦性,高频低,低频高,直流分量非最高. l语音特有的短时功率密度谱:出现某些共振峰频率,整体随频率递减.
(3)人的听觉感知机理 l掩蔽效应:强盖弱 l低频较高频敏感,同样声强时,实际感觉随频率而变 l对相位变化不敏感 结论是:多数情况可以预测,可以计算,可以适应,有规可循.
于是产生许多不同的压缩编码方法,对应有音频编码的分类:于是产生许多不同的压缩编码方法,对应有音频编码的分类:
(1)基于音频数据的统计特性进行编码:最基本的是波形编码,脉冲编码调制PCM(Pule Code Modulation). • 改进的有:增量调制DM,(按极性增加一个量化阶比较),自适应增量调制ADM(再考虑斜率),差值量化DPCM(Differential),自适应量化APCM(Adaptive),和自适应预测编码ADPCM(Adaptive differential)
(2)基于音频的声学参数进行参数编码:进一步降低数据率(2)基于音频的声学参数进行参数编码:进一步降低数据率 • (3)基于人的听觉特性性进行编码:从人的听觉系统出发,利用掩蔽效应,设计心理学模型,从而实现更高效率的数字音频压缩.其中,以MPEG标准中的高频编码和Dolby AC-3最有影响.
3.2音频编码的标准 国际电报电话咨询委员会(CCITT)和国际标准化组织(ISO)建议 • A律 • m律 • (1)G.711(P31) • (2)G.721自适应预测编码ADPCM(Adaptive differential) • (3)G.722 • (4)G.728