600 likes | 745 Views
语音信号的压缩编码是研究如何降低语音信号编码速率的问题。. 第三章语音信号的压缩编码. 以语音信号为例,模拟形式下带宽一般不到 4KHz ,经过调制后,所需传输带宽不会超过 8KHz 。. 一 . 压缩编码原因. 但是以 8KHz 抽样,并且每个样值用 8 位二进制代码表示时,即采用 A 率 13 折线 PCM 数字语音信号时,信息速率为 64Kbit/s 。. 频带利用率 = 传输速率 / 带宽. 利用二进制理想基带传输系统传输一路这样的数字语音信号。所占系统的最小频带宽度为 32KHz 。. 二 . 什么是语音压缩编码?.
E N D
语音信号的压缩编码是研究如何降低语音信号编码速率的问题。语音信号的压缩编码是研究如何降低语音信号编码速率的问题。 第三章语音信号的压缩编码 以语音信号为例,模拟形式下带宽一般不到4KHz,经过调制后,所需传输带宽不会超过8KHz。 一.压缩编码原因
但是以8KHz抽样,并且每个样值用8位二进制代码表示时,即采用A率13折线PCM数字语音信号时,信息速率为64Kbit/s。但是以8KHz抽样,并且每个样值用8位二进制代码表示时,即采用A率13折线PCM数字语音信号时,信息速率为64Kbit/s。 频带利用率=传输速率/带宽 利用二进制理想基带传输系统传输一路这样的数字语音信号。所占系统的最小频带宽度为32KHz。
二.什么是语音压缩编码? 把数码率低于64Kbit/s的语音编码方法称为语音压缩编码技术
三.语音编码分类 波形编码 根据编码器的实现机理,分成三大类 参数编码 混合编码
从语音信号的波形出发,对波形的抽样值、预测值、预测误差进行编码,它以重建语音波形为目的,力图使重建波形接近原信号波形。从语音信号的波形出发,对波形的抽样值、预测值、预测误差进行编码,它以重建语音波形为目的,力图使重建波形接近原信号波形。 1、波形编码 特点:利用抽样定理,恢复原始信号的波形
缺点:编码速率较高 优点:适应能力强,重建语音质量好 速率通常在16------64kbit/s范围 类型:PCM, 自适应增量调制 (ADM), 自适应差分编码调制(ADPCM), 自适应预测编码APC
提取语音的一些特征信息进行编码,在收端利用这些特征参数合成语音。提取语音的一些特征信息进行编码,在收端利用这些特征参数合成语音。 • 2.参数编码 • 优点:编码速率低。 速率通常是在4.8kbit/s以下 • 缺点:语音的音质和自然度较差,很难辨别说话人。(有一定的可懂度) • 类型:LPC线性预测编码
波形编码+参数编码 3.混合编码 • 介于波形编码和参数编码的一种编码。即在参数编码的基础上引入了波形编码的一些特征。 可在4----16kbit/s范围内达到良好的语音质量 类型:子带编码
3.1自适应差值脉冲编码调制原理(ADPCM) • 3.1.1差值脉冲编码(DPCM) • 1.编码思想 减小量化误差 提高通信质量 必须 减小量化级 当抽样值范围确定时 增加编码 位数N
在编码位数固定时,减小抽样值的变化范围,也同样可以提高信噪比在编码位数固定时,减小抽样值的变化范围,也同样可以提高信噪比 • 增加编码位数可获得大的信噪比 即:若缩小抽样值(被编码信号)的变化范围,就可以在保证信噪比不变的情况下,减小编码的位数。这就是差值编码的中心思想
在原来的抽样值中减去某一个值,然后对两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出原始值。在原来的抽样值中减去某一个值,然后对两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出原始值。 二、差值编码模型图
编码 + + x(n)+d(n)c(n)d(n)x(n) - x(n)x(n) 差值编码模型 译码
图中:x(n)是原始样值(n时刻的抽样值) x(n)为减去量 d(n)=x(n)-x(n) 为差值 可以看出: (1)、d(n)越小,在相同的编码位数时信噪比越大 (2)、收发端必须有相同的减去量x(n)
根据前些时刻的样值来预测现时刻的样值,只要传递预测值和实际值之差,而不需要每个样值的编码都传。这种方法就称为DPCM编码。根据前些时刻的样值来预测现时刻的样值,只要传递预测值和实际值之差,而不需要每个样值的编码都传。这种方法就称为DPCM编码。 1、DPCM系统的概念: • 三、DPCM系统
举例来说,设以1/Ts的速率对信号S(t)抽样,在 时刻前可得到 ,, 等一组样值.以前面N个样值作为基础对 的预测值是
不同时刻样值的加权系数: 根据相关性情况,可设 为常量或变量
N阶预测器输出: 在每个抽样时刻到来时,滤波器输出将会给出下一个样值的预测值。 一般来说,在抽样时刻 t=nTs 时所得的预测值 与真正的样值 并不相同。
差值脉冲编码就是对真正的样值 与过去的样值为基础得到的估值 之间的差值进行量化和编码。
3、DPCM系统模型框图 量化器 预测器 预测器 下张 22
4、DPCM系统的抗噪声性能分析 x(n)=x(n)+d(n) • d(n)=x(n)-x(n) 该系统的量化误差可以表示为: e(n)=x(n)-x(n) =[d(n)+x(n)]-[x(n)+d(n)] =d(n)-d(n) • 上式表明:DPCM系统的传输误差就是差值d(n)的量化误差. 图
系统信噪比定义为: • SNR= = 预测器增益 = 量化器的量化信噪比 GP<1 GP>1 预测器有增益 加预测器后反而不利
GP : DPCM系统相对于PCM系统而言的信噪比增益。 量化器产生的信噪比 即非预测的PCM系统的量化信噪比
提高系统信噪比采取的措施 • SNR= 减小
d(n)=x(n)-x(n) d(n) x(n)精确 最佳预测 量化误差 最佳量化
小结 • 一.压缩编码的原因 • 二.什么是语音压缩编码 • 三.语音编码分类 • 3.1ADPCM系统 • 3.3.1DPCM • 一.差值编码思想 • 二.差值编码系统模型图 • 三.DPCM系统 • 1.概念2.预测器模型图3.DPCM系统模型4.DPCM系统的抗噪声性能分析
3.1自适应差值脉冲编码调制(ADPCM) 1、实质:DPCM+自适应量化和自适应预测 固定预测 固定量化 能够实现自适应预测功能,或者自适应量化功能或者同时实现两种自适应功能的DPCM系统称为ADPCM系统。 2、定义
3.设计的目的 • ADPCM充分利用了语音波形的统计特征和人耳听觉特性,其设计思路主要瞄准了两个目标: a: 尽可能去掉语音信号中的冗余信号 b:以有效的方式将可用比特分配给语音信号 对消除冗余后的信号,从自适应角度进行最佳编码
1.1预测的自适应 1.预测器的结构 (1).极点预测器 (用重建信号x(n)进行的预测) a:极点预测器的DPCM方框图 X(n) d(n) d(n) 编码 量化器 + X(n) 预测器 + X(n) P(Z) X(n)
b:预测器传递函数P(z) N阶预测器公式: X(n)=
进行Z变换后得: 则预测器的传递函数为: 为预测系数
H(Z) c:重建滤波器 x(n) 重建滤波器 d(n) + X(n) 预测器 x(n)
2 2 =E [x(n)]+E[x(n-1)]-2E[x(n)x(n-1)] 2 =2E [x(n)]-2E[x(n)x(n-1)] = 分析: = =
2 2 =E [x(n)]+h1E[x(n-1)]-2h1E[x(n)x(n-1)] 2 2 (2)一阶最佳线性预测 求最佳预测系数h1 + N=1时; X(n)= h1x(n-1) d(n)=x(n)-h1x(n-1) 则差值信号为: E[d (n)]= 2 2 =E{[x(n)- h1x(n-1)] } 2 = - = 求使 最小的h1的值
令 得最佳预测系数h1opt=p1 当N=1时的最大预测增益为:
2 2 =E[d (n)] =E{[x(n)- h1x(n-1)-h2(n-2)] } b.二阶线性预测(N=2) d(n)=x(n)-h1x(n-1)-h2x(n-2) 令 得最佳h1,h2
大于或者等于零 故二阶预测器总是优于一阶预测器
2 =E[d (k)] C:N阶最佳线性预测 求偏微分,并令为零
2.自适应预测 • 1)前向自适应预测算法 根据短时间的相关特性R(i),求短时的最佳预测系数 特点:运算量大,延迟时间大,不能用于高速系统。
2)后向序贯自适应预测算法 采用不断修正预测系数{hi(n)}的方法来减小瞬时平方差E[d(n)],使{hi(n)}逐步的接近{hiopt(n)}. 2
①LMS算法(最小均方算法) 梯度系数,它决定了预测系数自适应速率
②梯度符号算法 极点预测器 衰减因子(抗误码因子) 零点预测器
固定量化器+可变增益放大器 1.2量化的自适应 1、最佳量化 ①分层电平为相邻量化电平的中点 ②量化电平是该量化间隔内经常出现的瞬时电平值
2、自适应量化的基本思想 • 自适应量化的基本思想是使量化器的量化级(阶距)能够随着输入信号d(n)瞬时值得变化作自适应调整,从而使量化误差的均方值最小。 即:自适应量化指量化台阶随信号变化而变化,使量化误差减小
3、实现方法 ①前向自适应量化(AQF) 优点:量化误差小,信噪比大 缺点:量阶的信息要与话音信号一起送到收端译码器,否则,收端无法知道该时刻的量阶值