语音信号的压缩编码是研究如何降低语音信号编码速率的问题。
Download
1 / 60

???????????? - PowerPoint PPT Presentation


  • 110 Views
  • Uploaded on

语音信号的压缩编码是研究如何降低语音信号编码速率的问题。. 第三章语音信号的压缩编码. 以语音信号为例,模拟形式下带宽一般不到 4KHz ,经过调制后,所需传输带宽不会超过 8KHz 。. 一 . 压缩编码原因. 但是以 8KHz 抽样,并且每个样值用 8 位二进制代码表示时,即采用 A 率 13 折线 PCM 数字语音信号时,信息速率为 64Kbit/s 。. 频带利用率 = 传输速率 / 带宽. 利用二进制理想基带传输系统传输一路这样的数字语音信号。所占系统的最小频带宽度为 32KHz 。. 二 . 什么是语音压缩编码?.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about '????????????' - pomona


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
3284750

语音信号的压缩编码是研究如何降低语音信号编码速率的问题。语音信号的压缩编码是研究如何降低语音信号编码速率的问题。

第三章语音信号的压缩编码

以语音信号为例,模拟形式下带宽一般不到4KHz,经过调制后,所需传输带宽不会超过8KHz。

一.压缩编码原因


3284750

但是以语音信号的压缩编码是研究如何降低语音信号编码速率的问题。8KHz抽样,并且每个样值用8位二进制代码表示时,即采用A率13折线PCM数字语音信号时,信息速率为64Kbit/s。

频带利用率=传输速率/带宽

利用二进制理想基带传输系统传输一路这样的数字语音信号。所占系统的最小频带宽度为32KHz。


3284750

  • 语音信号的压缩编码是研究如何降低语音信号编码速率的问题。.什么是语音压缩编码?

把数码率低于64Kbit/s的语音编码方法称为语音压缩编码技术


3284750
语音信号的压缩编码是研究如何降低语音信号编码速率的问题。.语音编码分类

波形编码

根据编码器的实现机理,分成三大类

参数编码

混合编码


3284750

从语音信号的波形出发,对波形的抽样值、预测值、预测误差进行编码,它以重建语音波形为目的,力图使重建波形接近原信号波形。从语音信号的波形出发,对波形的抽样值、预测值、预测误差进行编码,它以重建语音波形为目的,力图使重建波形接近原信号波形。

1、波形编码

特点:利用抽样定理,恢复原始信号的波形


3284750

缺点:从语音信号的波形出发,对波形的抽样值、预测值、预测误差进行编码,它以重建语音波形为目的,力图使重建波形接近原信号波形。编码速率较高

优点:适应能力强,重建语音质量好

速率通常在16------64kbit/s范围

类型:PCM,

自适应增量调制 (ADM),

自适应差分编码调制(ADPCM),

自适应预测编码APC


3284750

提取语音的一些特征信息进行编码,在收端利用这些特征参数合成语音。提取语音的一些特征信息进行编码,在收端利用这些特征参数合成语音。

  • 2.参数编码

  • 优点:编码速率低。

速率通常是在4.8kbit/s以下

  • 缺点:语音的音质和自然度较差,很难辨别说话人。(有一定的可懂度)

  • 类型:LPC线性预测编码


3284750

波形编码提取语音的一些特征信息进行编码,在收端利用这些特征参数合成语音。+参数编码

3.混合编码

  • 介于波形编码和参数编码的一种编码。即在参数编码的基础上引入了波形编码的一些特征。

可在4----16kbit/s范围内达到良好的语音质量

类型:子带编码


3 1 adpcm
3.1提取语音的一些特征信息进行编码,在收端利用这些特征参数合成语音。自适应差值脉冲编码调制原理(ADPCM)

  • 3.1.1差值脉冲编码(DPCM)

  • 1.编码思想

减小量化误差

提高通信质量

必须

减小量化级

当抽样值范围确定时

增加编码

位数N


3284750

在编码位数固定时,减小抽样值的变化范围,也同样可以提高信噪比在编码位数固定时,减小抽样值的变化范围,也同样可以提高信噪比

  • 增加编码位数可获得大的信噪比

即:若缩小抽样值(被编码信号)的变化范围,就可以在保证信噪比不变的情况下,减小编码的位数。这就是差值编码的中心思想


3284750

在原来的抽样值中减去某一个值,然后对两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出原始值。在原来的抽样值中减去某一个值,然后对两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出原始值。

二、差值编码模型图


3284750

编码在原来的抽样值中减去某一个值,然后对两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出原始值。

+

+

x(n)+d(n)c(n)d(n)x(n)

-

x(n)x(n)

差值编码模型

译码


3284750

图中:在原来的抽样值中减去某一个值,然后对两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出原始值。x(n)是原始样值(n时刻的抽样值)

x(n)为减去量

d(n)=x(n)-x(n) 为差值

可以看出:

(1)、d(n)越小,在相同的编码位数时信噪比越大

(2)、收发端必须有相同的减去量x(n)


3284750
根据前些时刻的样值来预测现时刻的样值,只要传递预测值和实际值之差,而不需要每个样值的编码都传。这种方法就称为根据前些时刻的样值来预测现时刻的样值,只要传递预测值和实际值之差,而不需要每个样值的编码都传。这种方法就称为DPCM编码。

1、DPCM系统的概念:

  • 三、DPCM系统


3284750

  • 举例来说根据前些时刻的样值来预测现时刻的样值,只要传递预测值和实际值之差,而不需要每个样值的编码都传。这种方法就称为,设以1/Ts的速率对信号S(t)抽样,在 时刻前可得到 ,, 等一组样值.以前面N个样值作为基础对 的预测值是


3284750

不同时刻样值的加权系数根据前些时刻的样值来预测现时刻的样值,只要传递预测值和实际值之差,而不需要每个样值的编码都传。这种方法就称为:

根据相关性情况,可设 为常量或变量


3284750
2根据前些时刻的样值来预测现时刻的样值,只要传递预测值和实际值之差,而不需要每个样值的编码都传。这种方法就称为、实现预测的横向滤波器(N阶预测器)


3284750

N根据前些时刻的样值来预测现时刻的样值,只要传递预测值和实际值之差,而不需要每个样值的编码都传。这种方法就称为阶预测器输出:

在每个抽样时刻到来时,滤波器输出将会给出下一个样值的预测值。

一般来说,在抽样时刻 t=nTs 时所得的预测值 与真正的样值 并不相同。


3284750

差值脉冲编码就是对真正的样值 与过去的样值为基础得到的估值 之间的差值进行量化和编码。


3 dpcm
3 与过去的样值为基础得到的估值 之间的差值进行量化和编码。、DPCM系统模型框图

量化器

预测器

预测器

下张

22


3284750

图中: 与过去的样值为基础得到的估值 之间的差值进行量化和编码。x(n)为抽样信号的实际值


4 dpcm
4 与过去的样值为基础得到的估值 之间的差值进行量化和编码。、DPCM系统的抗噪声性能分析

x(n)=x(n)+d(n)

  • d(n)=x(n)-x(n)

该系统的量化误差可以表示为:

e(n)=x(n)-x(n)

=[d(n)+x(n)]-[x(n)+d(n)]

=d(n)-d(n)

  • 上式表明:DPCM系统的传输误差就是差值d(n)的量化误差.


3284750

系统信噪比定义为: 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

  • SNR=

=

预测器增益

=

量化器的量化信噪比

GP<1

GP>1

预测器有增益

加预测器后反而不利


3284750

G 与过去的样值为基础得到的估值 之间的差值进行量化和编码。P : DPCM系统相对于PCM系统而言的信噪比增益。

量化器产生的信噪比

即非预测的PCM系统的量化信噪比


3284750

提高系统信噪比采取的措施 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

  • SNR=

减小


3284750

d(n)=x(n)-x(n) 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

d(n)

x(n)精确

最佳预测

量化误差

最佳量化


3284750
小结 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

  • 一.压缩编码的原因

  • 二.什么是语音压缩编码

  • 三.语音编码分类

  • 3.1ADPCM系统

  • 3.3.1DPCM

  • 一.差值编码思想

  • 二.差值编码系统模型图

  • 三.DPCM系统

  • 1.概念2.预测器模型图3.DPCM系统模型4.DPCM系统的抗噪声性能分析


3 1 adpcm1
3.1 与过去的样值为基础得到的估值 之间的差值进行量化和编码。自适应差值脉冲编码调制(ADPCM)

1、实质:DPCM+自适应量化和自适应预测

固定预测 固定量化

能够实现自适应预测功能,或者自适应量化功能或者同时实现两种自适应功能的DPCM系统称为ADPCM系统。

2、定义


3284750
3. 与过去的样值为基础得到的估值 之间的差值进行量化和编码。设计的目的

  • ADPCM充分利用了语音波形的统计特征和人耳听觉特性,其设计思路主要瞄准了两个目标:

a: 尽可能去掉语音信号中的冗余信号

b:以有效的方式将可用比特分配给语音信号

对消除冗余后的信号,从自适应角度进行最佳编码


3284750
1.1 与过去的样值为基础得到的估值 之间的差值进行量化和编码。预测的自适应

1.预测器的结构

(1).极点预测器

(用重建信号x(n)进行的预测)

a:极点预测器的DPCM方框图

X(n)

d(n)

d(n)

编码

量化器

+

X(n)

预测器

+

X(n)

P(Z)

X(n)


B p z
b: 与过去的样值为基础得到的估值 之间的差值进行量化和编码。预测器传递函数P(z)

N阶预测器公式:

X(n)=


3284750

进行 与过去的样值为基础得到的估值 之间的差值进行量化和编码。Z变换后得:

则预测器的传递函数为:

为预测系数


3284750

H(Z) 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

c:重建滤波器

x(n)

重建滤波器

d(n)

+

X(n)

预测器

x(n)


3284750

2 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

2

=E [x(n)]+E[x(n-1)]-2E[x(n)x(n-1)]

2

=2E [x(n)]-2E[x(n)x(n-1)]

=

分析:

=

=


3284750

2 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

2

=E [x(n)]+h1E[x(n-1)]-2h1E[x(n)x(n-1)]

2

2

(2)一阶最佳线性预测

求最佳预测系数h1

+

N=1时;

X(n)=

h1x(n-1)

d(n)=x(n)-h1x(n-1)

则差值信号为:

E[d (n)]=

2

2

=E{[x(n)- h1x(n-1)] }

2

=

-

=

求使

最小的h1的值


3284750

与过去的样值为基础得到的估值 之间的差值进行量化和编码。

得最佳预测系数h1opt=p1

当N=1时的最大预测增益为:


B n 2

2 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

2

=E[d (n)]

=E{[x(n)- h1x(n-1)-h2(n-2)] }

b.二阶线性预测(N=2)

d(n)=x(n)-h1x(n-1)-h2x(n-2)

得最佳h1,h2


3284750

大于或者等于零 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

故二阶预测器总是优于一阶预测器


3284750

2 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

=E[d (k)]

C:N阶最佳线性预测

求偏微分,并令为零


3284750
所以得到一组线性方程 与过去的样值为基础得到的估值 之间的差值进行量化和编码。


3284750

差值信号在 与过去的样值为基础得到的估值 之间的差值进行量化和编码。预测系数取最佳值时最小


3284750
最佳预测增益 与过去的样值为基础得到的估值 之间的差值进行量化和编码。


3284750
2. 与过去的样值为基础得到的估值 之间的差值进行量化和编码。自适应预测

  • 1)前向自适应预测算法

根据短时间的相关特性R(i),求短时的最佳预测系数

特点:运算量大,延迟时间大,不能用于高速系统。


3284750
2 与过去的样值为基础得到的估值 之间的差值进行量化和编码。)后向序贯自适应预测算法

采用不断修正预测系数{hi(n)}的方法来减小瞬时平方差E[d(n)],使{hi(n)}逐步的接近{hiopt(n)}.

2


3284750
与过去的样值为基础得到的估值 之间的差值进行量化和编码。LMS算法(最小均方算法)

梯度系数,它决定了预测系数自适应速率


3284750
与过去的样值为基础得到的估值 之间的差值进行量化和编码。梯度符号算法

极点预测器

衰减因子(抗误码因子)

零点预测器


3284750

固定量化器 与过去的样值为基础得到的估值 之间的差值进行量化和编码。+可变增益放大器

1.2量化的自适应

1、最佳量化

①分层电平为相邻量化电平的中点

②量化电平是该量化间隔内经常出现的瞬时电平值


3284750
2 与过去的样值为基础得到的估值 之间的差值进行量化和编码。、自适应量化的基本思想

  • 自适应量化的基本思想是使量化器的量化级(阶距)能够随着输入信号d(n)瞬时值得变化作自适应调整,从而使量化误差的均方值最小。

即:自适应量化指量化台阶随信号变化而变化,使量化误差减小


3284750
3 与过去的样值为基础得到的估值 之间的差值进行量化和编码。、实现方法

①前向自适应量化(AQF)

优点:量化误差小,信噪比大

缺点:量阶的信息要与话音信号一起送到收端译码器,否则,收端无法知道该时刻的量阶值


3284750
与过去的样值为基础得到的估值 之间的差值进行量化和编码。后向自适应量化(AQB)

  • 优点:接收端不需要量阶的信息,因为量阶的信息可以从接收码中提取,码速率低,实现容易。

缺点:因为量化误差影响量化值得准确度,即信噪比下降,但影响较小。


Jayant
Jayant 与过去的样值为基础得到的估值 之间的差值进行量化和编码。提出的后向自适应算法:

本次量化间隔=前一次量化间隔×量化调整因子

M| [I(n-1)] |-------量化间隔调整因子


3284750

  • 不同量化电平 与过去的样值为基础得到的估值 之间的差值进行量化和编码。L时DPCM量化器的M值见下表


3284750
上式算法在有传输误码情况下 与过去的样值为基础得到的估值 之间的差值进行量化和编码。,会产生误码扩散问题,因此采用修正式:

-----------------抗误码因子


3284750
两边取对数得: 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

为量化器的定标因子

分为快速定标因子(语音)

慢速定标因子(数据)


3284750
动态锁定 与过去的样值为基础得到的估值 之间的差值进行量化和编码。DLQ(双模式自适应量化器)

自适应速度控制参数

对语音信号:

对数据信号:


3284750

y 与过去的样值为基础得到的估值 之间的差值进行量化和编码。u(n)运算

线性组合

低通滤波器

比较器

短时

平均

线性

非线性滤波

长时

平均

y(n)去自适应量化器

yl(n)

d(n)


32kb sadpcm
32kb/sADPCM 与过去的样值为基础得到的估值 之间的差值进行量化和编码。编译码系统

Ccittg.721建议提出了能和已有的PCM数字电话网兼容的32kb/sADPCM算法。该算法主要技术指标如下:

(1)语音信号经过ADPCM编码后,客观测量SNR应完全符合PCM系统的指标要求,主观听觉测试性能非常接近于PCM质量。

(2)经过四次音频转接后,主观语音测试质量良好,主观平均分(MOS)大于3.5以上。

(3)在信道误码低于0.001的情况下能稳定工作


3284750
作业题 与过去的样值为基础得到的估值 之间的差值进行量化和编码。

1、已知一阶固定的DPCM系统,其预测系数h1=1,归一化系数p1定义为:

其中 为相关系数,求该系统的预测增益Gp。

2、上题中若取一阶预测系数h1=h1opt,试求Gpopt


3284750

2 与过去的样值为基础得到的估值 之间的差值进行量化和编码。、已知输入信号的功率 ,相关系数R(1),R(2),求二阶固定极点预测器DPCM系统的最大预测增益Gpopt


ad