1k likes | 1.12k Views
第 6 章 数字电视基础. 6.1 概述 6.2 信源编码与压缩技术 6.3 信道编码与调制技术. 模拟电视制式的缺陷 . 采用复合信号传输 采用窄带传送色度信号 采用隔行扫描 选用的行场频率低. 6.1 数字电视概念及系统组成. 数字电视的产生: 20 世纪 60 年代 数字电视定义: 从节目拍摄、编辑、制作、播出、传输、接收等电视信号播出和接收的全过程都使用数字技术的电视系统。. 数字电视系统组成.
E N D
第6章 数字电视基础 6.1 概述 6.2 信源编码与压缩技术 6.3 信道编码与调制技术
模拟电视制式的缺陷 • 采用复合信号传输 • 采用窄带传送色度信号 • 采用隔行扫描 • 选用的行场频率低
6.1 数字电视概念及系统组成 • 数字电视的产生:20世纪60年代 • 数字电视定义: 从节目拍摄、编辑、制作、播出、传输、接收等电视信号播出和接收的全过程都使用数字技术的电视系统。
数字电视系统组成 信源编码 复用系统 信道编码 信号调制与传输 数字电视信号接收
数字电视信号的产生 • 脉冲编码调制PCM 信号数字化需要完成采样、量化、编码三步。 • 采样(取样):用每隔一定时间间隔的信号样本序列代替原来在时间上连续的信号。即将模拟信号离散化。
1、采样 • 在数字电视中取样频率的选择应该从以下方面考虑: (1)满足奈奎斯特取样定理:即抽样频率应该大于视频带宽的两倍。 亮度信号带宽 最大是6MHz,因此有: (2)为了保证取样结构是固定正交的,取样频率应该是行频fH的整数倍 (3)在制订国际统一的编码标准时亮度信号的取样频率的选择还必须兼顾不同的扫描制式。
分量编码标准的亮度信号抽样频率fs为13.5 MHz: • 对于625行/50场扫描制式的亮度信号,每行的取样点数为: • 对于525行/60场扫描制式的亮度信号,每行的取样点数为:
2、量化 • 所谓量化就是把幅度连续变化的信号变为幅度离散的数字信号。 • 量化过程不可避免地引起量化误差。 • 由于量化误差会在接收端恢复图象的画面上出现颗粒状的细斑,量化误差又称为颗粒噪声或量化噪声。
取整时只舍不入 取整时有舍有入 量化误差的绝对值最大,误差较小
量化分类: 1、均匀量化:量化间隔相同。 2、非均匀量化: 小信号量化间隔小 大信号量化间隔大
M:量化级数 • n:量化比特数,(码源位数)是指要区分所有量化级所需几位二进制码位数 . M=2n
3、编码 • 定义: 按照一定规律,把量化后的离散值用二进制数字表示。 取样时刻 取样值 量化值 编码 t1 2.9 3 0011 t2 12.6 13 1101 t3 14 14 1110 t4 3.3 3 0011 t5 4.5 5 0101
图像信号的编码方案 • 全信号编码 (Y/C) 电视接收机中的数字化处理 • 分量编码(Y / R-Y、B-Y) 对Y、R-Y、B-Y或三个基色分量R、G、B分别编码,进行并行传输或时分复用传输。
单位时间内系统所能达到的最大数据量称为所传输数字信号的码率。单位时间内系统所能达到的最大数据量称为所传输数字信号的码率。 • 总码率:抽样频率与量化比特数的积 。 4:2:2分量编码总码率: 标清: (13.5+2×6.75)×8(或10)=216(或270)Mb/s 高清: (74.25+2×37.125)×10=1485 Mb/s
有效码率: • 单位时间内与视频信号有关的数据量。 • 每行取样点×有效扫描行数×量化比特数×帧频
CCIR的分量编码国际标准图像采样 1、使用相同的采样频率对图像的亮度信号和色差信号进行采样; 2、对亮度信号和色差信号分别采用不同的采样频率进行采样。 如果对色差信号使用的采样频率比对亮度信号使用的采样频率低,这种采样就称为图像子采样(subsampling)。
4:4:4 YCbCr格式 在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本 4:4:4子采样格式
4:4:4 YCbCr格式 • 表示全像素点阵,用于高质量视频应用、演播室以及专业视频产品。 • YUV三个信道的抽样率相同,因此在生成的图像里,每个象素的三个分量信息完整。(每个分量通常8比特 )
4:2:2 YCbCr格式 是DVD、数字电视、HDTV 以及其它消费类视频设备的最常用格式。 在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本
4:2:2 YCbCr格式 • 每个色差信道的抽样率是亮度信道的一半,所以水平方向的色度抽样率只是4:4:4的一半。 下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3] 存放的码流为: Y0 U0 Y1 V1 Y2 U2 Y3 V3 映射出像素点为: [Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]
数字电视扫描制式表示方法 • 1080/50i 720/60P • 1080/50/2:1 • 1125/60i 750@60P • 1080i/50
6.2 信源编码与压缩技术 一、信源压缩编码的目的: 压缩数字电视图像的数据量,降低信号传输的数码率,减少传输带宽,提高信道利用率。
二、如何进行压缩 消除电视信号中的冗余成分: ① 空间冗余:相邻象素、行变化小 ② 时间冗余:相邻帧变化小 ③ 符号冗余:编码表示码长不同 ④视觉冗余:视觉阈值不同
三、视频压缩编码的分类 1、无损压缩编码(熵编码) 霍夫曼编码 算术编码 2、有损压缩编码(熵压缩) 预测编码 正交变换编码
m 符号xi出现的概率p(xi) 1、熵编码 • 熵:描述信源符号信息所需的最小比特数。 • 信息熵:信源X发出任意一个符号的平均信息量,单位:比特/符号 • 编码过程中不丢失信息量,即要求保存信息熵,也叫信息保持编码,是根据消息出现概率的分布特性而进行的,是无损压缩编码。
霍夫曼(Huffman)编码 • 霍夫曼编码是可变字长编码(VLC)的一种。 • 定理:在变字长编码中,如果码字长度严格按照对应符号出现的概率大小逆序排列,则其平均码字长度最小。
霍夫曼(Huffman)编码步骤 • 按出现的概率大小排队,把两个最小的概率相加,作为新的概率 和剩余的概率重新排队。 • 继续第一步,直到最后变成1。 • 将“0”和“1”赋与相加的两个概率。 • 读出时由该符号开始一直走到最后的“1”, 将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的霍夫曼编码。
例 一 a为出现的概率
例 二 a为出现的概率
1 0.62 码 长 信源符号 出现概率 码 字 0.38 0 1.0 1 0.33 0 0.29 1 2 0 1 a1 0.20 2 0 0 a2 0.18 0 1 3 1 1 1 a3 0.17 3 1 1 0 a4 0.16 0 1 3 1 0 1 a5 0.15 1 4 1 0 0 1 a6 0.10 0 0.14 0 4 1 0 0 0 a7 0.04
Ki m 7 =2.61bit/符号 • 平均码字长度 K= 0.2×2+0.19×2+0.18×3+0.17×3+0.15×3+0.1×4+0.01×4=2.72 bit/符号 • 信息熵H为:
注意事项 (1)Huffman方法的构造出来的码不是唯一的。但对于同一信源而言,其平均码长是相同的,其编码效率一样。 (2)只有当信源概率分布很不均匀的时,Huffman码才会收到显著效果。 (3)信源符号概率分布为2-n时,编码效果达到100%
算术编码 • 算术编码不是按符号编码,而是按符号序列的发展,对序列进行编码。 • 步骤: • 初始状态,编码指针C=0,子区间长度L=1.0 • 编码状态,C=C+LΣpi; L=Lpi • 取最后一个编码指针小数值作为整个序列的编码结果。
例 • 设有一个信源具有4个可能出现的信号:x1、x2、x3、x4 ,其出现的概率分别为0.5、0.25、0.125、0.125,信源符号序列为x2 x3 x1 x4 x1 x1,解释其编码过程。 0 0.1 0.11 0.111 1
解得符号序列算术编码为101100111,继续对符号x1 x1进行编码,着编码码字不变,码长不变。
2、 预测编码 • 在图像预测编码中, 根据图像或信息所存在的相关性,推测未来图像或象素的可能值, 减小空间和时间冗余 。 • 一维预测 • 二维预测 • 三维预测 帧内编码 帧间编码
二维预测:X9=1/2X8+1/4 X4+1/8 X3+1/8X5 X1 X2 X3 X4 X5 前一行 隔场行 X6 X7 X8 X9 当前行
帧内编码:对一帧内的信息进行编码。 • 帧 间编码:对相邻的时间帧间的差值信号进行编码。 • JPEG是典型的帧内编码方案大多用于静止图像处理,而MPEG是帧间编码方法,主要用于对运 动图像的处理。
预测编码的原理 • 利用图像数据的相关性,用已传输的像素值对当前像素值进行预测,然后对当前像素的实际值与预测值的差值进行编码传输,在接收端将收到的预测误差解码后再与预测值相加,得到当前像素值。
待编码取样序列 预测值 差分脉冲编码调制(DPCM) X’’ X’’
运动补偿预测编码 • 在视频帧序列中设置参照帧。 • 对于当前的编码帧,首先在该帧的前一帧和(或)后一帧中寻找与该帧的一个图像方块最优匹配的图像方块。 • 如果找到这样的最优匹配块,则计算: • 当前块的像素值与参照帧中最优匹配块的像素值之间的差值,即预测误差; • 当前块相对于参照块在X和Y两个方向上的位移,即运动矢量。 • 只需对当前块的运动矢量和预测误差进行编码传输,以压缩时间冗余。 • 如果找不到最优匹配块,则进行帧内编码。
运动补偿预测编码类型 单向运动补偿预测 双向运动补偿预测:使用前后两帧计算各块的运动矢量,只选用具有最小匹配误差的相关运动矢量。 插值运动补偿预测:取前后两帧的预测值的平均值,需要对两个运动矢量分别进行编码传输。
运动估值 • 像素递归法(PRA) • 块匹配法(BMA)
B dm C N+2dm A dm dm dm 全搜索匹配 最大计算量 (N+2dm)*(N+2dm) N=8或16
三步搜索法 • 以原点为中心,以L1=ent(d/2+0.5)为步长构造9点点阵。(d:最大位移,ent:取整)。 • 计算各点的误差值,找出误差最小的点,以此为中心,构造新的以ent(L1/2+0.5)为步长的9点点阵。 • 重复第2步,直到搜索步长为1,则误差值最小的点为匹配点。
-7 0 7 三步搜索法 -7 7 0
3、变换编码压缩数据的原理 • 图像空间存在相关性,在变换域中,各空间频率分量是不均匀的,即空间频率低的区域信号幅度大,高频区域信号幅度小。低频部分细量化,高频部分粗量化,则平均码长和总的码率都会下降,达到压缩码率的目的。
3、变换编码过程 将图像中的像素按区域分成一些包括M×N个像素的许多方块。这些像素点的取样值构成一空间(设为X,Y二维)的数字阵列,然后将它们变换到由正交矢量构成的变换域中,再对这些变换域中的阵列系数进行编码发送,接收端通过逆变换恢复原数据。
DCT系数中绝对值较大的集中在矩阵的左上角。 将一些绝对值很小的系数或区块置零便于丢弃 将整幅图像分解出数个用于DCT的子块 串/并转换舍去零系数 传输或存储 图像子块重建 整幅图像重建 量化矩阵复原 恢复DCT系数 离散余弦变换(DCT)编码压缩方框图
DCT IDCT 其中: