1 / 35

数字电视原理与应用

数字电视原理与应用. Principle and Application of Digital Television. 主讲:张文军教授 上海交通大学电子信息工程学院 Email:zhangwenjun@sjtu.edu.cn 2006~2007 学年第一学期. 1. 2. 3. 数字电视概述 电视技术的发展历程 模拟电视原理 数字电视的发展. 数字电视基本原理 视频压缩原理 MPEG-2 视频编码及测量 MPEG-2 音频编码及测量 MPEG-2 系统及其测量 数字调制基础 数字电视的纠错编码原理. 数字电视相关标准 DVB-S 标准及相关测量

tyme
Download Presentation

数字电视原理与应用

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 数字电视原理与应用 Principle and Application of Digital Television 主讲:张文军教授 上海交通大学电子信息工程学院 Email:zhangwenjun@sjtu.edu.cn 2006~2007学年第一学期

  2. 1 2 3 • 数字电视概述 • 电视技术的发展历程 • 模拟电视原理 • 数字电视的发展 • 数字电视基本原理 • 视频压缩原理 • MPEG-2视频编码及测量 • MPEG-2音频编码及测量 • MPEG-2系统及其测量 • 数字调制基础 • 数字电视的纠错编码原理 • 数字电视相关标准 • DVB-S标准及相关测量 • DVB-C标准及相关测量 • OFDM技术 • DVB-T标准及相关测量 • ATSC和ISDB-T标准及其测量 • 我国的数字电视标准 课程安排 MPEG-2音频编码及其测量,class 04

  3. 数字电视基本原理 • 视频压缩原理 ——第5章 • MPEG-2视频编码部分及其测量 ——第4,6,11章 • MPEG-2音频编码及其测量 —第7章 • MPEG-2系统部分及其测量 ——第3,9,10章 • 数字调制基础 ——第12章 • 数字电视中的纠错编码原理 ——补充 MPEG-2音频编码及其测量,class 04

  4. 2.音频编码历史 3.人耳心理声学模型 4.音频编码的基本原理 5.子带编码 6.变换编码 MPEG-2音频编码及其测量 1.数字音频源信号 MPEG-2音频编码及其测量,class 04

  5. 1、数字音频源信号 • 人耳动态范围大约140dB,听觉带宽最大20kHz。 • 在模拟音频信号采样数字化之前,要经过低通滤波器进行带限。 • 然后进行模数转换: • 采样分辨率至少16bits • 采样频率: • 32kHz——MPEG标准仍支持,但已经不用 • 44.1kHz——音频CD • 48kHz/96kHz——演播室质量 • 16bit48kHz采样的码率每个信道786kbit/s,立体声信号近似码率为1.5Mbit/s 16 bit A 1.5Mbit/s Up to 768kbit/s D Right 15~20kHz BW Compression 32/44.1/48kHz 音频采样频率 16 bit A Up to 768kbit/s D 100~400kbit/s Left 15~20kHz BW 32/44.1/48kHz 音频采样频率 图7.1 数字音频源信号 MPEG-2音频编码及其测量,class 04

  6. 1、数字音频源信号 • 音频压缩的目标是将1.5Mbit/s码率降低到100~400kbit/s • MP3音频文件通常码率为32kbit/s • 与视频压缩相似,音频压缩也有两种方式: • 冗余度消除——省略多余信息,无损 • 不相关性消除——省去接收端(人耳)不能察觉的信息,有损 • 所有音频压缩方法基于心理声学模型,利用人耳的不足,消除音频信号中的不相关信息。 • 人耳不能察觉频域和时域中强声音脉冲邻近的声音 • 对人耳而言,某些声音可以掩盖其他低幅度的声音信号。 MPEG-2音频编码及其测量,class 04

  7. 3.人耳心理声学模型 4.音频编码的基本原理 5.子带编码 6.变换编码 MPEG-2音频编码及其测量 1.数字音频源信号 2.音频编码历史 MPEG-2音频编码及其测量,class 04

  8. 2、音频编码历史 • MASCAM • 1988,Institut für Rundfunktechnik(IRT)为DAB(digital audio broadcasting)系统提出 • MUSICAM(masking pattern universal subband integrated coding and multiplexing) • 1989,CCETT,Philips和Matsushita联合提出 • 用于DAB • 上两种都基于子带编码,音频信号分成大量子带,每个子带进行或大或小程度的不相关性消除。 • ASPEC方法 • Fraunhofer Gesellschaft和Thomson提出 • 基于变换编码 • 利用DCT将时域音频信号变换到频域,然后消除不相关性信号分量。 MPEG-2音频编码及其测量,class 04

  9. 2、音频编码历史 • 子带编码的MUSICAM和变换编码的ASPEC都包含在MPEG-1音频压缩标准(1991 ISO/IEC 11172-3)中,分为3层: • Layer I和II——MUSICAM编码 • Layer III(MP3音频文件)——ASPEC编码 • MP3不是MPEG-3,MPEG-3起初为实现HDTV,但HDTV后来集成到MPEG-2,所以MPEG-3不存在。 • MPEG-2音频(1994 ISO/IEC 13818-3)在MPEG-1基础上又增加了layer II MC(multichannel) MPEG-2音频编码及其测量,class 04

  10. 子带编码 声道 ISO/IEC 11172-3 MPEG1音频,1990/91 Layer I,低复杂度,低压缩比 Layer II,中复杂度 DCT变换编码 Layer III,高复杂度,高压缩,子带和变换编码,mp3 ISO/IEC 13818-3 MPEG2音频,1994 Layer I,II,III与MPEG-1相同 Layer II,MC(5.1声道) 2、音频编码历史 MASCAM IRT Munich,1988 MUSICAM IRT,CCETT,Philips, Matsushita,1989 ASPEC Fraunhofer Gesellschaft, Thomson MPEG-2音频编码及其测量,class 04

  11. 2、音频编码历史 • 美国Dolby实验室提出的Dolby数字音频标准(AC-3) • 1990年提出, • 1991年12月,第一部AC-3音频编码电影“Star Track VI”公映 • 许多电影采用Dolby数字技术。 • 美国数字地面广播ATSC只采用AC-3音频编码。 • 其他一些国家(如澳大利亚)将同时采用MPEG和AC-3音频。 • MPEG和AC-3音频的质量基本没有差别,现代MPEG解码芯片支持两种方法。 • DVD同时支持PCM音频、MPEG音频和AC-3音频编码。 MPEG-2音频编码及其测量,class 04

  12. 2、音频编码历史 • AC-3的应用 • 电影 • ATSC • MPEG-2 TS流 • DVD • AC-3基于MDCT(modified DCT),5.1声道,每声道128kbit/s • MPEG支持新音频编码方法: • MPEG-2 AAC(advanced audio coding) ISO/IEC 13818-7 • MPEG-4 ISO/IEC 14496-3(自然/合成音频对象) • MPEG-7 ISO/IEC 15938 MPEG-2音频编码及其测量,class 04

  13. 2.音频编码历史 4.音频编码的基本原理 5.子带编码 6.变换编码 MPEG-2音频编码及其测量 1.数字音频源信号 3.人耳心理声学模型 MPEG-2音频编码及其测量,class 04

  14. 3、人耳心理声学模型 • 冗余度降低(无损)和不相关性降低(有损)可以将原始声音信号码率降低90%。 • 不相关性降低依赖于人耳的心理声学模型——Zwicker教授 • 知觉编码——人耳不能分辨的声音分量不传输。 • 人耳剖面图,分为三个主要部分:外耳、中耳、内耳。 图7.3 人耳剖面图 MPEG-2音频编码及其测量,class 04

  15. 锤骨 鼓膜 隔膜 内耳 低频接收器 外耳 听觉神经 高频接收器 中耳 耳咽管 3、人耳心理声学模型 • 外耳实现阻抗匹配功能,声音通过空气传输,类似3kHz区域回声递升滤波器。人耳灵敏度最高的范围正是:3kHz~4kHz。 • 耳膜或鼓膜将声波转换为机械振动,通过锤骨、砧骨、镫骨传送到通向感觉内耳的膜状窗。 • 耳膜前后的空气压力必须相同,这由耳膜后面的咽鼓管来保证,咽鼓管使得该区域与咽部相连通。当我们到很高的高度时,耳内会有很大压力,通过吞咽动作,咽鼓管内的黏膜可以补偿压力。 图7.3 人耳剖面图 图7.4 人耳的技术模型 MPEG-2音频编码及其测量,class 04

  16. 锤骨 鼓膜 隔膜 内耳 低频接收器 外耳 听觉神经 高频接收器 中耳 耳咽管 3、人耳心理声学模型 • 内耳有平衡器官,由几个充满液体的弓形和耳蜗构成。 • 耳蜗是真正的听觉器官,直接听到声音。如果展开耳蜗会在其入口处发现高频传感器,然后是中频传感器,最末端是低频传感器。 • 耳蜗由一个螺旋型管道组成,内部有一个更小的膜状螺旋型通道,从前到后越来越宽。 • 内耳膜上分布着频率选择、声音采集传感器,将听觉神经连接到大脑。 图7.3 人耳剖面图 图7.4 人耳的技术模型 MPEG-2音频编码及其测量,class 04

  17. 3、人耳心理声学模型 • 听觉神经传送的电信号幅度近似为100mVpp,电脉冲的重复率为1kHz数量级,这个速率包含的信息是某个频率音调的音量。音调的音量越高,重复率越大。 • 每个频率传感器通过一个独立的神经线与大脑通讯。 • 传感器的频率选择性在低频处最大,随频率升高而降低。 图7.5 人耳的机械/电子模型 MPEG-2音频编码及其测量,class 04

  18. 与音频 编码相关的人耳特性 • 人耳的灵敏度在很大程度上依赖于频率。 • 低于20Hz,高于20kHz的声音信号人耳无法听到。 • 人耳最敏感范围为3kHz~4kHz,在该范围之外,人耳敏感度向高频和低频两个方向降低。 • 低于某个阈值的声音人耳无法听到,该阈值取决于频率,声音信号中低于该阈值的分量无需传送,对人耳而言是不相关信息。 图7.6 听觉阈值与频率关系 MPEG-2音频编码及其测量,class 04

  19. 与音频 编码相关的人耳特性 • 掩蔽现象: • 例如一个测试人员听一个幅度固定的1kHz正弦波,同时添加其他不同频率和幅度的正弦波,发现在1kHz附近低于某个阈值的其他正弦信号听不到,该阈值取决于频率,称作掩蔽阈值。 • 掩蔽阈值曲线取决于掩蔽信号的频率,掩蔽信号的频率越高,被掩蔽的范围越大。这一特性叫做频域掩蔽。 • 在掩蔽阈值以下的声音分量不需传送。 图7.7 频域掩蔽 图7.8 掩蔽阈值 MPEG-2音频编码及其测量,class 04

  20. 与音频 编码相关的人耳特性 • 时域掩蔽 • 时域中一个强脉冲会掩蔽该脉冲前后低于某个阈值的声音信号。 • 这种现象,尤其是前掩蔽,很难想象,但可以进行很好的解释。是由于人耳的有限时域分辨率,再加上信号通过听觉神经传输到大脑的方式。 • 目前的音频压缩方法只利用了频域掩蔽。 图7.9 时域掩蔽 MPEG-2音频编码及其测量,class 04

  21. 2.音频编码历史 3.人耳心理声学模型 5.子带编码 6.变换编码 MPEG-2音频编码及其测量 1.数字音频源信号 4.音频编码的基本原理 MPEG-2音频编码及其测量,class 04

  22. 4、音频编码的基本原理 • 量化噪声: • 对完全调制正弦信号进行模数转换,由于量化噪声的影响,分辨率为N bits时的信噪比约为6NdB(经验值) • 8bit分辨率的信噪比为48dB • 16bit分辨率的信噪比为96dB • 音频信号通常采样分辨率为16bit或更高 • 16bit分辨率仍然不能满足人耳的动态范围140dB Irrelevancy reduction Redundancy reduction Frequency Subbands Audio in Filtering process Time: fine Frequency: coarse Subband Quantizer Data Coding Compressed Audio out Spectrum Analysis Time: coarse Frequency: fine Psycho- acoustic model 图7.10 基于知觉编码的音频编码原理框图 MPEG-2音频编码及其测量,class 04

  23. 4、音频编码的基本原理 • 数字声音源信号在编码器中分为两个分支: • 滤波 • 将声音信号经过滤波分为许多子带。 • 如果某个子带的信号值低于掩蔽阈值,该子带被其他子带完全掩蔽,不需传送,该子带信息对人耳完全不相关。 • 滤波过程的时域分辨率必须足够高,否则会丢失时域信息;相应只需较低的频域分辨率。 • 频谱分析 • 通过FFT进行频谱分析。 • 测定低时域分辨率和高频域分辨率声音信号的成分。 • 基于心理声学模型(掩蔽效应),可以确定出当前信号中的不相关频率分量。 • 频谱分析模块后是心理声学模型模块,该模块决定子带选择完全抑制或者选择或粗或细量化两种方式。 • 量化通过子带量化器控制。 • 然后通过特殊数据编码进行冗余度降低。 MPEG-2音频编码及其测量,class 04

  24. 4、音频编码的基本原理 • 不相关性降低的另一种可能性: • 如果某个子带信号只有部分边缘在掩蔽阈值以上,该子带的量化可以很粗,使得该子带量化噪声低于阈值而听不到。 • 低于听觉阈值的信号不需传送。针对各子带的不同听觉阈值,可以选择或粗或细的量化,使得量化噪声总是低于阈值。频率越高,分辨率可以越低。 • 知觉编码有多种方式实现: • 子带编码 • 变换编码 • 混合编码 MPEG-2音频编码及其测量,class 04

  25. 2.音频编码历史 3.人耳心理声学模型 4.音频编码的基本原理 6.变换编码 MPEG-2音频编码及其测量 1.数字音频源信号 5.子带编码 MPEG-2音频编码及其测量,class 04

  26. Audio in Q BP Q Frequency subbands Compressed Audio out Q Bandpass filter Example MPEG layer I II FFT Psychoaoustic model 512 point FFT @MPEG Layer 1 1024 points @Layer II Every 24ms BP BP 5、 MPEG Layer I,II子带编码 • 声音信号通过32个滤波器组成的滤波器组,将信号分成750Hz的频率子带,每个子带有独立量化器。 • 量化器受FFT模块和心理声学模型模块控制。 • 量化器可以完全抑制子带或减少量化阶数。 图7.11 子带编码 MPEG-2音频编码及其测量,class 04

  27. 5、 MPEG Layer I,II子带编码 • Layer II中,每隔24ms对1024个采样值做FFT,即心理声学模型模块的输入每隔24ms变化。 • 在24ms间隔中,子带根据心理声学模型模块的信息做不相关性降低。 • 认为24ms内信号不变。 • 各子带的听觉阈值不同,因此不同子带的码字分配和量化都不同。 • 低频分量必须做细量化,高频量化可以变粗。 MPEG-2音频编码及其测量,class 04

  28. 5、 MPEG Layer I,II子带编码 • 音频传输中不相关性消除的两例: • 某子带中有一个5kHz的信号在掩蔽阈值以上,因此该子带只能减少量化阶。 • 另一子带中有一个约10kHz的信号在掩蔽阈值以下,该子带被相邻子带信号完全掩蔽,可以被完全抑制。 Signal level in subband above masking threshold determined by a signal at 4kHz: Quantization noise adjusted to below threshold Signal level in subband below masking threshold detemined by a signal at 8kHz:subband completely suppressed • 为进一步降低不相关性,还要分析子带中是否有谐波位于邻近低端子带内;以及被掩蔽信号是否有谐波分量。 • 只有没有谐波分量的被掩蔽信号可以被完全抑制。 spectrum calculated by means of FFT; Thresholds calculated after FFT; Quantizer controlled by psychoacoustic model 图7.12 利用掩蔽效应的不相关性消除 MPEG-2音频编码及其测量,class 04

  29. Subband filter & Quantizer 0 12 samples 12 samples 12 samples Subband filter & Quantizer 1 12 samples 12 samples 12 samples Subband filter & Quantizer 2 12 samples 12 samples 12 samples Subband filter & Quantizer 31 12 samples 12 samples 12 samples Layer I frame Layer II frame 5、 MPEG Layer I,II子带编码 • MPEG编码中,每帧的采样值数目固定。 • Layer I 一帧每个子带有12个采样值; • Layer II 每个子带有3x12个采样值。 图7.13 MPEG-2 Layer I,II 数据结构 MPEG-2音频编码及其测量,class 04

  30. 5、 MPEG Layer I,II子带编码 • 对每一块( 12个采样值)找出最大值,作为整个块12个采样值的比例因子,来降低冗余度。 Highest value is used for scale factor determination for a block of samples Block of samples 图7.14 MPEG-2 Layer I,II冗余度降低 MPEG-2音频编码及其测量,class 04

  31. 2.音频编码历史 3.人耳心理声学模型 4.音频编码的基本原理 5.子带编码 MPEG-2音频编码及其测量 1.数字音频源信号 6.变换编码 MPEG-2音频编码及其测量,class 04

  32. 6、变换编码 • 变换编码与子带编码相反,不用滤波器组进行子带滤波,声音信号的频域分离通过DFT实现。 • 利用DCT或MDCT,声音信号变换为256或512个频谱能量值。 • 与子带编码相同,同时对声音信号做相对高频域分辨率的FFT,FFT输出的数据送到心理声学模型模块,来控制MDFT得到的音频信号能量值进行或粗或细的量化或完全抑制。 • 相对子带编码的优点是,对不相关性降低过程,频域分辨率较高。 • Dolby数字AC-3音频编码采用的方法。 Compressed Audio out M(DCT) Modified Discrete Cosine Transform Audio in Quantizer Example Dolby Digital AC-3 FFT Psychoaoustic model 图7.15 变换编码 MPEG-2音频编码及其测量,class 04

  33. 6、变换编码 • 子带编码和变换编码的混合编码: • MPEG Layer III编码中,在MDCT之前先进行子带滤波。 • 先进行较粗的子带分离,然后每个子带进行MDCT来得到更高分辨率。 • MDCT之后,由心理声学模型控制,进行不相关性降低。 • 心理声学模型模块的输入为FFT模块的输出。 • 即MP3音频文件,广泛使用。 Subband filter Quantizer Audio in M(DCT) Compressed Audio out Example MPEG layer III FFT Psychoaoustic model 图7.16 混合编码 MPEG-2音频编码及其测量,class 04

  34. 6、变换编码 • 多通道音频编码: • 可以测定通道间的不相关性,并在传输中省去该不相关信息。 • 分析各通道对空间听觉没有作用的相关分量。 • MPEG Layer II MC和Dolby数字5.1环绕。 • 5.1声道包括:左、中、右、左环绕、右环绕和一个低音扩音器的低频增强通道(LFE) 图7.17 扩音机5.1多通道音频配置 MPEG-2音频编码及其测量,class 04

  35. Thank You ! Zhangwenjun@sjtu.edu.cn www.themegallery.com

More Related