460 likes | 564 Views
第 8 章 多媒体技术基础. 本章主要内容: 8.1 多媒体技术的发展 8.2 数字声音 8.3 数字图像 8.4 数据编码及压缩 8.5 声音和图像文件格式 8.6 数字视频. 8.1 多媒体技术的发展. 发展概述 1984 , Apple 公司 Macintosh 1985 , Commodore 公司; CD-ROM 1986 , PHILIPS 公司和 SONY 公司共同制订了 CD-I 1990 , Multimedia PC Marking Council 1995 , MPC3 。. 一 . 多媒体技术的基本概念.
E N D
第8章 多媒体技术基础 • 本章主要内容: • 8.1 多媒体技术的发展 • 8.2 数字声音 • 8.3 数字图像 • 8.4 数据编码及压缩 • 8.5 声音和图像文件格式 • 8.6 数字视频
8.1 多媒体技术的发展 • 发展概述 • 1984,Apple公司 Macintosh • 1985,Commodore公司;CD-ROM • 1986,PHILIPS公司和SONY公司共同制订了CD-I • 1990,Multimedia PC Marking Council • 1995,MPC3。
一. 多媒体技术的基本概念 • 1. 媒体(Medium):两种含义 • 1) 存储信息的载体,如磁盘、光盘等 • 2) 信息的载体:数字、文字、图像、声音等 • 3)多媒体技术中的媒体指后者 • 2. 多媒体(Multimedia) • 指信息表示媒体的多样化,如数字、文字、图形图像、动画、声音、视频
3. 多媒体计算机(Multimedia Computer): • 计算机综合处理多种媒体信息,建立逻辑连接,集成为一个具有交互性的系统 • 4. 多媒体计算机的关键技术 • 音频、视频信号获取、多媒体数据压缩编码、解码 • 二. 多媒体技术的应用 • 工业应用领域 • 医疗诊断 • 教育教学
三. 多媒体计算机系统的组成 • 1. 输入设备 • 光驱、麦克风、扫描仪、录音机、VCD/DVD、数码相机、摄像机 • 2. 功能卡 • 电视卡、声卡、 Modem卡、视讯会议卡、视频输出卡、VCD压缩卡等 • 3. 输出设备 • 刻录机、音箱、耳机、打印机 • 4. 软件支持 • 音频处理软件、图像处理软件、视频处理软件、通信软件、VCD制作与光盘刻录软件
8.2 数字声音 • 一. 声音的特性 • 1. 声波 • 2. 声音参数 • 1) 幅度 • 2) 频率 • 3. 带宽:声音信号的频率范围 • 高保真声音带宽:10~20 000Hz • 话音信号: 300Hz~3000Hz
二. 模拟信号与数字信号 模拟信号: 时间和幅度都是连续的信号 数字信号:时间和幅度都是离散的信号 模拟信号 数字信号
三.模拟信号数字化:采样和量化 • 1. 采样:离散时间 • 1)离散时间信号:采样得到的信号 • 2)采样频率:单位时间内的采样次数 • 3)均匀采样:采样时间间隔相等 • 不均匀采样 • 4)奈奎斯特理论: 采样频率不低于声音信号最高频率的两倍,即可将以数字表达的声音还原成原来的声音 • 该条件是必要条件,而不是充分条件
2. 量化:离散幅度 • 1)量化:对幅值进行限定和近似的过程 • 2)离散幅度信号:量化后的幅值,由有限个数值组成 • 3)线性量化:幅度的划分是等间隔的 • 非线性量化 • 4)采样精度: 表示量化级别的二进制位数,也称为样本位数、位深度。
对比不同的采样精度 采样频率11KHz 8位量化 采样频率22KHz 16位量化
3. 数据率 • 数字化或还原1秒钟声音所需传输的数据位数 • 未经压缩的数字声音的数据率(b/s) = • 采样频率(Hz)*样本精度(bit)*声道数
不同质量的声音的性能指标 • 样本位数越多,声音质量越高,而需要的存储空间也越大
8.3 数字图像 • 一. 颜色 • 1. 颜色的实质 • 光波,视觉系统对可见光的感知结果。被观察对象吸收或反射不同波长的光波形成 • 2. 可见光波长 • 380 nm~780 nm之间的电磁波。眼睛看到的光常为多种不同波长的光组合成。当各种不同的光信号一起进入眼睛某点时,视觉器官将其混合,作为一种颜色接收 • 3. 自然界中的任何一种颜色都可以由红、绿、蓝(R,G,B)这3种颜色值之和来确定
紫外光 红外光 可见光区 400nm 700nm 780nm 546.1nm 435.8nm 可见光的波长范围
二. 颜色模型 • 1. 有源物体:能发出光波的物体 • 相加混色:RGB模型 • 2. 无源物体:不发出光波的物体 • 相减混色CMY模型
RGB颜色模型 1)国际照明委员会(CIE) 规定以700nm(红)、546.1nm(绿)、435.8nm (蓝)三个色光为三基色。又称为物理三基色。 2)自然界的所有颜色都可以通过这三基色按不同比例混合而成。
蓝(0,0,255) 青(0,255,255) 品红(255,0,255) 白(255,255,255) 黑(0,0,0) 绿(0,255,0) 红(255,0,0) 黄(255,255,0) R:200 G:50 B:120 RGB颜色模型
CMYK颜色模型 • 在理论上说,任何一种颜色都可以用青色(Cyan)、品红(Magenta)和黄色(Yellow)三种基本颜料按一定比例混合得到,通常写成CMY,称为CMY模型 • 由于彩色墨水和颜料的化学特性,用等量的三种基本颜色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色(Black ink),所以 CMY又写成 CMYK
HSB颜色模型 • 这种彩色系统格式的设计反映了人类观察彩色的方式。如:红色又分为浅红和深红色等等。 • 1) 色调: 颜色的外观 • 2) 饱和度:颜色明暗的程序 • 3) 明度:对可见物体辐射或发光多少的感知属性
三. 图像的数字化 • 1. 图像的基本属性 • 图像分辨率 • 扫描分辨率 • 像素深度或位深度 • 2. 图像的数字化过程 • 1)采样 • 2)灰度级的整量 • 3. 位图图像分类 • 1)单色图像 2)灰度图像 3)彩色图像
8.4 数据编码及压缩 • 一. 编码 • 1. 编码:将模拟信号转换成数字信号的过程 • 2. 解码:将数字信号还原成模拟信号的过程 • 3. 编解码器:完成编码、解码功能的装置。 • 二. 数据压缩 • 1. 数据压缩的目的是便于存储和传输。 • 2. 数据压缩的必要性: 庞大的数据量
例1:存储3分30秒的CD音质立体声歌曲 • 44.1kHz×2B×2×210秒 = 37044KB = 36.2M • 例2:存储一幅352×288的静态真彩色图像 • 352×288×3B=304.13kB • 例3:存储1分钟视频 • 304.13kB×25×60=456195kB=456.2M
3.数据压缩的可能性 • 1)信息冗余 • 2)数据量不等于它所包含的信息量 • 3)在静态图像中存在的空间冗余 • 4)在动态视频中存在的时间冗余
4. 压缩的方法 • 1)无损压缩 • 一种可逆压缩,即经过压缩后可将原文件包含的信息完全保留的压缩方式 • 利用原始信息中的相关性进行的数据压缩不损失原信息的内容,可实现无损压缩 • 例:无损压缩的RLE编码
无损压缩的RLE编码 • RLE编码后得到的代码为: • 50(200,30,100)2(255,255,255) • 1(0,5,5)9(0,0,0)72(200,30,100) • 2)有损压缩
8.5 声音和图像文件格式 • 一. 主流音频文件格式 • 1. WAV波形音频文件 • Windows音频格式,文件后缀.WAV • 事实上的通用音频格式 • 通常使用WAV格式保存未压缩的音频,即PCM编码后得到的音频,故常称WAV文件为波形文件。
2. mp3 • 第一个实用的有损音频压缩编码。可实现12:1的压缩比例。 • 特点:利用了知觉音频编码技术,即削减音乐中人耳听不到的成分,同时尽可能维持原来声音质量 • 衡量mp3文件的压缩比:比特率—每秒钟音频可用多少二进制比特表示。通常比特率越高,压缩文件越大,但音乐中保留的成分越多,音质就越好
二. 主流图像文件格式 • BMP (Bitmap-File,BMP)位图文件 • GIF(Graphics Interchange Format图形交换格式) • JPEG (Joint Photographic Experts Group)
8.6 数字视频 • 一. 数字视频标准 : MPEG 系列 • 二. MPEG压缩原理 • 1. 动态图像特点 • 动态图像以每秒25 帧播放,在如此短的时间内,画面通常不会有大的变化; • 在画面中变化的只是运动的部分,静止的部分往往占有较大的面积; • 即使是运动的部分,也多为简单的平移。
2.压缩中的问题 • 如果只保留第一帧,其他帧采用差异帧。那么后面的每一帧都需要从前一帧计算出来,恢复时也必需一帧帧顺序进行。这样就无法想跳到哪一点就从哪一点进行播放。一旦某一帧数据出了问题,后面的帧更无法恢复。 • 由于差异帧的压缩是有损的。上述方式在压缩和解压缩时将发生误差的积累,积累到一定程度势必造成很大的失真。
3. 解决方法 • 每隔若干帧(如30帧)之后记录一幅原始(完整)帧 • 运动补偿的矢量算法
三. 主流视频文件格式 • AVI(Audio Video Interleave) • RM • ASF (Advanced Streaming Format) • DV(Digital Video)