1 / 46

第 8 章 多媒体技术基础

第 8 章 多媒体技术基础. 本章主要内容: 8.1 多媒体技术的发展 8.2 数字声音 8.3 数字图像 8.4 数据编码及压缩 8.5 声音和图像文件格式 8.6 数字视频. 8.1 多媒体技术的发展. 发展概述 1984 , Apple 公司 Macintosh 1985 , Commodore 公司; CD-ROM 1986 , PHILIPS 公司和 SONY 公司共同制订了 CD-I 1990 , Multimedia PC Marking Council 1995 , MPC3 。. 一 . 多媒体技术的基本概念.

Download Presentation

第 8 章 多媒体技术基础

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第8章 多媒体技术基础 • 本章主要内容: • 8.1 多媒体技术的发展 • 8.2 数字声音 • 8.3 数字图像 • 8.4 数据编码及压缩 • 8.5 声音和图像文件格式 • 8.6 数字视频

  2. 8.1 多媒体技术的发展 • 发展概述 • 1984,Apple公司 Macintosh • 1985,Commodore公司;CD-ROM • 1986,PHILIPS公司和SONY公司共同制订了CD-I • 1990,Multimedia PC Marking Council • 1995,MPC3。

  3. 一. 多媒体技术的基本概念 • 1. 媒体(Medium):两种含义 • 1) 存储信息的载体,如磁盘、光盘等 • 2) 信息的载体:数字、文字、图像、声音等 • 3)多媒体技术中的媒体指后者 • 2. 多媒体(Multimedia) • 指信息表示媒体的多样化,如数字、文字、图形图像、动画、声音、视频

  4. 3. 多媒体计算机(Multimedia Computer): • 计算机综合处理多种媒体信息,建立逻辑连接,集成为一个具有交互性的系统 • 4. 多媒体计算机的关键技术 • 音频、视频信号获取、多媒体数据压缩编码、解码 • 二. 多媒体技术的应用 • 工业应用领域 • 医疗诊断 • 教育教学

  5. 三. 多媒体计算机系统的组成 • 1. 输入设备 • 光驱、麦克风、扫描仪、录音机、VCD/DVD、数码相机、摄像机 • 2. 功能卡 • 电视卡、声卡、 Modem卡、视讯会议卡、视频输出卡、VCD压缩卡等 • 3. 输出设备 • 刻录机、音箱、耳机、打印机 • 4. 软件支持 • 音频处理软件、图像处理软件、视频处理软件、通信软件、VCD制作与光盘刻录软件

  6. 多媒体计算机系统的组成(续)

  7. 8.2 数字声音 • 一. 声音的特性 • 1. 声波 • 2. 声音参数 • 1) 幅度 • 2) 频率 • 3. 带宽:声音信号的频率范围 • 高保真声音带宽:10~20 000Hz • 话音信号: 300Hz~3000Hz

  8. 二. 模拟信号与数字信号 模拟信号: 时间和幅度都是连续的信号 数字信号:时间和幅度都是离散的信号 模拟信号 数字信号

  9. 三.模拟信号数字化:采样和量化 • 1. 采样:离散时间 • 1)离散时间信号:采样得到的信号 • 2)采样频率:单位时间内的采样次数 • 3)均匀采样:采样时间间隔相等 • 不均匀采样 • 4)奈奎斯特理论: 采样频率不低于声音信号最高频率的两倍,即可将以数字表达的声音还原成原来的声音 • 该条件是必要条件,而不是充分条件

  10. 2. 量化:离散幅度 • 1)量化:对幅值进行限定和近似的过程 • 2)离散幅度信号:量化后的幅值,由有限个数值组成 • 3)线性量化:幅度的划分是等间隔的 • 非线性量化 • 4)采样精度: 表示量化级别的二进制位数,也称为样本位数、位深度。

  11. 音频波形的PCM编码

  12. 对比不同的采样精度 采样频率11KHz 8位量化 采样频率22KHz 16位量化

  13. 非线性量化

  14. 3. 数据率 • 数字化或还原1秒钟声音所需传输的数据位数 • 未经压缩的数字声音的数据率(b/s) = • 采样频率(Hz)*样本精度(bit)*声道数

  15. 不同质量的声音的性能指标 • 样本位数越多,声音质量越高,而需要的存储空间也越大

  16. 8.3 数字图像 • 一. 颜色 • 1. 颜色的实质 • 光波,视觉系统对可见光的感知结果。被观察对象吸收或反射不同波长的光波形成 • 2. 可见光波长 • 380 nm~780 nm之间的电磁波。眼睛看到的光常为多种不同波长的光组合成。当各种不同的光信号一起进入眼睛某点时,视觉器官将其混合,作为一种颜色接收 • 3. 自然界中的任何一种颜色都可以由红、绿、蓝(R,G,B)这3种颜色值之和来确定

  17. 紫外光 红外光 可见光区 400nm 700nm 780nm 546.1nm 435.8nm 可见光的波长范围

  18. 二. 颜色模型 • 1. 有源物体:能发出光波的物体 • 相加混色:RGB模型 • 2. 无源物体:不发出光波的物体 • 相减混色CMY模型

  19. RGB颜色模型 1)国际照明委员会(CIE) 规定以700nm(红)、546.1nm(绿)、435.8nm (蓝)三个色光为三基色。又称为物理三基色。 2)自然界的所有颜色都可以通过这三基色按不同比例混合而成。

  20. 蓝(0,0,255) 青(0,255,255) 品红(255,0,255) 白(255,255,255) 黑(0,0,0) 绿(0,255,0) 红(255,0,0) 黄(255,255,0) R:200 G:50 B:120 RGB颜色模型

  21. CMYK颜色模型 • 在理论上说,任何一种颜色都可以用青色(Cyan)、品红(Magenta)和黄色(Yellow)三种基本颜料按一定比例混合得到,通常写成CMY,称为CMY模型 • 由于彩色墨水和颜料的化学特性,用等量的三种基本颜色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色(Black ink),所以 CMY又写成 CMYK

  22. HSB颜色模型 • 这种彩色系统格式的设计反映了人类观察彩色的方式。如:红色又分为浅红和深红色等等。 • 1) 色调: 颜色的外观 • 2) 饱和度:颜色明暗的程序 • 3) 明度:对可见物体辐射或发光多少的感知属性

  23. HSB颜色模型

  24. HSB颜色模型

  25. Lab颜色模型

  26. 三. 图像的数字化 • 1. 图像的基本属性 • 图像分辨率 • 扫描分辨率 • 像素深度或位深度 • 2. 图像的数字化过程 • 1)采样 • 2)灰度级的整量 • 3. 位图图像分类 • 1)单色图像 2)灰度图像 3)彩色图像

  27. 图像的数字化

  28. 图像的数字化

  29. 图像的数字化

  30. 8.4 数据编码及压缩 • 一. 编码 • 1. 编码:将模拟信号转换成数字信号的过程 • 2. 解码:将数字信号还原成模拟信号的过程 • 3. 编解码器:完成编码、解码功能的装置。 • 二. 数据压缩 • 1. 数据压缩的目的是便于存储和传输。 • 2. 数据压缩的必要性: 庞大的数据量

  31. 例1:存储3分30秒的CD音质立体声歌曲 • 44.1kHz×2B×2×210秒 = 37044KB = 36.2M • 例2:存储一幅352×288的静态真彩色图像 • 352×288×3B=304.13kB • 例3:存储1分钟视频 • 304.13kB×25×60=456195kB=456.2M

  32. 3.数据压缩的可能性 • 1)信息冗余 • 2)数据量不等于它所包含的信息量 • 3)在静态图像中存在的空间冗余 • 4)在动态视频中存在的时间冗余

  33. 4. 压缩的方法 • 1)无损压缩 • 一种可逆压缩,即经过压缩后可将原文件包含的信息完全保留的压缩方式 • 利用原始信息中的相关性进行的数据压缩不损失原信息的内容,可实现无损压缩 • 例:无损压缩的RLE编码

  34. 无损压缩的RLE编码 • RLE编码后得到的代码为: • 50(200,30,100)2(255,255,255) • 1(0,5,5)9(0,0,0)72(200,30,100) • 2)有损压缩

  35. 8.5 声音和图像文件格式 • 一. 主流音频文件格式 • 1. WAV波形音频文件 • Windows音频格式,文件后缀.WAV • 事实上的通用音频格式 • 通常使用WAV格式保存未压缩的音频,即PCM编码后得到的音频,故常称WAV文件为波形文件。

  36. 2. mp3 • 第一个实用的有损音频压缩编码。可实现12:1的压缩比例。 • 特点:利用了知觉音频编码技术,即削减音乐中人耳听不到的成分,同时尽可能维持原来声音质量 • 衡量mp3文件的压缩比:比特率—每秒钟音频可用多少二进制比特表示。通常比特率越高,压缩文件越大,但音乐中保留的成分越多,音质就越好

  37. 二. 主流图像文件格式 • BMP (Bitmap-File,BMP)位图文件 • GIF(Graphics Interchange Format图形交换格式) • JPEG (Joint Photographic Experts Group)

  38. 8.6 数字视频 • 一. 数字视频标准 : MPEG 系列 • 二. MPEG压缩原理 • 1. 动态图像特点 • 动态图像以每秒25 帧播放,在如此短的时间内,画面通常不会有大的变化; • 在画面中变化的只是运动的部分,静止的部分往往占有较大的面积; • 即使是运动的部分,也多为简单的平移。

  39. 2.压缩中的问题 • 如果只保留第一帧,其他帧采用差异帧。那么后面的每一帧都需要从前一帧计算出来,恢复时也必需一帧帧顺序进行。这样就无法想跳到哪一点就从哪一点进行播放。一旦某一帧数据出了问题,后面的帧更无法恢复。 • 由于差异帧的压缩是有损的。上述方式在压缩和解压缩时将发生误差的积累,积累到一定程度势必造成很大的失真。

  40. 3. 解决方法 • 每隔若干帧(如30帧)之后记录一幅原始(完整)帧 • 运动补偿的矢量算法

  41. 三. 主流视频文件格式 • AVI(Audio Video Interleave) • RM • ASF (Advanced Streaming Format) • DV(Digital Video)

More Related