840 likes | 1.02k Views
第 8 讲 多媒体技术基础. 主讲教师:唐大仕 dstang2000@263.net http://www.dstang.com. 课前思考. 你用过哪些多媒体设备及软件?. 本讲内容. 多媒体计算机 多媒体信息的表示及处理 多媒体硬件 多媒体软件. ( 一 ) 多媒体计算机. 多媒体技术. 媒体 是信息储存、传播表现的载体 传统媒体 计算机领域中的媒体 多媒体 能同时采集、处理、编辑、存储和展示两个以上不同类型信息媒体的技术。. 多媒体 特点. 集成性 交互性 实时性. 多媒体个人计算机( MPC ).
E N D
第8讲 多媒体技术基础 主讲教师:唐大仕 dstang2000@263.net http://www.dstang.com
课前思考 • 你用过哪些多媒体设备及软件?
本讲内容 • 多媒体计算机 • 多媒体信息的表示及处理 • 多媒体硬件 • 多媒体软件
多媒体技术 • 媒体 • 是信息储存、传播表现的载体 • 传统媒体 • 计算机领域中的媒体 • 多媒体 • 能同时采集、处理、编辑、存储和展示两个以上不同类型信息媒体的技术。
多媒体 特点 • 集成性 • 交互性 • 实时性
多媒体个人计算机(MPC) • 集声、文、图于一体具有多媒体功能的个人计算机 • 发展史 • 1984年,Apple推出第一台具有多媒体特性的Macintosh机1987年引入超级卡 • 1986年,Philips和Sony联合推出CD-I(Compact Disc Interactive) • 1987年,RCA推出DVI系统(Digital Viedo Interactive) • MPC Ⅳ标准
多媒体计算机的标准 • 主频为75MHz以上的Pentium级微处理器; • 内存8MB以上; • 数据传输率为600KB/s的CD-ROM驱动器; • 配有16位声卡且具有波表合成技术以及MIDI功能; • 在显示输出方面,要求具备颜色空间的转换和缩放功能,能以65535色、352×240分辨率、30帧/秒播放动态视频; • 硬盘容量不少于540MB。 • 操作系统软件是Windows3.11及更高版本或MS-DOS6.0及更高版本
MPC的硬件系统 • 主机 • 接口卡 • 存储设备 • 输入输出设备
MPC的软件系统 • 多媒体操作系统 • 包含了设备驱动程序 • 包含了多媒体设备接口处理程序(MCI) ) • 多媒体素材 • 多媒体创作工具 • 多媒体应用系统
MPC应用领域 • 教育 • 电子出版物 • 信息服务 • 商业 • 娱乐 • 在虚拟现实中的应用
(二)多媒体信息的表示及处理 • 音频 • 图像和视频 • 动画 • 超媒体
音频 • 声音信号: • 音调 20-20KHz • 音色 • 音量
Figure 2-9 Audio representation
声音的数字化 • 声音数字化的三要素 • 采样频率 • 根据奈奎斯特理论,采样频率不低于声音信号最高频率的两倍。这样就能把数字表达的声音还原成原来的声音,称为无损数字化。 • 采样精度 • 用样本值的二进制位数来表示。位数越多精度越高,数据也越大。量化等级 • 声道数 • 例: CD音质 • 44.1kHz X 16位 X 2 =176KB/s • (约相当于单倍速光驱, 150KB/s)
声音的编码 • ADPCM(自适应差分脉冲编码)
MIDI音乐 • Musical Instrument Digital Interface • 记录 音符、节拍、乐器种类及音量等 • FM合成方式 • 波形表合成方式
图像 • 图像 • 分辨率 • 颜色深度(位数) • 如:640*480*256色(即8位) ≈ 300k
颜色表示 • RGB(彩色最基本模型,适合于计算机系统) • CYMK(cyan/magenta/yellow/black),用于印刷 • HSL (hue/saturation/luminance) 适合于人的视觉 • YUV (亮度、色差) 用于电视信号传输
彩色空间——RGB • R,G,B分别代表红(red)、绿(green)、蓝(blue)三色。 • 彩色最基本的表示模型 • 通过对R、G、B三个颜色通道的变化以及它们相互之间的叠加可得到各式各样的颜色。
彩色空间——RGB • RGB是计算机系统使用的彩色模型。 • 24位真彩 当显示器可显示256*256*256=16,777,216种颜色 • 常用:RGB5:5:5方式和RGB8:8:8方式。 • 注意:R、G、B三分量中不仅包含色彩信息,而且还包含了亮度、饱和度 • 特别地,当R=G=B时,该象素是灰度,无颜色 更特别,当R=G=B=0时,该象素是黑色 当R=G=B=255时,该象素是白色
Bitmap graphic 位图 Figure 2-7
彩色空间——HSI彩色空间 • 用三个分量来表示一种颜色 • H(Hue,色调) • S(Saturation,饱和度) • I(Intensity,光强度) • HSI彩色空间更适合人的视觉特性
颜色编辑器 255 到 亮度 0~255 0 从 饱和度 色调值 0 ~ 255 条形区域为亮度图,可调节亮度 方形区域为色度图,可对色度进行调节(包括色调和饱和度)
彩色空间——YUV • Y为亮度信号, U(B-Y)和V(R-Y)是色差信号 • YUV的最初作为电视系统信号编码 • 优点之一是亮度信号和色差信号分离,容易使彩色电视系统与只对亮度敏感的黑白电视机亮度信号兼容; • 否则,如果用RGB传输,虽然黑白电视机可以正常接受彩色电视信号(只显示出黑白图像),但YUV系色感较均匀,当不发生偏移时色调饱和度上的变化近似相同。 • 中国和西欧采用的PAL制式电视系统就采用该空间进行传输,电视机接收到后,再转换成RGB空间
彩色空间——YUV彩色空间 • 国际无线电咨询委员会(CCIR)根据实验认为,采用双倍度采样4:2:2方案效果较好,提出了CCIR 601标准: ——线性关系
彩色空间转换: YUV<——>RGB • RGB YUV(这里系数有小的改变) Y = 0.3R + 0.59G + 0.11B U = B – Y V = R – Y • 显然,在视频信号采集时,RGB;而在传送时,只传送: • 一个宽频亮度信号Y——包含有所有细节 • 二个窄频色差信号(B-Y,R-Y)—— 代表彩色,经进一步处理成为U,V信号 • 而原来,是三个宽频带的基色信号
彩色空间转换:YUV<——>RGB • 当接收时, YUV RGB R = Y + V G = Y – 0.19U – 0.51V B = Y + U
彩色空间——YIQ彩色空间 • YIQ彩色空间是在广播电视系统中另一种常用的亮度与色差分离的模型。 • 美国的电视系统采用NTSC制式,其彩色空间即为YIQ • Y是亮度,I和Q共同描述图像的色调和饱和度。YUV与RGB的相互关系为:
视频 • 视频的三要素: • 空间分辨率(即屏幕上的点数) • 颜色分辨率(即每个点的颜色位数) • 时间分辨率(即每秒的帧数) • 电视: • NTSC(美国、日本)30帧/秒,525行/帧 • PAL (西欧、中国)25帧/秒, 625行/帧 • SECAM(俄、法) • 注:电影是24帧/秒
声音文件的格式(要求掌握) • WAV • (Win平台) • AU • (unix平台) • MIDI • 记录MIDI信息 • MP3 • 它的优点是在保证音质近乎完美的情况下,文件的尺寸却非常小。
图像文件的格式(要求掌握) • JPEG (Joint Photographic Expert Group) • 有损压缩;多用于照片 • GIF (Graphics Interchange Format) • 无损压缩,最多256色,可透明,可动画;多用于小图标 • TIFF(Tag Image File Format) • 未压缩或简单压缩;多用于扫描及传真 • BMP (Bitmap) • Windows中的位图,一般未压缩
视频文件的格式(要求掌握) • MPG • (MPEG:Motion Photographic Expert Group) • AVI(Audio Video Interactive) • 其他格式
流媒体 • 流媒体文件 • 流媒体简单来说就是应用流技术在网络上传输的多媒体文件,而流技术就是把连续的影象和声音信息经过压缩处理后放上网站服务器,让用户一边下载一边观看、收听,而不需要等整个压缩文件下载到自己机器后才可以观看的网络传输技术。该技术先在使用者端的电脑上创造一个缓冲区,于播放前预先下载一段资料作为缓冲,于网路实际连线速度小于播放所耗用资料的速度时,播放程序就会取用这一小段缓冲区内的资料,避免播放的中断,也使得播放品质得以维持。 • 目前在这个领域上,竞争的公司主要有三个:Microsoft、Real Networks、Apple,而相应的产品就是:Windows Media 、Real Media、QuickTime。 • 常用流式媒体格式 • RM .rm .rmvb (Real格式) • wma, asf(微软的格式)
动画 • 什么是动画 • 活动的画面 • 动画制作 • 如 Flash (二维动画) • 扩展名为.swf • 广泛用于网络 • 闪客 • 如 3D MAX, Maya(三维动画)
多媒体计算机的硬件设备 • 主要设备: • CD-ROM / DVD-ROM驱动器和光盘 • 声卡 • 显卡 • 视频卡 • 显示器、音箱(耳机)、麦克风、摄像头、数码相机、数码摄像机、扫描仪、游戏手柄等其它外设
声音卡 • 结构与功能 • 声音数字处理器 DSP • 混声器 • 合成器 • 波表存储器 • 总线接口 • 声卡的技术指标 • 采样能力 • 合成器、MIDI功能、 • 音效 • 总线类型、 • 标准支持、即插即用、芯片类型
视频卡 • 视频捕获卡 • 视频叠加卡 • MPEG解压卡 • 电视接收卡
光盘技术 • CD-ROM(Compact Disk Read-Only Memory) • CD-WORM(Write Only Read Memory) • 其他 • 如:CD-ETOM(Electron Trapping Optical Memory)
CDROM 标准 • CD-DA(红皮书) • CD-ROM(黄皮书) • VCD • DVD, xDVD • 其他:CD-I, PhotoCD, CD-TV,。。。
扫描仪 工作原理:扫描过程中,扫描仪提供光源给图像,光线从图像反射进扫描仪的光学系统,在此过程中不同层次的光得到调节,图像以数字形式重新组合并显示在屏幕上 扫描仪性能指标: 幅面,分辨率,颜色数,速度
语音处理 • 实现语音处理的软硬件条件: • 硬件:语音卡(加速卡)、麦克风、扬声器 • 软件:配套软件系统 • 语音技术 • API:语音应用程序接口(SR 和 TTS) • SR:语音识别器 • TTS:文本—语音转换器 • 相关软件 • 中自公司的“汉王”系列 • IBM公司的ViaVoice