580 likes | 746 Views
多媒体技术基础. 多媒体技术基础. 第一章 多媒体技术概论. 第二章 多媒体信息的表示. 第三章 多媒体信息的压缩. 第一章 多媒体技术概论. 多媒体技术的应用始于 20 世纪 80 年代. 1.1 多媒体技术的形成和发展. 1.1.1 多媒体的有关概念. 多媒体 :. 文本、声音、图形、图像和动画等是信息的载体,其中两个或都两个以上的组合构成了多媒体. 多媒体计算机技术 :. 运用计算机综合处理多媒体信息(文本、声音、图形、图像等)的技术,包括将多种信息建立逻辑连接,进而集成一个具有交互性的系统等等. 第一章 多媒体技术概论. 多媒体系统 :.
E N D
多媒体技术基础 第一章 多媒体技术概论 第二章 多媒体信息的表示 第三章 多媒体信息的压缩
第一章 多媒体技术概论 多媒体技术的应用始于20世纪80年代 1.1多媒体技术的形成和发展 1.1.1多媒体的有关概念 多媒体: 文本、声音、图形、图像和动画等是信息的载体,其中两个或都两个以上的组合构成了多媒体 多媒体计算机技术: 运用计算机综合处理多媒体信息(文本、声音、图形、图像等)的技术,包括将多种信息建立逻辑连接,进而集成一个具有交互性的系统等等
第一章 多媒体技术概论 多媒体系统: 利用计算机技术和数字通信技术来处理和控制多媒体信息的系统。 1.促进多媒体技术发展的关键技术 (1)CD-ROM解决了多媒体信息的存储问题 (2)高速计算机网络可以传送多媒体信息 (3)高速位处理技术、专用集成电路技术和亚微米集成电路技术的发展,为多媒体技术提供了高速处理的硬件环境 (4)多媒体压缩技术、人机交互技术和分布式处理技术的出现促进了多媒体系统的产生与发展
第一章 多媒体技术概论 2. 多媒体技术的特性 (1)集成性(包括两个方面) • 多媒体技术能将各种不同的媒体信息有机地进行同步组合为一个完整的多媒体信息 • 把不同的媒体设备集成在一起,形成多媒体系统 (2)实时性 声音及活动的视频图像是与时间密切相关的,这就决定了多媒体技术要支持实时处理 (3)交互性 • 通过交互特性使用户介入到信处过程,不仅仅是提取信息,这是中级交互应用 • 当用户完全进入到一个与信息环境一体化的虚拟信息空间自由遨游时,这是高级交互应用
第一章 多媒体技术概论 (4)高质量 以计算机为中心的多媒体技术以全数字化方式加工处理声音和图像信息,精确度高,声音和图像的质量效果好。 1.1.2多媒体技术的发展 1.启蒙发展阶段 (1)1983年,美国无线电公司RCA 推出了交互式系统 (2)1984年,美国Apple公司 引入位映射的概念来对图进行处理 使用了窗口和图符作为用户接口 最早使用了GUI(图形用户接口)
第一章 多媒体技术概论 (3)1985年,美国Commodore个人计算机公司 推出世界上第一台多媒体计算机Amiga (4)1986年3月,荷兰Philips公司和日本Sony公司 联合硬制并推出了交互式紧凑光盘系统CD-I,同时还公布了CD-ROM文件格式并成为ISO国际标准 (5)20世纪90年代,美国微软公司 推出Windows3.0操作系统 1987年又引入了“超级卡”
第一章 多媒体技术概论 2.初期应用和标准化阶段 (1)1990年10月,国际标准化组织ISO 形成多媒体PC技术规范1.0 (2)1991年,ISO和CCITT联合成立的专家组JPEG 提出ISO/IEC/10916G标准JPEG, 即“多灰度静止图像的数字压缩编码 (3)1992年,运动图像专家组MPEG 提出ISO CDIII72标准MPEG-1, 用于数字存储多媒体运动图像 (4)1993年,国际标准化组织ISO 发布多媒体微机性能标准2 (5)1993年6月,IBM公司 公布在OS/2上运行的32位多媒体软件包
第一章 多媒体技术概论 1.1.3我国多媒体的发展现状 (1)1989年开始,主要工作集中在多媒休应用系统的开发上,引进了一些声霸卡和视霸卡,在计算机上开发多媒体应用系统 (2) 1991年开始创建自己的开发平台,著作工具和编辑软件有的更进一步引入多媒体器件和技术,开发声频卡和视频卡之类的硬件产品,除了开发者自用以外,某些产品进入销售市场。 (3)1992年开始,从市场上可以买到支持多媒体板卡产品,板卡厂商提供的驱动程序和库函数等支撑软件已能比较成功地解决问题。 (4)1993年以后,板卡销售利润丰厚带来的竞争使板卡的价格直线下降。同时多媒体技术水平有较大提高,国内的开发平台、多媒体数据库、支撑软件、音视频板卡、触摸屏等也不同规模推向市场 (5)1994年下半年开始,MPEG及JPEG技术及有关产品的推广;CD-ROM、V-CD及播放器、播放卡的推广;多媒体计算机前所末有的速度进入家庭;点播电视系统开发;信息高速公路的发展和多媒体通讯技术在国内迅速发展
第一章 多媒体技术概论 1.2多媒体系统的分类 1.2.1基于功能的分类 (1)开发系统 (2)演示系统 (3)培训系统 (4)家庭系统 1.2.2基于应用的分类 (1)多媒体信息咨询系统 (2)多媒体管理系统 (3)多媒体辅助教育系统 (4)多媒体通信系统 (5)多媒体娱乐系统
第一章 多媒体技术概论 1.3多媒体系统的组成 (1)计算机硬件 (2)多媒体计算机配置的硬件 (3)多媒体I/O控制及接口 (4)多媒体核心系统 (5)创作系统 (6)应用系统 脉冲编码调制器PCM的两个要素 (1)采样率:声音从模拟波形转化为数字数据的速度,采样速率决定声音记录和生成的最高频率。采样速率必须比样本的最高频率的两倍高约10%。人类听力范围为20HZ到20KHZ,因此激光唱盘的抽样速率应为44.1KHZ。 (2)样本大小:表示用来存储记录下来的声音振幅的位数。样本大小决定着声音的动态范围。多媒体PC的最低标准要求样本大小为8位。 如果要达到激光唱盘的质量,样本大小为16位、立体声,一秒钟为176400字节。
第一章 多媒体技术概论 图像要求很高的存储量 例1:扫描仪的分辨率为300dpi,一幅静止的A4幅面的黑白图像,数据量可在1Mb。 例2:我国彩电制式为PAL-D,场频为50HZ,625行,屏幕宽高比为4/3,采样隔行扫描,则一幅静止画面含有: (625*(4/3)*625/2约等于260000个像素 如果每个像素经过采样量化成24位,则每个场画面的信息量是: 6.24*24b=6240000b=6.2Mb 传输数据的速率可高达: 6.24*50Mbps=312Mbps 若想在多媒体系统中将电视画面存贮下来,用1Gb的光盘只能 存贮3秒钟左右的电视图像. 可见多媒体系统不仅要求很大的存储量,同时又必须对图像进行动态一静态的压缩,才能使多媒体系统实际可用。
第一章 多媒体技术概论 1.4多媒体网络应用技术 1.4.1局域网LAN 1.定义与功能 能够把分散在一个建筑物或相邻几个建筑物中的计算机、终端、带大容量存储器的外围设备、控制器、显示器以及连接其它网络而使用的网络连接器等相互连接起来,以很高的速率(1~20Mbps)进行通信。 局域网的组成: 计算机及智能型外围设备 网络接口卡及电缆 网络操作系统及有软件 局域网主要功能: 设备共享 信息共享 分布式处理 提高兼容性 可进行高速数据通信,也可进行多种媒体信信的通信 安全性
第一章 多媒体技术概论 2.局域网应用关键技术 (1)通信技术 传辅介质 局域网的拓扑结构 信息传输方式及信号变换方式 (2)局域网的访问控制方式和通信协议 必须采用能合理解决访问冲突的控制方法 通信协议 (3)网络操作系统(NOS) 其主要特性有: 硬件独立 桥连接 能支持多个服务器 多用户支持 网络管理 安全性及存取控制 用户界面
第一章 多媒体技术概论 1.4.2广域网WAN 是在较大范围内将计算机连接直来的计算机网络 广域网一般只使用每秒钟数千位的速度进行通信 远程通信协议比较复杂,要占用电信线路 当使用电话线路传输数据时,由于只能传输摸拟信号,所以必须使用调制解调器(Modem) 广域网的关键技术除远程通信传输介质、传输方式及传输环境外,多媒体通信标准是十分重要的。 1.4.3因特网(Internet)的发展 早期WAN技术和LAN技术互不兼容,导致相互隔离 美国国防部在其高级研究计划ARPA研究中的一个关键思想是采用新方法将LAN和WAN连接起来成为互连网(Internetwork) 1980年,发展成为一个充满活力的网络系统
第一章 多媒体技术概论 1983年,连机数562台 1993年,连机数1200000台,成为世界上最大的网络 1994年,平均每隔30秒就有一台计算机入网 当今,Internet 代表着全球范围内一组无限增长的信息资源,它像一个覆盖全球的巨大藤蔓,把全世界人们联系在一直成为地球村。 Internet 改变了科学家的科研方式 中国在1994年加入Internet ,是第71个加入Internet的国家 1.4.3Internet提供的服务方式 (1)基本服务 电子邮件(E-mail) 文件传输(FTP) 远程登录(Telnet) (2)扩展服务 ①基于电子邮件的服务: 电子公告板(BBS) 新闻群组(News Group) 电子期刊(Electronic Journal)
第一章 多媒体技术概论 ②名录服务: 白页服务: 查找个人E-mail地址 黄页服务: 查找提供各种服务的主机IP地址 ③索引服务: 利用关键字查找信息的工具Archive 查询Gopher服务器的Veronica 广域网信息服务(WAIS) ④交互式服务: Gohper 基于多种菜单的交互式检索工具 WWW 基于超文本结构的多媒体检索工具 Internet的功能和服务使其迅速成为全世界的通信服务系统, Internet的出现是人类通信进化的重要里程碑。
第二章 多媒信息的表示 多媒体数据具有的特点 ①数据量巨大 ②数据类型多 ③数据类型间区别大 • 不同媒体的存储量差别大 • 不同类型的媒体由于内容和格式不同相应的管理、处理方法和解释方法也不同; • 声音和动态影像视频的时基媒体与建立在空间基础上的信息组织方法有很大不同 ④多媒体数据的输入和输出复制 多媒体数据输入方式分为两种: • 多通道异步输入方式 指在通道、时间都不相同的情况下,输入各种媒体数据并存储并存储,最后按合成效果在不同的设备上表现出来。 • 多通道同步输入方式 指同时输入媒体数据并存储,最后按合成效果在不同的设备上表示出来,由于涉及的设备较多,因此较为复杂。
第二章 多媒信息的表示 2.1文 字 • 文字是人与计算机之间进行信息交换的主要媒体,在现实世界中,文字是人们进行通讯的主要形式,文字主要包括西文与汉字 2.1.1西 文 • 西文采用ASCII码表示(ASCII码是美国信息交换用标准代码) • ASCII码是一个由7位二进制位组成的字符编码系统,共128个字符,每个ASCII码占一个字节的存储量,每个字节的最高位为0,形似:0******* 2.1.1汉 字 1.汉字的输入编码 (1)数字编码(典型编码:区位码) (2)拼音码(典型编码:智能ABC,全拼,微软拼音) (3)字型编码(典型编码:五笔字型)
第二章 多媒信息的表示 2.汉字内码 • 是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示,每个字节的最高位都为1,编码形似1*******1******* 3.汉字字模码 • 用点阵表示的汉字字形代码,它是汉字的输出形式. • 根据汉字输入的要求不同,点阵的多少也不同,简易汉字为:16*16点阵,提高型汉字为24*24点阵、32*32点阵,甚至更高。 • 字模点阵只能用来构成汉字库,不能用于机内存储,字库中存储了每个汉字的点阵代码,当显示或打印输出时才检索字库,输出字模点阵,得到字形。
第二章 多媒信息的表示 2.2音 频 • 音频(Audio)指的是大约在20hz~20khz的频率范围,但实际上“音频”常常被作为“音频信号”或“声音”的同义词,是属于听觉类媒体,主要分为波形声音、语音、和音乐。 1.波形声音 • 所谓波形声音,实际上是包含了所有的声音形式。 • 在计算机中,任何声音信号都要首先对其进行数字化,并能准备确地恢复出来 2.语 音 • 人的声音不仅是一种波形,而且还有内在的语言、语音学的内涵,可以利用特殊的方法进行抽取。 3.音 乐 • 音乐是符号化了的声音。这种符号就是乐曲,乐谱是转化为符号的媒体的声音。MIDI是十分规范的一种形式。
第二章 多媒信息的表示 4.声音的三要素 • 音调:与频率有关 • 音强:与幅度有关 • 音色:由混入基音的泛音所决定 • 没有时间也就没有声音,声音数据具有很强的前后相关性,数据量大、实时性强,又由于声音是连续的,所以通常把其称为连续型时基媒体类型 2.2 .1数字音频 • 数据音频是指音频信号用一系列数字表示,其特点是保真度好,动态范围大。 • 在计算机内的音频必须是数字形式的,因此必须把模拟信号转换成有限个数字表示的离散序列,即实现音频数字化。 • 音频数字化技术中,要考虑采样、量化和编码的问题。
第二章 多媒信息的表示 • 一个音频信号转换成在计算机中的表示过程如下: ①选择采样频率,进行采样 ②选择分辨率,进行量化 ③形成声音文件 1.采样(Sampling) • 有时也称之为数字化,其作用是把时间上连续的信号,变成在时间上不连续的信号序列,即通常的A/D(模/数)转换。 • 其功能是将模拟信号变成数字信号。 • 采样的频率至少高于信号最高频率的2倍。 • 采样的频率越高,声音“回放”出来的质量也越高,但是要求的存储容量也越大。 • 多媒体中,对于高频,最常用有三种采样频率 44.1khz 22.05khz 11.025khz 其中22.05khz和44.1kz采样是最常采用频率。
第二章 多媒信息的表示 2.分辨率 • 分辨率是指把采样所得的值(通常为反映某一瞬间声波的幅的电压值)数字化,即用二进制来表示模拟量。进而实现模/数转换。 • 用来表示一个电压模拟值的二进制位越多,其分辨率也越高。 • 在多媒体中,对于音频,分辨率可采用16位,其对应有65536个量化级。 3.声间文件 • 要求声音的质量越高,则量化级数和采样频率也越高,为了保存这一段声间的相应文件也就越大,也就是要求的存储空间越大。 • 声间通道的个数表明声间记录是只产生一个波形(单声道)还是产生两个波形(立体声双声道)
第二章 多媒信息的表示 • 对于单声道,决定数字录音文件大小的化式为: S=R*D*(r/8)*1 S表示文件的大小,单位为字节; R表示采样速率,单位为Hz,也可以叫采样频率; D表示录音的时间,单位为秒(S); r表示分辨率,单位为二进制位(bit); 1表示对应的单声道; /8是为了把二进制位换算成以字节作为单位; • 对于立体声,决定数字录音文件大小的公式为: S=R*D*(r/8)*2 2表示对应立体声,也就是说立体声的文件大小为单声道的两倍。
第二章 多媒信息的表示 • 例:采样频率为44.1khz,分辨率为16位,立体声,录音的时间长度为10S情况下,文件的大小S为: S=(44100*10*16/8)*2B=1764kB • 在多媒体技术中,存储声音信息的常用文件格式主要有:WAV文件、VOC文件、MIDI文件、AIF文件、SND文件和RMI文件等 (1)WAV文件 • WAV是Microsoft公司的音频文件格式;利用Sound Finder可以将AIF、SND、VOD文件转换到WAV格式; • WAV文件来源于对声音模拟波形的采样; • WAV文件是由采样数据组成的, • WAV文件所需存储容量相当大;
第二章 多媒信息的表示 (2)VOC文件 • VOC文件是Creative公司波形音频文件格式; • 也是声霸卡使用的音频文件格式; • 每个VOC文件由文件头块和音频数据块组成; • 文件头包含一个标识、版本号和一个指向数据块开始的指针; • 数据块分成各种类型的子块,如声音数据、静音、标记、ASCII码文件,重复的结束、重复、终止标记、扩展块等; • 现说明VOC格式音频文件的文件头如下: • 00H~13H文件类型说明,共19个字节,包含如下正文: Creative Voice File 最后是EOF(1AH)字节; • 14H~15H其值为001AH;
第二章 多媒信息的表示 • 16H~17H文件的版本号,小数点后面的部分在前,如版本号为1.10,则这两个字节内的值为0A01; • 18H~19H是一个识别码,由这个代码可以检验其文件是否为真正的VOC文件。其值为16H和17H单元中所存文件版本号的反码再加上1234H。 例如:版本号为1.10,010A的反码是FEF5H,则这个代码为: FEF5H+1234H=1129H • 利用声霸卡提供的软件可实现VOC和WAV文件的转换 (3)MIDI文件 • MIDI 是一种技术规范; (4)其它音频文件 • 最重要的是PCM格式,是模拟的音频信号经数模转换直接形成的二进制序列,没有附加文件头和结束标志。
第二章 多媒信息的表示 • 在声霸卡提供的软件中,可利用VOC-HDR程序,为PCM格式的文音频文件加上文件头,而形成VOC格式 • Windows是convert工具也可以将PCM音频文件转换成WAV格式; • AIF是Apple计算机的音频文件格式; • Windows的convert工具可以把AIF格式的文件转换为WAV格式的文件; • 在windows操作系统下中,配置声间文件的操作如下: • 双击“控制面版”中“多媒体”图标,打开“多媒体属性”对话框; • 在“录音”项目中选择[自定义]按钮,可以更改录音的收音质量的“采样频率”、“量化位数”、“声道”,“每秒中所需字节”; • 按下[确定]按钮,设置结束 • 还可选择“电话质量”或“CD质量”;
第二章 多媒信息的表示 2.2 .2乐器数字接口(MIDI) • 声间有两类:一类是直接获取的声音,一类是合成声间。合成声间可以是音乐或语言,合成声音与MIDI有紧密的联系,并已形成标准,而合成语言目前还未形成标准。 • MIDI是乐器数字接口的英文缩写。 • MIDI是80年代提出来的是,数字音乐的国际标准。 • MIDI实际上是一段音乐的描述,当MIDI信息通过一个音乐或声音合成器进行播放时,该合成器对一系列的MIDI信息进行解释,然后产生出相应的一段音乐或声音。 • MIDI能提供详细描述乐谱的协议(音符、音调、使用什么乐器等)
第二章 多媒信息的表示 • MIDI规定了各种电子乐器和计算机之间连接的电缆和硬件接口标准及设备之间数据传输过程; • 任何电子乐器,只要有处理MIDI信息的处理器并配以合适的接口,均可成为一个MIDI设备; • 简明的MIDI信息可产生复制的声间或在乐器或在声音合成器上产生出美妙的音乐; • MIDI信息是数字化的乐谱,音符序列、定时及合成音色的乐器定义组成。 1.MIDI文件 • 记录MIDI信息的标准格式文件称不MIDI文件,其中包含音符、定时和多达16个通道的乐器定义以及键号、通道号、持续时间、音量和击键力度等各个音符的有关信息。
第二章 多媒信息的表示 • 音序器:是一种为MIDI作曲而设计的软件或设备,可用来记录、播放及编辑MIDI事件,大多数音序器可输入输出MIDI文件。 • 合成器:是一种使数字信号处理器或其它音乐和声音芯片的设备,由合成器将这些信息转换成某种乐器的声音、合成音色及持续时间,再通过生成并修改波形将它们送至声音发生器和扬声器中输出。 • 由于MIDI文件是一系列指令而不是波形数据的集合,所以其要求的存储空间较小。一个两分钟的MIDI文件仅需8KB的空间。所以在设计多媒体应用和播放指定音乐时带来很大灵活性。
第二章 多媒信息的表示 1.MIDI作品 • MIDI作者可以购买现成的产品,也可以自己制作。 • 开发自己的MIDI作品,除了必须拥有计算机方面的知识与设备之外,还需要具备专业音乐知识和专用工具。 • 一般情况下,可以使用一个电子键盘乐器和MIDI音序器来逐步完成作品的旋律、低音和弦及打击乐器的配乐,并反复演奏、录制、播放及编辑,直到满意为止。 • MIDI文件有三种存放格式:格式0、1和2 • 格式0仅支持单音轨 • 大多数音序器支持格式0和格式1 • 一旦总谱存入了MIDI文件,便可以从应用程序中播放了。
第二章 多媒信息的表示 2.2 .3数字化声音和MIDI的比较 • 数字化声音是声音的实际表示,代表的声音的瞬时幅度,与设备无关,每次播放时都发出相同的声间,一致性好,但数据文件要求较大的存储空间,代价较高。 1.MIDI数据优点: • 文件紧凑,所占空间小,MIDI文件的大小与回放质量完全无关;通常MIDI文件是CD质量的数字化声音文件大小的200份之1到1000份之1。 • 在某些情况下,如果所用的MIDI声源较好,MIDI有可能发出比数字化声音质量更好的声音 • 在不需要改变音调或降低音质的情况下,可以通过改变其速度来改变MIDI文件的长度。MIDI数据是完全可编辑的,可以用多种方法来处理它的每一个细节。 • 创建MIDI作品,要有计算机知识还要掌握一定的音乐理论知识。 • 在应用软件和系统软件支持方面有更多的选择。
第二章 多媒信息的表示 2.MIDI数据缺点: • 因MIDI数据并不是声音,仅当MIDI回放设备与产生时所指定设备相同时,回放结果才是精确的。 • MIDI不能很容易地用来回放语言对话。 3.数字化声音和MIDI之间的选择 (1)选择MIDI • 由于没有足够的RAM、硬盘空间或CPU处理能力 • 具有高质量的声源; • 对回放的硬件有完全的控制 • 没有语言对话的需要 (2)选择数字化声音 • 对回放硬件没有完全的控制 • 有足够的计算机资源处理数字文件 • 有语言对话的需要。
第二章 多媒信息的表示 2.3视觉媒体 • 能够利用视觉传递信息的媒体都是视觉媒体。位图图像、矢量图形、动态图像、符号等都是视觉媒体。 2.3.1位图图像 • 位图图像是指在空间和亮度上已经离散化的图像; • 像素:一个位图图像是由一定的像素构成,每个像素可以具有不同的颜色和亮度,是能独立地赋予颜色和亮度的最小单位; • 位图图像适用于逼真照片或要求精细细节的图像; • 位图图像总是以压缩的方式进行存储,以节省内存和磁盘空间; • 静态图像是多媒体应用系统中最重要的元素。
第二章 多媒信息的表示 1.位图的概念 • 一个图像是由若干点组成的矩阵,矩阵中的每一个元素就是像素值,像素值反映了对应像素的某些特性,而这个矩阵就称之为位图。 • 位图是一个用来描述像素的简单的信息矩阵。 2.位图的产生方法 (1)用画图程序获得 (2)用荧光屏抓取程序从荧光屏上直接抓取,然后加到画图程序或应用程序中; (3)用扫描仪或数字化的视频图像抓取设备从照片、艺术品或电视图像抓取; (4)购买现成的图像库;
第二章 多媒信息的表示 3.位图处理 (1)图像的抓取 (2)图像的编辑:windows画图程序,Photoshop等 4.图像压缩 • 图像的数据量很大,需经过压缩后再进行存储; • 采用无损压缩,压缩比不会太高; • 采用有损压缩,则可能对图像的质量有影响; • 为了减少压缩和解压的时间,通常采用硬件来完成; 5.图像优化 • 如果原始采集的图像质量不好或者由于外界噪声影响而产生杂色、杂斑等,则就应该采用图像优化技术; • 通过对图像的增强、噪声过滤、畸变校正、亮度调整和色度调整等优化技术,可获得满意的图像
第二章 多媒信息的表示 2.3.2矢量图形 • 图形:是一种抽象化的图像,是把图像按某个标准进行分析而产生的结果。它不直接描术数据的每个点,而是描述产生这些点的过程和方法,通常将图形称之为矢量图形。 • 矢量图形:是用一个指令集合来描述构成一幅图像所包含的直线、矩形、圆、圆弧、曲线等形状、位置、颜色等各种属性和参数。 • 产生矢量图形的程序通常称为绘图程序 • 把矢量图像构成的图画变成位图的方法简单,只要在保存图画时,把矢量图变换成位图就可以了。 • 把位图变换成矢量图则比较困难。 • 矢量图有许多用处,比如,计算机辅助设计系统中常用知量图对象系统来创造一些十分复杂的几何图形和三维动画。
第二章 多媒信息的表示 2.3.3矢量图与位图比较 1.空间 • 矢量图的存储量远远小于位图的存储量。 2.性能 • 对于复杂的图像,用位图比用矢量图画对象速度快。 2.3.4监视器与颜色 • 为了得到较好的多媒体效果,在计算机至少要配置256色的VGA图形以上的适配器和监视器。 1.监视器分辨率 (1)屏幕分辨率 (2)图像分辨率 (3)像素分辨率
第二章 多媒信息的表示 2.颜色 • 颜色是多媒体的重要组成部分。 • 人的眼晴对红、绿、蓝敏感,通过调节这三种颜色的组合成分使人的眼睛和大脑感受到各种类似以物理上的各种颜色。 • 监视器上像素的颜色常用红、绿、蓝的总量来表示 • 计算机中用来确定颜色的模型有: RGB,HSB,HSL,CMYK,CLE等 2.3.5 图像文件的格式 • Windows中最常用的图像文件格式是:DIB,BMP,PCX和TIFF。 • BMP文件是Windows的位图文件; • PCX文件原来是开发来用于MS-DOS的绘图软件包中用; • TIFF是按通用位图图像格式设计的;
第二章 多媒信息的表示 • 各种图像文件格式之间,可以用实用程序CONVERT来进行相互转换的,在安装该实用程序时,要加上Microsoft的多媒体扩展名。 • 在一些文件中,位图和矢量图可以并存,SuperCard或Canvas都可以使用这一特性。为了在很多平台止处理绘 图对象,存在两种常用的格式:DXF和IGS。 • DXF是由AutoDesk公司所开发的,作为AutoCAD中的ASCII绘图交换文件,这一格式现在也为许多计算机辅助设计的应用所使用。 • IGS是由一个工业委员会开发的,作为传递CAD图的一个广泛的标准 • 这些格式也用在三维演和动画程序中。
第二章 多媒信息的表示 2.4动画(Animation) • 动画是指运动的画面,动画在多媒体中是一种非常有用的信息交换工具。 • 动阵的研究始于20世纪60年代初期; • 1963年Bell实验室制作了第一部计算机动画片; • 三维动画研究始于70年代初,真正进入实用化还是80年代中后期。 • 90年代初,计算机动画技术成功应用于电影特技。取得了出色成就。 2.4.1视觉暂留 • 动画之所以成为可能,是因为人类的眼睛具有一种所谓“视觉暂留”的生物现象;在观察过物体之后,物体的映像将在人眼的视网膜上保留一短暂的时间。即如果以足够快的速度不断、而且每次略为改变物体的位置和形状,眼睛将感觉到物体在连续运动。
第二章 多媒信息的表示 2.4.2造型动画和帧动画 • 用计算机实现的动画有两种,一种为帧动画,另一种为造型动画。 • 帧动画是由一幅幅连续的阵面组成的画像或图形序列,这是产生动画的基本方法。 • 造型动画是对每一个活动的对像分别进行设计,并构造每一对象的特征,然后用这些对象组成完整的画面。 2.4.3技术参数 1.帧速度:一般帧速度选择为每秒30帧或每秒25帧 2.数据量:在不计压缩情况下,数据量是指帧速度乘以每幅图像的数据量。 3.图像质量:图像质量与压缩倍数有关,一般来说,压缩比较小时对图像质量不会有太大的影响,但超过一定的倍数后,将会明显看出图像质量下降
第二章 多媒信息的表示 2.5超文本与超级媒体 • 在阅读文本时只能逐页阅读,体现单一路径,而人类记忆的互连网状结构使得人们有多种路径、不同的联想检索,必然导致不同的路径;因此,类似人类的联想记忆结构,即超文本被提出并迅速发展。 • 超文本提供了将声、文、图结合在一起综合表达信息的强有力手段,同时也提供了直观、灵活的人机交互方法,开拓了许多应用领域,是多媒体应用的效工具。 2.5.1基本概念 信息结点: 超文本不是顺序的,而是一个非线性的网状结构,它把文本按其内部固有的独立性和相关性划分成不同的基本信息块,称之为结点。
第二章 多媒信息的表示 超文本: 超文本被定义为由信息结点和表示信息结点间相关性的链构成的一个具有一定逻辑结构的网络 超文本系统: 基于超文本信息管理技术组成的系统称为超文本系统。其特点如下 • 在用户界面中包括对超文本的网络结构的一个显示方式,即向用户展示结点和链的网络形式; • 向用户给出一个网络结构动态图,使用户在每一时刻都可以得到当前结点的邻接环境; • 在超文本系统中一般使用双向链,这种链应支持跨越各种计算机网络,如局域网和广域网等; • 用户可以通过联想和感知,根据需要动态地改变网络的结点和链,以便对网络中的信息进行快速、直观、灵活的访问,这种联想和感知是被准确地定义的并要求好的性能/价格比; • 尽可能不依赖于它的具体特性、命令或信息结构,而更多地强调它的用户界面的“视觉和感觉”。
第二章 多媒信息的表示 超媒体: 超媒体=超文本+多媒体;结点信息除文字、数值外,还可以是图形、图像、声音等多媒体信息,使超文本实际上也包含了多种媒体信息。 2.5.2超文本的主要成分 1.结点: 结点是超文本表达信息的一个基本单位,其大小可变,结点的内容可以是文本、图形、图像、音频和视频等,也可是一段程序。 在超文本中系统中,把结点分成不同类型,不同类型的结点表示不同的信息,结点的基本类型如下: 文本结点 图形结点 图像结点 声音结点 视频结点 混合媒体结点 按钮结点 索引文本结点 索引结点 对象结点 规则结点
第二章 多媒信息的表示 2.链: 链也是组成超文本的基本单位,形式上是从一个结点指向另一个结点的指针,表示不同结点存在的信息的联系;链定义了超文本的结构并提供浏览和探索结点的能力,链和结点可以存储在一起,使链嵌入结点中,也可以分开单独存储。 链的结构: 链源、链宿、链的属性 链源: 链源是导致结点信息迁移的原因,可以是热字、热区、图元、热点、媒体对象或结点等。 链宿: 指链的目的地,一般都为结点。 链的属性决定了链的类型,这是链的主要属性,还有一般属性,便如链的版本、权限等 链的属性: 链的类型: 基本链 移动链 缩放链 全景链 视图链 蕴含链 执行链 索引链 Is_a链 Has_a链
第二章 多媒信息的表示 2.5.3超文本系统的结构 1988年,Campbell和Goodman提出了超文本体系结构的三层模型理论 1.数据库层: 涉及所有的有关信息存储的问题。 2.超文本抽像机层: 确定超文本系统的结点和链的基本特性及它们之间的自角联系和其他属性 3.用户接口层: 是构成超文本系统特殊性的重要表示,并直接影响着超文本系统的成功。具有简明、直观、生动、灵活、方便等特点 目前较流行的接口风格: 菜单选择方式 命令交互方式 图示引导方式
数据压缩的基本原理 第三章 多媒信息的表示 • 在多媒体信息中包含大量冗余信息,把这些余冗信信去掉,就实现了压缩。 • 数据压缩技术有三个重要指标: • 压缩后所需的信息存储量之比要大; • 实现压缩的算法要简单,压缩、解压速度要快,尽可能地做到实时压缩和解压; • 恢复效果要好,要尽可能的完全恢复原始数据。 3.1数据压缩的基本原理 • 目前常用的压缩编码方法分为两类: • 目前常用的压缩编码方法分为两类: • 无损压缩法(熵编码)(冗余压缩法)(可逆) • 有损压缩法(熵压缩法)(不可逆) • 熵:定义为平均信息