430 likes | 606 Views
计算机数字图像基础. 浙江理工大学 纺织工程实验教学示范中心. 计算机数字图像基础. 颜色与颜色空间 颜色 色彩空间 数字图像 图像文件格式. 牛顿色圆. 通过三棱镜可以把日光分为红、橙、黄、绿、蓝、紫等色光. 一、 颜色与颜色空间. 1 颜色 光波:光是一种按波长辐射的电磁波。. 光的物理性质:波长(光速,频率)和幅度 人眼对色彩的感觉:色调、饱和度和亮度. 2. 颜色度量:色调、饱和度、亮度. 色调 hue: 色调 (hue) 又称为色相, 人眼感觉到物体反射或发射光波的波长。 指颜色的外观 分类红、橙、黄、绿、青、蓝、紫
E N D
计算机数字图像基础 浙江理工大学 纺织工程实验教学示范中心
计算机数字图像基础 • 颜色与颜色空间 • 颜色 • 色彩空间 • 数字图像 • 图像文件格式 牛顿色圆 通过三棱镜可以把日光分为红、橙、黄、绿、蓝、紫等色光
一、 颜色与颜色空间 1 颜色 • 光波:光是一种按波长辐射的电磁波。 • 光的物理性质:波长(光速,频率)和幅度 • 人眼对色彩的感觉:色调、饱和度和亮度
2. 颜色度量:色调、饱和度、亮度 • 色调hue: • 色调(hue)又称为色相,人眼感觉到物体反射或发射光波的波长。 指颜色的外观分类红、橙、黄、绿、青、蓝、紫 在色谱中,色调连续变化
饱和度saturation • 指颜色的纯正程度。 • 与亮度有关:某一色调参入白光,色调不变但饱和度降低 • 与参入其它颜色的光有关:饱和度与色调都会改变。 半径表示法 不完全饱和完全饱和不完全饱和
同一物体因受光不同会产生明度上的变化 亮度:人眼感受到的颜色的光的强度 • 同一种色块,在不同强度的白光照射下, 反射的光波波长一样(色调相同),但人眼感觉到的颜色不同。 • 某一颜色的光,量度很弱,趋于黑色, 反之,趋于白色。
HSB色调-饱和度-明度颜色空间 3 颜色空间 • 颜色空间是表示颜色的一种数学模型 • 人们构造了各种各样的颜色空间,以适应不同的应用场合。 • RGB: 显示器信号 • HSB:人眼识别 • CMY:彩色印刷 • YUV:电视信号 • 非线性的颜色空间 • 线性的颜色空间
RGB模型用三维空间中的一个点来表示一种颜色 每个点有三个分量,分别代表该点颜色的红、绿、蓝亮度值,亮度值限定在[0, 1]。 当三基色等量相加时,得到白色 颜色相加:发光物提发出某些波长的光波,这些波长的光波叠加在一起。 RGB颜色空间 颜色=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比) 计算机显示器用红R、绿G、蓝B光的组合产生颜色,(R,G,B)的值唯一地确定在显示器上的显示颜色,三种颜色构成了三维空间坐标RGB 颜色空间。
HSB(Hue, Saturation/Chroma,Brightness/Intensity)颜色空间 • HSB比较容易为画家所理解,减少彩色图像处理的复杂性。 • 合乎人对彩色的认识: • -色彩:色调、饱和度 • -亮度:非彩色属性,对应黑白图像的灰度。
Munsell颜色系统 • 清楚地把明度(指Munsell value)从色调和饱和度(指Munsell chroma)中区分开来。这样就可以用二维空间表示颜色,如色圆。 • 统一了对颜色的认识,使颜色样本之间的距离与感知的颜色差异相一致。 • 为颜色交流语言提供了一个清晰而不含糊的表示法。在Munsell颜色系统中,每一种颜色都有一个指定的位置。
CMY彩色空间 颜料的特性刚好和光线相反,颜料是吸收光线,因此颜料的三原色必须红绿蓝的补色:青、品红与黄色(CMY) CMY相减混色模型 彩色打印、彩色印刷,数码印花 CMYK: 在上述三色的基础上,增加黑色 由于彩色墨水和颜料的化学特性,用等量的三基色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色(black ink),所以CMY又常表示为 CMYK。
CIE 颜色空间 RGB模型模型。每一种设备(包括 人眼和现在使用的扫描仪、监视器和打印机等)使用RGB模型时都有不太相同的定义,尽管很直观,但不能通用。 • 1).CIE 1931 XYZ 设备相关 为了从基色出发定义一种与设备无关的颜色模型,1931年9月,国际照明委员会定义了CIE XYZ基色系统: 选择三个理想的原色(三刺激值)X、Y、Z,X代表红原色,Y代表绿原色,Z代表蓝原色,这三个原色不是物理上的真实色,而是虚构的假想色,更适用于颜色的计算。 设备无关 图 CIE 1931 XYZ颜色空间
y 非均匀的色度空间 x CIE 1931 XYZ色度图 是视觉非均匀的色度空间 在颜色空间中两种颜色之间的距离与这对两种颜色感知的色差有差异。
2). CIE 1976 LAB 颜色空间 均匀的色度空间 • CIE 1976 Lab 是 CIE 1931 XYZ颜色空间的一种数学变换。颜色由亮度或光亮度分量L 和a、b两个色度分量组成 . • 对颜色的描述与视觉感知更加符合。光亮度、色调和饱和度都能够独立调整,在不改变整个图像或者亮度的情况下,可以改变整个图像的颜色。 • 与监视器、打印机、计算机或者扫描仪等设备无关,因此可以生成一致的颜色,创作和输出一致的彩色图像。 • 是使用最广泛的物体颜色度量方法。
色卡 PANTONE(潘通)国际色标 • PANTONE 配色系统,英文名为 PANTONE MATCHING SYSTEM(曾缩写为PMS) • Pantone是美国著名的油墨品牌,。是享誉世界的涵盖印刷、纺织、塑胶、绘图、数码科技等领域的色彩沟通系统,已经成为事实上的国际色彩标准语言。 纺织/印染行业用PANTONE产品 潘通纺织品颜色手册-棉布版 世界任何地方的客户,只要指定一个PANTONE 颜色编号,就可找到他所需颜色的色样,无须臆测, 避免电脑屏幕颜色及打印颜色与客户实际要求的颜色不可能一致所引起的麻烦。
二、数字图像的基本属性 • 图像的属性包含分辨率、像素深度、真/伪彩色、图像的表示法和种类等。 1.分辨率 (像素和实际尺寸的关系) 分辨率是和图像相关的一个重要概念,它是衡量图像细节表现力的技术参数。 由图像中每个像素的颜色、亮度等信息按照矩阵的形式紧密排列构成。 • 位图显示:图中一个像素,对应显示器中一个像素。 • 图像分辨率:每英寸长度像素点的数量。 • 显示器分辩率:屏幕在横向与纵向上显示的点数:如1024*768,800*600 以每英寸的像素数(DPI)(Dots Per Inch)来衡量
不同的分辨率会造成不同的图像清晰度 图像A:200dpi 图像B: 图像C:图像B放大四倍,50dpi
设备分辨率(Device Resolution) • 又称输出分辨率,指的是各类输出设备每英寸上可产生的点数,如显示器、喷墨打印机、激光打印机、绘图仪的分辨率。 • 屏幕分辨率 • 显示器上每单位长度显示的像素或点的数量称为屏幕分辨率。通常以每英寸点数(dpi)来表示。 • PC显示器的设备分辨率在60至120DPI之间 • 打印机分辨率 • 打印机分辨率又称输出分辨率,是指打印机输出图像时每英寸的点数(dpi)。 • 打印设备的分辨率则在360至3600DPI之间。 • 也有用LPI标示(每英寸网线数) • 挂网输出 ,要模拟256级灰度变化,就需要有16×16=256个打印点构成一个半色调点。720DPI只能达到720/16=45 LPI的输出分辨率。
图像分辨率、显示分辨率、像素、图像大小 之间的关系 • 例如: • 一幅图像,800* 600 像素, • 分辨率为100DPI, • 图像实际尺寸宽8英寸、高6英寸。 • 将分辨率降为50 DPI,在宽高比不变的情况下,图像的实际尺寸将变为宽16英寸、高12英寸。 • 将这二副图送入计算机显示器,我们会发现这两幅图显示的画面尺寸一样,画面质量也没有区别。 • “所见即所得”(WYSIWYG),做到在显示设备、打印输出设备上输出真实大小的尺寸。
2.图象的位分辨率(Bit Resolution) 又称位深, 像素深度,指存储每个像素所用的位数,它也是用来度量图像的分辨率(颜色分辨率)。 这种分辨率(像素深度)决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。决定可以标记为多少种色彩等级的可能性。 常见的有1位、8位、16位、24位或32位色彩。有时我们也将位分辨率称为颜色深度。 所谓“位”,实际上是指“2”的平方次数,8位即是2的八次方,也就是8个2相乘,等于256。所以,一副8位色彩深度的图象,所能表现的色彩等级是256级。
三、真彩色和伪彩色 • 1. 真彩色(true color) • 真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。 • 例如用RGB 5∶5∶5表示的16位彩色图像,R,G,B各用5 位,用R,G,B分量大小的值直接确定三个基色的强度,真颜色数目为215 = 32K • 如果用RGB 8:8:8方式表示的24位彩色图像,就是R,G,B都用8位来表示,每个像素的颜色就是由这3个字节中的数值直接决定,可生成的颜色数就是224=16 777 216 种。 • 真彩色图通常是指RGB 8:8:8,即图像的颜色数等于224,也常称为全彩色(full color)图 像。
2. 伪彩色(pseudo color),索引色 • 每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作颜色查找表(color look-up table,CLUT ,也称为调色板 Pallette)的表项入口地址,去查找一个显示图像时使用的R,G,B值。 • 像素的颜色是用像素值作为在颜色查找表中的索引,也就是说像素仅仅是颜色查找表中的一个索引,因此,这类图像称为索引图像或伪彩色图像。 • 常见的1位、4位、8位彩色图像,都是索引色的图像,因此图像文件中都带有。 • 灰度的图像,4位、8位不是索引色。 • 对于8位的彩色图像,如果颜色查找表CLUT是RGB 8:8:8的话, 相当于在224=16777216 种颜色中取出256种颜色组成图像.
3.图像数据的容量 • 在扫描生成一幅图像时,实际上就是按一定的图像分辨率和一定的图像深度对模拟图片或照片进行采 样,从而生成一幅数字化的图像。图像的分辨率越高、图像深度越深,则数字化后的图像效果越逼真、图像数据量越大。 • 如果是按照像素点及其深度映射的图像数据大小可用下面的公式来估算: • 图像数据量=图像的总像素×图像深度/ 8 (Byte) • 一幅1027×768、真彩色的图像,其文件大小约为: 1024×768×24/ 8 = 2.3 MByte;
四、图像的种类 1.位图(bit mapped image) • –由图中每个像素的数据组成。 • –每个像素的数据包括:颜色、亮度、属性 • –不宜修改、文件大、显示速度快 • 2. 矢量图(vector based image) • –每个矢量是一个图形实它具有颜色、形状、轮廓、大小、位置等属性。如:点、 圆、线,… • –矢量属性可以调整。如:颜色、大小、位置 • –AutoCAD、CoreDraw 等绘图软件都是基于矢量的系统。 • –易于修改、文件小、不宜用于复杂图像
位图种类 • 黑白图像 2.灰度图像 3 . 索引图像 4. 真彩色图像 4. 真彩色图像
五、图像数据压缩 • 无损压缩 • 无损压缩:压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同;无损压缩算法一般可以把普通文件的数据压缩到原来的1/2~1/4。 • 有损压缩 • 压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不会让人对原始资料表达的信息造成误解。 • 有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。例如,图像和声音的压缩就可以采用有损压缩,因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。
1 无损压缩 • RLE编码 (Run Length Encoding )行程编码) ,PCX ,TIFF, PNG 假定有一幅灰度图像,第n行的像素值 用RLE编码 80315084180 代码中用红色数字表示的数字是行程长度,后面的数字代表像素的颜色值。例如红色数字50代表有连续50个像素具有相同的颜色值,它的颜色值是8。 对比RLE编码前后的代码数可以发现,在编码前要用73个代码表示这一行的数据,而编码后只要用11个代码,压缩比为7:1。这说明RLE确实是一种压缩技术,而且这种编码技术相当直观,也非常经济,效率高,速度快。 有可能增大
第二类词典算法. 从输入的数据中创建一个“短语词典”,编码过程中遇到已经在词典中出现的“短语”时,编码器就输出这个词典中的短语的“索引号”---LZ78算法 词典编码和LZW • 霍夫曼(Huffman)编码 • LZW编码 ZIP,RAR GIF ,TIFF, PNG 第一类词典算法.查找是否在以前输入的数据中出现过,然后输出 “指针”---LZ77算法
2 有损压缩 有损压缩原理 1. 人眼对于亮度的敏感程度远远高于色相(H)和色纯度(S) ,也就是说,只要亮度不变,稍微改变色相和色纯度,人们难以察觉。 2. 人眼对于灰度变化敏感, 对于大的块面敏感。如果去掉一些对人不敏感的频率(微小细节),人们不易察觉。 有损压缩 在保存图像时保留了较多的亮度信息,而将色相和色纯度的信息和周围的像素进行合并,合并的比例不同,压缩的比例也不同。保持颜色的逐渐变化,删除图像中颜色的突然变化。 有损压缩技术可以大大地压缩文件的数据,但会影响图像质量。如果要把一幅经过有损压缩技术处理的图像用高分辨率打印机打印出来,那么图像质量就会有明显的受损痕迹。
JPEG算法概要 压缩编码分成三个步骤: • 1、使用正向离散余弦变换(Forward Discrete Cosine Transform,FDCT)把空间域表示的图变换成频率域表示的图。 • 2、使用加权函数对DCT系数进行量化。去掉高频分量,量化是图像质量下降的最主要原因。 • 3、使用霍夫曼可变字长编码器对量化系数进行编码。
压缩效率(单位:bits/pixel) 图象质量 0.25~0.50 中~好,可满足某些应用 0.50~0.75 好~很好,满足多数应用 0.75~1.5 极好,满足大多数应用 1.5~2.0 与原始图象几乎一样 JPEG 压缩比与图象质量的关系
六、图像文件格式 • 数字图像有多种存储格式,每种格式一般由不同的开发商支持。 每一种图像文件均有一个文件头,在文件头之后才是图像数据。文件头的内容由制作该图像文件的公司决定,一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。各种图像文件的制作还涉及到图像文件的压缩方式和存储效率等
1 BMP格式 BMP是英文Bitmap(位图)的简写,它是Windows操作系统中的标准图像文件格式,随着Windows操作系统的流行与丰富的Windows应用程序的开发,已成为PC机Windows系统中事实上的工业标准。常见的各种P C图形图像软件都能对其进行处理。 大部分情况下用非压缩格式存储图像数据,解码速度快,但由此导致了它与生俱生来的缺点--占用磁盘空间过大。 支持1、8、16、24位图像。
2 PCX文件 PCX文件格式由ZSoft公司设计, 是最早支持彩色图像的图像文件格式之一, 由各种扫描仪扫描得到的图像几乎都能保存成PCX格式。PCX支持256种颜色,不如TIF等格式功能强,但结构较简单,存取速度快,压缩比适中,适合于一般软件的使用。 PCX采用特殊的RLE行程编码,文件体中存放的是压缩后的图像数据。 PCX支持RGB索引颜色、灰度和位图颜色模式。图像颜色的位数可以是 1、 4、8 或 24。最早只支持2、16色图像,后来加入256色支持,把256色的调色板放到文件末尾。 PCX 一般只支持8位图像,经过特殊处理(R、G、B按行分别编码存放)可以支持24位图像。 PCX中存放图像X,Y方向的变量是16位的,因此最大只能存放32768*32768大小的图像。
3 TIF图像文件格式 TIFF(Tag Image File Format 标签图像文件格式)是由Aldus为Macintosh机开发的一种图形文件格式,最初是出于跨平台存储扫描图像的需要而设计的。最早流行于Macintosh,现在Windows上主流的图像应用程序都支持该格式。 它是现存图像文件格式中最复杂的一种,它提供存储各种信息的完备的手段, 可以存储专门的信息而不违反格式宗旨,是目前流行的图像文件交换标准之一。 TIFF的特点是图像格式复杂、存贮信息多。正因为它存储的图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原稿的复制。 支持RLE数据压缩格式(黑白图像),和LZW压缩格式,但并非所有软件及输出设备能够支持这个压缩图形文件,因此选用的时候必须要小心。 由于TIFF格式结构较为复杂,兼容性较差,因此有的软件可能不能正确识别TIFF文件。
4 GIF图像文件格式 GIF是英文Graphics Interchange Format(图形交换格式)的缩写。 GIF存储色彩最高只能达到256种。在颜色深度和图像大小上,*.gif类似于*.pcx;在结构上,*.gif类似于*.tiff。 GIF图像文件采取LZW压缩算法,压缩比高,存储效率高,磁盘空间占用较少,所以这种图像格式迅速得到了广泛的应用。 支持多幅图像定序或覆盖,交错多屏幕绘图以及文本覆盖。可以同时存储若干幅静止图象进而形成连续的动画,使之成为当时支持2D动画为数不多的格式之一(称为GIF89a),可指定透明区域,使图像具有非同一般的显示效果。 GIF主要是为数据流而设计的一种传输格式, 目前Internet上大量采用的彩色动画文件多为GIF89a格式文件。 它的最大缺点是最多只能处理256种色彩,图像最大不能超过64 M,故不能用于存储真彩色的图像文件。另外,GIF文件格式受专利保护。
5 JPEG图像格式 JPEG(Joint Photographer’s Experts Group)格式即联合图像专家组, 是由ISO和CCITT为静态图像所建立的第一个国际数字图像压缩标准,主要是为了解决专业摄影师所遇到的图像信息过于庞大的问题。JPEG仅仅是一种俗称而已。 JPEG文件的扩展名为.jpg或.jpeg,其压缩技术十分先进,它用有损压缩方式去除冗余的图像和彩色数据,获取得极高的压缩率的同时能展现十分丰富生动的图像。 JPEG 格式支持 24 位真颜色和8位灰度图像。并保留照片和其他连续色调图像中存在的亮度和色相的显著和细微的变化。 由于JPEG格式的压缩算法是采用平衡像素之间的亮度色彩来压缩的,因而更有利于表现带有渐变色彩且没有清晰轮廓的图像,不适合包含文字或矢量图形的图像。
6 PNG格式 PNG(Portable Network Graphics)是一种新兴的网络图像格式。在1994年底,由于Unysis公司宣布GIF拥有专利的压缩方法,要求开发GIF软件的作者须缴交一定费用,由此促使免费的png图像格式的诞生。 PNG汲取了GIF和JPG二者的优点,存贮形式丰富,兼有GIF和JPG的色彩模式; PNG是采用无损压缩方式来减少文件的大小 支持透明图像 不支持动画应用效果
7 专用的图像格式 PSD格式 Photoshop 专用图像格式,支持各种图像类型:1位、8位、16位、24位、32位等,支持索引、RGB、CMYK、Lab颜色模型、支持多通道。 DXF格式 AutoCAD中的矢量文件格式,它以ASCII码方式存储文件,在表现图形的大小方面十分精确。许多软件都支持DXF格式的输入与输出。 PS 和EPS格式 EPS(Encapsulated PostScript)是用PostScript语言描述的一种ASCII码文件格式,主要用于排版、打印等输出工作。 ATF ATSL专用格式 支持1位、8位、24位图像;支持索引、RGB、CMYK、Lab、专用色卡颜色模型;支持多通道图像;支持RLE、LZW数据压缩;支持巨型文件;支持位图和矢量混合图像;支持印染工艺要求的跳接、回位、开路等 JAR EX6000 分色文件专用格式
思考题 • 为什么要有不同的颜色空间,各自的特点是什么? • 什么是分辨率?像素、图像分辨率和图像大小、图像的实际尺寸之间有关系? • 为什么要对图像数据进行压缩?常见的数据压缩算法有哪些?各自的特点是什么?