第 2 章数字图像基础

第2章数字图像基础

主要内容 2.1 图像感知与获取 2.2 图像取样与量化 2.3 数字图像类型 2.4 数字图像文件格式 2.5 像素间的一些基本关系 2.6 Visual C+ + 图像处理编程基础

2.1 图像感知与获取 1 场景成像的三种主要传感器装置（1）单元成像传感器，如光敏二极管等。通过x-y方向二维扫描，形成二维图像。

（2）线成像传感器，如线CCD、平板扫描仪等。（2）线成像传感器，如线CCD、平板扫描仪等。只需一维扫描，就能形成二维图像。

（3）阵列成像传感器，如面CCD等。 不需要扫描，就能形成二维图像。

2 简单的图像形成模型（数学模型）

2.2 图像取样与量化 1 基本概念（1）图像数字化：将模拟图像经过离散化之后，得到用数字表示的图像。图像的数字化包括采样和量化两个过程。（2）采样：是将在空间上连续的图像转换成离散的采样点（即像素）集的操作。即：空间坐标的离散化。（3）量化：把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。即：灰度的离散化。

2 数字图像表示 （1）紧凑矩阵表示（2）传统矩阵表示形式

3 空间分辨率和灰度分辨率 （1）空间分辨率：图像空间中可分辨的最小细节。一般用单位长度上采样的像素数目或单位长度上的线对数目表示。（2）灰度分辨率：图像灰度级中可分辨的最小变化。一般用灰度级或比特数表示。（3）空间分辨率（图像的采样）与图像质量的关系 133x90 265x180 66x45 33x22 问题：观察上面四幅图，总结空间分辨率与图像质量的关系。

总结： 空间分辨率越高，图像质量越好；空间分辨率越低，图像质量越差，会出现棋盘模式。（4）灰度分辨率（图像的量化）与图像质量的关系 256灰度级 16灰度级 8灰度级 4灰度级问题：观察上面四幅图，总结灰度分辨率与图像质量的关系。

总结： 灰度分辨率越高，图像质量越好；灰度分辨率越低，图像质量越差，会出现虚假轮廓。（5）空间分辨率和灰度分辨率同时变化，对图像质量的影响问题：观察上面三幅图，空间分辨率和灰度分辨率同时变化，对图像质量的影响。

总结： A、图像质量一般随N和k的增加而增加。在极少数情况下对固定的N，减小k能改进质量。最有可能的原因是减小k常能可增加图像的视觉反差。 B、对具有大量细节的图像只需很少的灰度级数就可较好地表示。 C、N×k为常数的图像主观看起来可以有较大的差异。

（6）采样和量化的原则 当限定数字图像的大小时, 为了得到质量较好的图像，一般可采用如下原则： （1）对缓变的图像，应该细量化，粗采样，以避免假轮廓。（2）对细节丰富的图像，应细采样，粗量化，以避免模糊。 思考题： ☆为什么电风扇转速太快时，人们会觉得电风扇在反转？（采样定理）

2.3 数字图像类型 静态图像可分为矢量(Vector)图和位图（Bitmap），位图也称为栅格图像。

1 矢量图 （1）矢量图的表示方法是用一系列绘图指令来表示一幅图。这种方法的本质是用数学(更准确地说是几何学)公式描述一幅图像。（2）矢量图的优点： A、它的文件数据量很小； B、图像质量与分辨率无关，这意味着无论将图像放大或缩小了多少次，图像总是以显示设备允许的最大清晰度显示。

（3）矢量图的缺点： 不易制作色调丰富或色彩变化太多的图像，绘出来的图像不是很逼真，同时也不易在不同的软件间交换文件。

2 位图 是通过许多像素点表示一幅图像，每个像素具有颜色属性和位置属性。位图的优缺点：与矢量图正好相反。位图又可以分成如下四种：二值图像（binary image)、灰度图像(gray-scale image)、索引颜色图像(index color image)和真彩色图像（true color image）。

3. 二值图像 只有黑白两种颜色。

4. 灰度图像 在灰度图像中，像素灰度级一般用8 bit表示，所以每个像素都是介于黑色（0）和白色（255）之间的256（28=256）种灰度中的一种。

5. 真彩色图像 每一个像素由红、绿和蓝三个字节组成，每个字节为8 bit，表示0到255之间的不同的亮度值，这三个字节组合可以产生1670万种不同的颜色。

6 . 索引图像 在RGB真彩色出现之前，由于技术上的原因，计算机在处理时并没有达到每像素24位的真彩色水平，为此人们创造了索引颜色。在索引颜色（也称为映射颜色）模式下，颜色都是预先定义的，并且可供选用的一组颜色也很有限，索引颜色的图像最多只能显示256种颜色。

2.4 图像文件格式 数字图像有多种存储格式，每种格式一般由不同的开发商支持。因此，要进行图像处理，必须了解图像文件的格式，即图像文件的数据构成。每一种图像文件均有一个文件头，在文件头之后才是图像数据。

1 BMP图像文件格式 • 第一部分为位图文件头BITMAPFILEHEADER，它是一个结构体，其定义如下：  • typedef struct tagBITMAPFILEHEADER{ • WORD bfType; //文件类型，在WINDOWS系统中为“BM” • DWORD bfSize; //文件大小 • WORD bfReserved1; //保留字 • WORD bfReserved2; //保留字 • DWORD bfOffBits; //从文件头到实际位图的偏移字节数 • } BITMAPFILEHEADER; • 这个结构的长度是固定的，为14个字节（WORD为无符号16位二进制整数，DWORD为无符号32位二进制整数）。

第二部分为位图信息头BITMAPINFOHEADER，也是一个结构：第二部分为位图信息头BITMAPINFOHEADER，也是一个结构： • typedef struct tagBITMAPINFOHEADER{ • DWORD biSize; //该结构的长度，为40字节 • LONG biWidth; //图像的宽度，单位为像素 • LONG biHeight; //图像的高度，单位为像素 • WORD biPlanes; //位平面数，必须是1 • WORD biBitCount; //指定颜色数，1为二值，4为16色，8为 • 256 色，16、24、32为真彩色 • DWORD biCompression; //指定是否压缩，有效的值为BI_RGB, • BI_RLE8，BI_RLE16，BI_BITFIELDS • DWORD biSizeImage; //实际的位图数据占用的字节数 • LONG biXPelsPerMeter;//目标设备水平分辨率 • LONG biYPelsPerMeter;//目标设别垂直分辨率

DWORD biClrUsed;//实际使用的颜色数，若该值为0，则使用的颜 • 色数为2的biBitCount次方种。 • DWORD biClrImportant; //图像中重要的颜色数，若该值为0，则所 • 有的颜色都是重要的。 • } BITMAPINFOHEADER; • 其中，biCompression的有效值为BI_RGB、 BI_RLE8、 BI_RLE4、BI_BITFIELDS，这都是一些Windows定义好的常量。由于RLE4和RLE8的压缩格式用的不多，今后仅讨论biCompression的有效值为BI_RGB，即不压缩的情况。

第三部分为调色板(Palette)，只是对那些需要调色板的位图文件而言的。调色板实际上是一个数组， 共有biClrUsed个元素（如果该值为零，则有2的biBitCount次方个元素）。数组中每个元素的类型是一个RGBQUAD结构，占4个字节，其定义如下： • typedef struct tagRGBQUAD{ • BYTE rgbBlue; //该颜色的蓝色分量 • BYTE rgbGreen; //该颜色的绿色分量 • BYTE rgbRed; //该颜色的红色分量 • BYTE rgbReserved; //保留值 • } RGBQUAD;

第四部分就是实际的图像数据。对于用到调色板的位图， 图像数据就是该像素颜色在调色板中的索引值，对于真彩色图像，图像数据就是实际的R、 G、 B值。下面就2色、 16色、256色和真彩色位图分别介绍。 对于2色位图，用1位就可以表示该像素的颜色（一般0表示黑， 1表示白），所以一个字节可以表示8个像素。 对于16色位图，用4位可以表示一个像素的颜色，所以一个字节可以表示2个像素。 对于256色位图，一个字节刚好可以表示1个像素。

下面两点请读者注意：  （1）每一行的字节数必须是4的整数倍，如果不是，则需要补齐。 （2） BMP文件的数据存放是从下到上，从左到右的。也就是说，从文件中最先读到的是图像最下面一行的左边第一个像素，然后是左边第二个像素，接下来是倒数第二行左边第一个像素，左边第二个像素。依次类推，最后得到的是最上面一行的最右边的一个像素。 DIB（Device Independent Bitmap）图像格式是设备无关位图文件，描述图像的能力基本与BMP相同，并且能运行于多种硬件平台，只是文件较大。

2. TIF图像文件格式 标记图像文件格式TIF (Tag Image File Format)，它是现存图像文件格式中最复杂的一种，它提供存储各种信息的完备的手段，可以存储专门的信息而不违反格式宗旨，是目前流行的图像文件交换标准之一。 3. GIF图像文件格式 CompuServe开发的图形交换文件格式GIF（Graphics Interchange Format），目的是在不同的系统平台上交流和传输图像。它是在Web及其他联机服务上常用的一种文件格式，用于超文本标记语言(HTML)文档中的索引颜色图像。

4. JPEG图像格式 JPEG(Joint Photographer’s Experts Group)格式即联合图像专家组, 是由ISO和CCITT为静态图像所建立的第一个国际数字图像压缩标准，主要是为了解决专业摄影师所遇到的图像信息过于庞大的问题。由于JPEG的高压缩比和良好的图像质量，使得它广泛应用于多媒体和网络程序中。JPEG和GIF成为HTML语法选用的图像格式。

2.5 图像像素间的一些基本关系 1 相邻像素（1）p的4邻域坐标为(x,y)的像素p有4个水平和垂直的相邻像素，坐标分别为: (x+1, y), (x-1, y), (x, y+1), (x, y-1)，这个像素集称为p的4邻域，用N4(p)表示。

（2）p的4个对角邻像素 坐标分别为: (x+1, y+1), (x-1, y-1), (x-1, y+1), (x-1, y-1)，用N D(p)表示。（3）p的8邻域 N4(p)+N D(p) 。

随堂练习： 4邻域、对角邻域、8邻域

2 邻接性、连通性 （1）邻接性 V是具有特定相似性准则的灰度值集合。（解释） A、4邻接：如果q在N4 (p)中，具有V中数值的两个像素p和q是4邻接的。 B、8邻接：如果q在N8 (p)中，具有V中数值的两个像素p和q是8邻接的。

C、m邻接：如果q在N4(p)中， 或者q在ND(p)中且集合N4(p) ∩ N4(q)没有V值的像素，则具有V值的像素p和q是m邻接的。混合邻接的引入是为了消除采用8邻接常常发生的二义性。

（2）连通性 从具有坐标(x,y)的像素p到具有坐标(s,t)的像素q的通路特定像素序列，其坐标为：并且像素(xi, yi)和(xi-1, yi-1)是邻接的。 4通路 8通路 m通路

随堂练习： 以下p-q通路各是什么通路？

随堂练习：

连通设 p 和 q 是1个图象子集 S 中的2个象素，那么如果存在1条完全由在S中的象素组成的从 p 到 q 的通路，那么就称 p 在 S 中与 q 相连通的。。

（3）距离度量 A、距离度量函数定义给定3个象素p, q, z，坐标分别为(x，y)，(s，t)，(v，w)，如果下列条件满足，则D是距离度量函数： (1) D(p,q)≥0 (D(p,q)=0 当且仅当 p=q) (2) D(p,q) = D(q,p) (3) D(p,z)≤D(p,q)+D(q,z)； B、明考夫斯基距离

C、欧氏(Euclidean)距离：模为2的距离 根据这个距离量度，与(x，y)的距离小于或等于某个值d的象素都包括在以(x，y)为中心以d为半径的圆中。 D、城区(city-block)距离：模为1的距离,或D4距离 D4(p，q) = |x-s| + |y-t| 根据这个距离量度，与(x，y)的D4距离小于或等于某个值d的象素组成以(x，y)为中心的菱形。

E、棋盘(chessboard)距离: 模为∞的距离，或D8距离 D8(p，q)=max(|x-s|，|y-t|) 问题：为什么是模为∞的距离？（解释：不等、相等）根据这个距离量度，与(x，y)的D8距离小于或等于某个值d的象素组成以(x，y)为中心的正方形。

随堂练习： 求下列两点间的欧氏距离、城区距离和棋盘距离。

第 2 章 数字图像基础