1 / 28

图像检索技术综述

图像检索技术综述. 王潇 2006.11.11. 本文主要内容. 图像检索技术的发展历史 当前主流的图像检索技术介绍 一个图像搜索引擎的系统模型. 20 世纪 70 年代: TBIR (Text-based Image Retrieval ) 基于文本的图像检索技术 沿用了传统文本检索技术,利用文本描述的方式表示图像的特征。. 早期的 TBIR : 手工对图像进行注释,工作量相当大,不可避免地会带来主观性和不精确性 Internet 环境下的 TBIR : 网页信息的自动采集和标引技术 索引方式:全文索引和关键词索引

iolani
Download Presentation

图像检索技术综述

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 图像检索技术综述 王潇 2006.11.11

  2. 本文主要内容 图像检索技术的发展历史 当前主流的图像检索技术介绍 一个图像搜索引擎的系统模型

  3. 20世纪70年代: TBIR (Text-based Image Retrieval) 基于文本的图像检索技术 沿用了传统文本检索技术,利用文本描述的方式表示图像的特征。

  4. 早期的TBIR: 手工对图像进行注释,工作量相当大,不可避免地会带来主观性和不精确性 Internet环境下的TBIR: 网页信息的自动采集和标引技术 索引方式:全文索引和关键词索引 Google,Yahoo和百度等搜索引擎所提供的图像检索服务,它们采用的都是TBIR技术.

  5. TBIR的优点:使用成熟的文本检索和搜索引擎技术,符合人们的检索习惯,实现简单TBIR的优点:使用成熟的文本检索和搜索引擎技术,符合人们的检索习惯,实现简单

  6. TBIR的缺点:标注的准确性差,也不能满足用户对图像原始特征信息的检索TBIR的缺点:标注的准确性差,也不能满足用户对图像原始特征信息的检索

  7. MPEG-7 国际标准化组织ISO/IEC 制定的MPEG-7国际标准,该标准的正式名称为“多媒体内容描述接口”(Multimedia Content Description Interface),为各类多媒体信息提供一种标准化的描述,并将该描述与所描述的内容相关联,极大地促进了对各种多媒体信息的快速查询和访问。 该标准于1998年10月提出,于2001年最终完成并公布。

  8. MPEG-7标准化的范围包括: 一系列的描述子(描述子是特征的表示法,一个描述子就是定义特征的语法和语义学); 一系列的描述结构(详细说明成员之间的结构和语义); 一种详细说明描述结构的语言、描述定义语言(DDL); 一种或多种编码描述方法。

  9. 90年代以来: CBIR (Content-based Image Retrieval) 基于内容的图像检索 对图像的视觉内容,如图像的颜色、纹理、形状等进行分析和检索图像。 其特点是图像本身包含的客观视觉特性,不需要人为干预和解释,能够通过计算机自动实现对图像特征的提取和存储。

  10. 第3层:语义特征层 人们对图像内容概念级的反映 第2层:物理特征层 图像的颜色、纹理、形状和轮廓等低层物理特征 第1层:原始数据层 图像的原始像素点 图1 图像内容的层次模型 特征提取 CBIR进行检索时利用的是第2层的特征。特征提取是CBIR系统最基础的部分,在很大程度上决定了CBIR系统的成败. [1]

  11. 1  基于颜色特征的检索 实践表明,基于颜色的CBIR系统具有较好的性能,而且实现相对容易.最常用的表达颜色特征的方法是颜色直方图。 其他常用的颜色特征表示方法还有颜色矩和颜色相关图。 [2]

  12. 2  基于纹理特征的检索 纹理是一种不依赖于颜色或亮度的反映图像中同质现象的视觉特征,对图像灰度变化的特征进行量化,与对象的位置、走向、大小、形状有关,与平均灰度级无关。 图像检索中用到的纹理特征表示方法主要有:Tamura法、小波变换和自回归纹理模型。 [3]

  13. 3  基于形状特征的检索 形状特征常与目标联系在一起,需提取目标的轮廓或描述目标轮廓所包围的区域的性质。因此形状比颜色和纹理的语义性更强。 基于边界的表示:代表方法是傅里叶描述子。其基本思想是用对图像进行傅里叶变换得到的边界作为形状描述. 其中一个优点就是把二维问题简化为一维问题。 基于区域的表示:代表方法是不变矩法。

  14. CBIR系统向用户提供的查询方式 示例查询就是由用户提交一个或几个例子图像,然后由系统检索出特征与之相似的图像.这里的“相似”,指的是上述的颜色、纹理和形状等几个视觉特征上的相似。 草图查询:用户可以简单地画一幅草图,由系统检索出视觉特征上与之相似的图像。

  15. 目前基于内容图像检索技术已经取得了不少的成就,一些著名的图像检索系统相继被推出,有IBM的 QBIC 系统,哥伦比亚大学开发的 Visual-SEEK,MIT多媒体实验室开发的 Photo-Book,U C Berkeley开发的 Chabot 系统等。

  16. CBIR利用图像本身固有的物理信息,能够对图像的颜色、纹理和形状等特征进行比较,在指纹识别、商标检索和医学图像检索等特定领域得到了广泛应用,因为这些领域的图像在某些特征上容易识别,比如同一个手指的指纹其纹理是一样的。 然而,Internet上的图像来自不同的领域,根本无法捕获其共同点,用基于内容的方法对这些图像进行检索,其效果远不能令人满意.

  17. 基于语义的图像检索 基于语义的图像检索的目的,就是要使计算机检索图像的能力达到人的理解水平。 在图1所示的图像内容层次模型中,语义位于最高层:第3层。第2层和第3层之间的差别被许多学者称为“语义鸿沟”(semantic gap)。缩小语义鸿沟的办法有2种:由高层语义导出低层特征和由低层特征向高层语义的转换。

  18. 在原有检索系统中加入高级语义到低层特征的转化,可以在不改变现有的图像特征库和匹配方式的情况下,实现基于语义的图像检索,其基本框图见图2.在原有检索系统中加入高级语义到低层特征的转化,可以在不改变现有的图像特征库和匹配方式的情况下,实现基于语义的图像检索,其基本框图见图2. 图像语义的提前过程是由低层特征向高层语义转化的过程。在获取语义和有效地表达语义的基础上,可以建立语义索引,提取图像语义的模型见图3。

  19. 语义查询 相似性比较 高层语义导出低层特征 特征比较 图像特征库 反馈信息 特征提取 检索结果 图像数据库管理 结果输出 图像数据库管理 图2 基于语义的图像检索系统框图

  20. 图像语义描述 对象空间 关系分析 利用系统知识的语义提取 基于系统交互的语义生成 基于外部信息的语义提取 全局抽象 语义处理 图像标注 用户交互 外部信息 对象识别 图像分割 全局视觉 特征提取 局部视觉 特征提取 原始图像 图3 图像语义提取模型

  21. 基于反馈的图像检索 相关反馈方法的基本思想是在检索过程中,允许用户对检索结果进行评价和标记,指出结果中哪些是用户希望得到的查询图像,哪些是不相关的,然后将用户标记的相关信息作为训练样本反馈给系统进行学习,指导下一轮检索,从而使得检索结果更符合用户的需要。

  22. 基于知识的图像检索 将人工智能领域的基于知识的处理方法引入到图像处理领域,通过对图像理解、知识表达、机器学习,并结合专家和用户的先验知识,建立图像知识库实现对图像数据库的智能检索。主要涉及到自然语言理解、专家系统、知识表达和机器学习等人工智能的主要研究领域。

  23. 一个图像搜索引擎的系统模型 SeekImg系统是华中科技大学图像识别与人工智能研究所开发的,一个www上的图像搜索引擎的原型系统。[4] 该系统采用Internet搜索技术、图像自动识别技术和基于内容的图像检索技术,基于C1ient/Server 架构和 Microsoft SQL Server/NT 平台研制开发。

  24. 文字信息 文字信息 索引向量 索引向量 图像处理 示例图像 查询界面 示例图像文字信息 用户 爬虫 图像处理 图像 数据库 结果 数据库维护 图4 SeekImg的系统结构图 SeekImg由四部分组成:爬虫部分、图像处理、图像数据库和查询服务器。

  25. 爬虫又称为“www图片自动搜寻和下载模块”,主要完成从www网站上寻找图片并下载到系统的服务器上;图像处理部分是SeekImg的核心模块,主要完成下载的图像的自动分析和特征信息的自动提取;数据库部分在服务器端完成SeekImg的图像信息组织,在客户端接受用户的例子图像,通过基于内容的图像检索算法,完成对服务器端图像信息的检索,并将结果输出给用户。[5]爬虫又称为“www图片自动搜寻和下载模块”,主要完成从www网站上寻找图片并下载到系统的服务器上;图像处理部分是SeekImg的核心模块,主要完成下载的图像的自动分析和特征信息的自动提取;数据库部分在服务器端完成SeekImg的图像信息组织,在客户端接受用户的例子图像,通过基于内容的图像检索算法,完成对服务器端图像信息的检索,并将结果输出给用户。[5]

  26. 用户可采用的三种查询方式: ① 当用户采用传统的关键字检索方式时,利用图像数据库中的关键字字段进行检索。② 当用户提供了示例图像时,先对示例图像产生索引向量,采用某种距离度量算法,算出示例图像和图像数据库中图片的索引向量之间的距离,得到距离最近的若干幅图片。 ③ 用户也可以指定图像特征,例如,红色30%,黄色50%。服务器将构造出索引向量,然后找出距离最近的若干幅图片。

  27. 参考文献 [1]贺玲, 吴玲达, 蔡益朝.CBIR 中的索引技术综述[J].小型微型计算机系统.2006,vol.27:141-145 [2]刘忠伟,章毓晋.十种基于颜色特征的图像检索算法的比较和分析[J].信号处理,2OOO,16(1):79-84 [3]MA W Y,ZHANG H J.Benchmarking of Image Features for Content-based Retrieval[C]//The 32nd Asilomar Conference on Signals,Systems& Computers.Pacific Grove,California,USA:IEEE CS Press,1998.

  28. [4]陈韶斌,丁明跃,周成平.WWW上的图像搜索引擎系统SeekImg[J].计算机与数字工程,2OO2,30(2):55-54[4]陈韶斌,丁明跃,周成平.WWW上的图像搜索引擎系统SeekImg[J].计算机与数字工程,2OO2,30(2):55-54 [5]陈迎,唐洁茹.一种www 图像搜索引擎的模型与实现[J].武汉理工大学学报,2OO1,23(1):26-29

More Related