龙源期刊网 http://www.qikan.com.cn
基于互联网的图像信息检索技术
作者:时常青 张 萌
来源:《电脑知识与技术》2008年第34期
摘要:随着互联网上图像资源增多,其检索问题给传统检索理论带来新挑战。该文对图像信息检索技术进行分类研究,并对两类图像信息检索技术的发展与结合做出了展望。 关键词:关键词搜索;分类浏览;图像内容特征;特征检索;内容检索 中图分类号:TP391文献标识码:A文章编号:1009-3044(2008)34-1825-02 The Image Information Retrieval Technology Based on Internet SHI Chang-qing1, ZHANG Meng2
(1.Tianjin Oriental Barter Wantong Trading Center Co., Ltd. Tianjin 300051, China;2.Beijing Normal University, Management Department, Beijing 100080, China)
Abstract: With increase of image resources in the internet, it brings about new challenges to the previous retrieval theory. This essay have discussed varies kinds of Image Information retrieval technology that now exists, and looks forward to the development and integration of the retrieval technology.
Key words: key words retrieval; classified browse; content feature of image; feature retrieval; content retrieval 1 引言
随着互联网应用的普及、计算机数据处理能力的提高和多媒体编码技术的进步,网络上的各类资源日益丰富,人们对网络搜索的要求也越来越高,网民不再满足于基于的传统网页查询,更具专业性、个性化的搜索引擎成为了人们的迫切需求,直观形象的多媒体信息倍受人们青睐。Mp3、图片等特色搜索功能应运而生并显示出流行和快速发展的态势,不仅丰富了搜索引擎领域,更成为搜索巨头新的争夺领地。 2 数字化图像检索简介
数字化图像——作为多媒体信息的一个重要组成部分,以其生动的形象、易于理解的表现形式成为在商业、教育、科技等多方面广泛应用的媒体形式之一。无论对于专业的设计者还是
龙源期刊网 http://www.qikan.com.cn
一般的普通网友,挖掘网络素材,查找和利用网络上的图像都成为一种需求。由此,在网络环境下实现对图像的查找变得必要且迫切。
从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派等。20世纪90年代以后,出现了对图像的内容语义,如颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索技术(Content-based Image Retrieval,简称CBIR)。 2.1 检索原理
在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括三方面:一方面对用户需求的分析和转化,形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;再一方面就是根据相似度算法计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,并按照相似度降序的方式输出。
可见,图像检索的实质就是如何解决图像数据库与用户需求的匹配和选择问题。目前,网上图像信息的检索技术大致可分为两部分,一种是基于整个网络的图像搜索引擎的检索技术,一种是主要基于图像数据库的各种图像检索系统。两者从不同的角度出发检索图像信息。比较而言,后者的技术更为成熟;前者由于要求反映信息快速、全面、覆盖面广,因而技术相对粗糙些,并且前者越来越倾向于与后者的检索技术相结合。 2.2 检索技术
目前互联网上的图像搜索引擎主要分为关键词检索和分类浏览两种检索方式。关键词检索是基于图像外部信息所进行的自由词检索,利用Web文档丰富的文本上下文及超文本结构信息,为图像分析、标引提供依据;分类目录浏览方式是图像搜索引擎将采集到的图像通过某种自动或人工进行分类标识,为用户提供按主题浏览的检索方式。
不难看出,图像搜索引擎所实现的图像检索基本上是与文本搜索引擎类似的,是基于图像内容描述的语义层次的匹配(例如通过关键词、分类目录等)。但处于不同背景环境的用户对图像的理解会有千差万别的不同,从而导致这种图像检索方式的检准率较低。当言词不足以形象和准确地描述视觉感知时,用户就需要利用其所呈现的视觉特性如颜色、纹理、形状等特征来提交查询。因此,也就出现了基于图像本身固有属性匹配的图像检索技术。 2.2.1 基于颜色特征的检索
颜色是图片的重要特征之一。基于颜色特征的检索是基于内容的图片检索中最基本和常用的方法之一。颜色特征具有非常好的稳定性,对图片的旋转、平移、尺度变化等都具有不变性。此外,颜色特征计算简单,从而成为被广泛运用的图像特征识别方法之一。
龙源期刊网 http://www.qikan.com.cn
在人和机器统一的颜色空间基础上,颜色恒常性用于描述对象在特定光照和环境变化时的一种性质。对于人的视觉来说,颜色指视觉系统在光照及环境变化时对物理表面的稳定的知觉,是一种重要的认知现象;对机器视觉来说,是机器视觉系统对物理表面光谱反射率的描述。正是由于这种颜色特征的人机统一性与物理恒常性,才使得基于颜色特征的图像检索成为可能。
2.2.2 基于纹理特征的检索
纹理是由大量可见基元均匀地排列在一起所组成的一种视觉模式,它在图像中通常表示不同材质的区域。使用纹理特征首先需要将图像进行纹理分割,而这是一项相当困难且计算量很大的工作。另外,基于纹理的技术缺乏有效的纹理模型,纹理特征与人类感知的相关性还不得而知。根据纹理特征进行检索主要考虑粗糙性、方向性和对比性三种特征。
由于纹理描述比较困难,一般对纹理的检索都采用示例查询方式,即用户给出示例的全部或部分区域特征,从而找到类似的图像。 2.2.3 基于形状特征的检索
采用该特征进行检索时,用户通过勾勒图像的形状或轮廓,从图像库中检出形状类似的图像。基于此特征的检索方法有两种:1)分割图像经过边缘提取后,得到目标图像的轮廓线,针对这种轮廓线进行的形状特征检索;2)直接针对图形寻找适当的矢量特征用于检索算法。但处理这种结构化检索更为复杂,需做更多的预处理。
基于内容的图像检索技术还不是十分普及,目前有Virage、Excalibur和IBM公司开发出了基于图像内容相似性特征的图像库检索引擎。VIRAGE公司的VIR(Visual Information Retrieval)图像引擎提供了四种可视属性检索(颜色、成分、纹理和形状)。每种属性被赋予0到10的权值。通过对四个属性权值的调整,可显示出不同的检索结果。Visual RetrievalWare只是Excalbur提供的查询程序之一,它提供了对其检索参数的综合设置的测试。Excalbur提供基于6种图像属性的检索,分别是颜色、形状、纹理、颜色结构、亮度结构和纵横比。每一个属性值范围从0到5。而QBIC(Query By Image Content)是由IBM公司著名的Almaden实验室开发的,它可能是目前应用最广的图像检索系统,如旧金山现代艺术博物馆以及法国文化部等机构。虽然QBIC只提供了3 种属性的检索功能:颜色属性、形状属性和纹理属性,但它的检索效率非常高。另外,QBIC还辅以文本查询手段,例如为旧金山现代艺术博物馆的每幅作品给予标准描述信息:作者、标题、日期,许多作品还有内容的自然描述。
2.3 技术对比
各种图像搜索引擎为快速、大量地查找网上图像信息创造了条件,而基于内容特征的图像库检索技术亦为图像数据的检索从可视角度开辟了一条更为准确直观的途径。现有的图像搜索