您的当前位置:首页正文

基于内容的图像检索技术概述

2024-08-17 来源:个人技术集锦
龙源期刊网 http://www.qikan.com.cn

基于内容的图像检索技术概述

作者:秦志新 裴东兴

来源:《数字技术与应用》2012年第01期

摘要:近年来随着因特网的快速普及,如何快速准确地在海量图像中搜索到自己所需的图像显得十分重要。本文综述了基于颜色、纹理、形状图像检索技术的主要方法,讨论了性能评价方法,并指出了应用方向。

关键词:CBIR 颜色 纹理 形状 性能评价方法

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2012)01-0159-02 1、引言

图像是对客观对象的一种相似性的、生动性的描述或写真。或者说图像是客观对象的一种表示,包含了被描述对象的有关信息,为人类构建了一个形象的思维模式,有助于我们学习、思考问题。据统计,人类接受的外部信息,大约有75%来自视觉。随着网络信息技术的快速发展,图像作为一种内容丰富、表达直观的多媒体信息被大量广泛的使用,如何通过搜索引擎从海量的图像中准确又快速地搜索到自己所需的图像成为了人们迫切的愿望。传统的基于文本的图像检索技术无法满足海量环境下多媒体信息库的检索要求。

为了准确、高效地从图像中搜索到有用信息,基于内容的图像搜索技术应运而生。它克服了文本检索的局限性,根据图像、图像的内容语义以及上下文联系进行查找,以图像语义特征为线索从图像数据库中检索出具有相似特性的其它图像,尤其是人工智能、心理医学图像处理的交叉学科的发展促进了图像语义与图像特征结合的搜索技术的进步,人们更为关注的是图像中反馈的信息与用户的需求的关系桥梁。 2、基于内容的图像检索

基于内容的图像检索的概念于1992年由T.kato提出的。他在论文“Query by Visual Example-Content based Image Retrieval”中构建了一个基于色彩与形状的图像数据库,并提供了一定的检索功能进行实验。

所谓基于内容的图像检索,即从图像库中查找含有特定目标的图像,也包括从连续的视频图像中检索含有特定目标的视频片段。用户通过用户接口设置查询条件时,可以采用一种或几种的特征组合来表示,然后系统采用相似性匹配算法计算关键图像特征与特征库中图像特征的相似度,安装相似度从大到小的顺序将匹配图像反馈给用户。用户根据反馈结果,选择是否修

龙源期刊网 http://www.qikan.com.cn

改查询条件,继续查询,以达到最终结果。举例来说,用户需要一搜白色轮船的图片,只需设定白色和轮船轮廓,数据库系统就能返回所有白色轮船的图像,帮用户快速找到目标。 CBIR的核心是使用图像的可视特征对图像进行检索,包括图像的颜色特征、纹理特征和形状特征,这些特征不受人为因素的干扰,是图像中客观存在的视觉信息,可以通过图像处理技术来自动识别图像中的信息。 2.1 颜色特征检索

颜色是图像最直观、最明显的特征,是绝大多数基于内容的图像和视频检索使用的特征之一。描述方法有:颜色直方图、颜色相关图、颜色矩、颜色一致性矢量。

(1)颜色直方图。颜色直方图是在颜色空间中采用一定的量化方法对颜色进行量化(用横轴表示),然后统计每一个量化通道在整幅图像中所占的比例(用纵轴表示),常用的匹配方法有:矢量距离法、直方图交叉法、直接差值法。

虽然直方图计算简单,但是不能反映图像中对象所在的位置和对象之间的空间关系。文献[6]中提出一种改进的基于模糊量化的颜色量化方法并在此基础上提出了一种基于颜色—空间特征的检索方法。文献[7]中提出一种通过提取颜色特征、灰度特征,获取图像物体的形状和空间特征,使检索结果不受图像大小、旋转和轻微的光照变化的影响,明显改善了检索结果。 (2)颜色相关图。颜色相关图是用颜色对相对于距离的分布来描述信息,不但刻画了某一种颜色的像素数量占整个图像的比例,还反映了像素对的空间相关性,以及局部像素分布和总体像素分布的相关性,并且特征范围小,效果好,缺点是计算量太大。

(3)颜色矩。颜色矩由Stricker和Orengo所提出,在颜色直方图的基础上计算出每个颜色通的均值、方差、偏差,来替代颜色的分布表示颜色特征,无需对特征进行量化,处理简单。 2.2 纹理特征检索

纹理是图像中一个重要而又难以描述的特性,习惯上将图像在局部区域内呈现不规则性,而在整体上却表现出某种规律性的特性称为纹理。描述纹理特征的术语有粗糙度、对比度、方向性、线性度、规则度、粗略度)等。描述纹理特征的方法有统计法、模型法、分析法、频谱法。

(1)统计法。用于分析像木纹、沙地、草坪等细致而不规则的物体,从图像有关纹理属性的统计分析出发,根据纹理的空间灰度级相关性,构造出一个基于图像像素间方向和距离的共生矩阵,并提取出特征与参数间的关系。

(2)结构法。用于分析像布料的印刷图案或砖瓦等排列比较规则的图案,找出纹理基元,去探求纹理构成的结构规律,根据纹理基元及其排列规则来描述特征与参数间的关系。

龙源期刊网 http://www.qikan.com.cn

(3)模型法。用一些成熟的图像模型来描述纹理,如Markov模型、Fractal模型、马尔科夫随便机场、子回归模型等,通过少量的参数来描述纹理特征。

(4)频谱法。主要借助于频率特性来描述纹理,如Gabor变换、小波变换法,但是计算速度慢。纹理特征检索的具体过程是先提取纹理特征,依据特征对图像进行分割和分类,用户一旦选中相近的纹理形式,系统则要求用户适当调整纹理特征,如对比度“再暗一些”,从而返回更精确的检索结果。 2.3 形状特征检索

形状特征是图像的一个显著特征,是图像中最主要的视觉信息。形状特征有:面积、周长、拐点、角点、重心、偏心率等,形状表示方法有二次曲线、B样条曲线、Freeman码链、小波形状逼近方法等。

形状特征检索的具体过程是先提取形状的矢量特征,为了更接近目标,同时采用三个特征,即长/短轴比、周长/面积比、最近与最远点的连线间的夹角,这三个特征不受形状大小与旋转变化的影响,再分析边界或区域,然后对形状进行匹配,根据具体情况选取合适的匹配算法,以快速查找到目标对象。 3、性能评价方法

MPEG—7标准的发布,规范了图像底层特征的提取和描述,主要应用于模型的研究,但是基于内容的图像检索方法很多,如何评价这些算法,比较其优劣呢? 3.1 查准率和查全率

我们可以先选定含有特定目标的图像作为一组相关图像,再根据返回结果计算查全率和查准率,如果值越高,则说明该算法越有效,但是这种方法的局限性在于没有考虑检索结果中相似图像所处的位置,可以结合以下几种度量方法:(1)3点平均值,查全率为0.2,0.5,0.8处查准率的平均值。(2)11点平均值,在11个查全率点处求查准率的平均值。(3)当准确率下降到0.5时的查全率。 3.2 排序评价方法

选取一定数目的含有特定目标的相关图像,再固定返回图像的数目,并将返回图像按相似性大小排序,然后计算有关返回图像的排序评价指标。比如计算检索到的相关图像在所有返回图像中的序号平均值,在理想情况下,所有相关图像都排在最前面。因此,平均值越小,表明检索算法越好。 4、总结与展望

龙源期刊网 http://www.qikan.com.cn

基于内容的图像检索技术逐渐开始成熟起来,充分考虑了用户的影响因素,从而提高了检索的效率和准确率,在许多领域具有广泛的应用前景,如图书馆资料的管理、工程设计图纸的查询、犯罪记录调查等,尤其是网络技术的发展,必将推动图像检索技术更快发展。 参考文献

[1]周明全,耿国华,韦娜.基于内容图像检索技术.清华大学出版社,2007

[2]A KJain, A Vailaya.Image Retrieval Using Color and Shape [J].Pattern Recognition, 1996 , 29(8):12332-1244.

[3]Jeong S,Won C S,Gray R M.Image retrieval using color histograms generated by Gauss mixture vector quantization[J].Computer Vision and Image Understanding,2004,9(1-3):44-46. [4]李向阳,庄越挺,潘云鹤.基于内容的图像检索技术与系统[J].计算机研究与发展.2001.38(3):344-354

[5]韦娜.基于内容的图像检索系统性能评价[J].中国图象图形学报,2004,9(11).

[6]方俊,郭雷,汪子强.一种改进的基于颜色-空间特征的图像检索方法[J].计算机工程与应用,2005(25).

[7]钱瑛,须文波.基于颜色空间特征的图像检索[J].江南大学学报:自然科学版,2007,6(2). 作者简介

秦志新(1982- ),女,山西省运城市万荣县人,讲师,主要研究方向:信号与信息处理。

裴东兴(1970- ),男,中北大学副教授,主要研究方向:动态测试、动态校准、数据压缩技术。

因篇幅问题不能全部显示,请点此查看更多更全内容