基于颜色特征的藏毯图像检索研究与实现

时间:2020-10-16 18:09:47 计算机应用毕业论文 我要投稿

基于颜色特征的藏毯图像检索研究与实现

  摘要:针对国内外还没有可供研究人员和公众使用的藏毯类非物质文化遗产数字化资源平台这一状况,分析了在藏毯图像中运用基于内容的图像检索系统技术的可行性。通过对藏毯图像的颜色特征分析,针对传统HSV颜色空间量化的缺陷,使量化更为有效,把HSV颜色空间量化成188维,实现了在基于JAVA的框架中计算颜色直方图的方法,采用相似距离衡量直方图的相似度。考虑时间消耗并通过查准率的比较,藏毯图像检索的查准率明显提高。

基于颜色特征的藏毯图像检索研究与实现

  关键词:藏毯;量化;特征;图像

  引言

  藏毯在藏族传统艺术的基础上,吸收、融合了汉族、国外宗教艺人的精华,并且形成了具有自己独特的藏族艺术风格的工艺美术品,其图案设计和色彩源于藏传佛教文化,艺术价值极高,是珍贵的非物质文化遗产。随着近年来非物质文化遗产保护工作的不断深入,以及非物质文化遗产数字化、信息化的科技进步,全国各地非物质文化遗产数据库建设步伐不断加快,在分析藏毯的纹理特征、色彩分布和形状特征的基础上,即可以支持基于文字以及图像属性的查询,又可以提取藏毯图像的关键特征值来实现基于内容的图像检索。本文在研究基于内容的图像检索方法的基础上,经过改进,提出了一种针对藏毯图像基于HSV颜色空间量化的图像检索实现方法,为藏毯这一非物质文化遗产的保护和继承提供了技术支撑平台。

  一、基于内容的图像检索方法

  传统的基于文本的图像检索技术,主要利用数据库管理系统对图像采用人工描述并进行管理和检索,通过图像的描述文字和用户输入的关键字进行比较,但由于人工标注效率低和自身的主观偏差性,比较的结果不仅效果差,而且不能对图像中所包含的颜色、纹理等不能用文本信息标注的特征进行检索。基于内容的图像检索(Content-Based ImageRetrieval,CBIR)近年来已成为提高图像检索的有效手段。基于CBIR技术的图像检索系统,采用相似性匹配算法计算关键图像特征与特征库中图像特征的相似度,然后按照相似度从大到小的顺序将匹配图像反馈给用户。用户可根据自己的满意程度,选择是否修改查询条件,继续查询,以达到令人满意的查询。CBIR的实现依赖于两个关键技术:图像特征提取和匹配,图像特征提取分为低层视觉和语义内容,比较成熟的`检索算法大部分是基于图像的低层特征,即利用图像的颜色、纹理、形状、空间关系特征来检索。在基于内容的图像检索中,颜色作为图像的重要视觉信息已成为图像内容组成的基本要素,颜色特征成为在基于内容的图像检索中最早、最广泛使用的视觉特征,目前常用的颜色特征包括颜色直方图、颜色距、颜色聚合向量、颜色协方差矩阵等。纹理是物体表面的结构模式,反映了图像中同质现象的视觉特征,它体现了物体表面的具有缓慢变化或者周期性变化的表面结构组织排列属性,其本质是刻画像素的邻域灰度空间分布规律,典型的分析方法有:空间域纹理分析、频率域纹理分析、空间/频率域联合纹理分析和基于分形模型的纹理分析方法。对于某些纹理和颜色信息不够丰富的图像来说,基于颜色和纹理的方法就无法满足检索需要,这是可借助于形状特征来描述,形状是最难描述的图像特征,它不随周围环境,如颜色的变化而变化,是物体的稳定特征。基于形状特征的图像检索主要是检测或分割出目标轮廓,并针对其进行形状特征的提取或直接针对图像寻找适当的矢量特征,目前基于形状特征的图像检索主要有基于轮廓和基于区域的方法。空间关系指图像中分割出来的多个目标之间相互的空间位置或相对方向关系,通常分为两类:相对空间位置信息和绝对空间位置信息。提取图像空间关系特征有两种方法:一种方法是对图像进行自动分割,根据划分出的对象或颜色区域提取图像特征,并建立索引;另一种方法是简单将图像均匀地划分为若干规则区域后分别提取特征,并建立索引。

  二、颜色特征

  颜色是彩色图像最底层、最直观的物理特征,是一种全局特征,它描述了图像或图像区域所对应的景物的表面性质。作为图像最直观而明显的特征,颜色特征是基于像素点的特征,所有属于图像或图像区域的像素都有各自的贡献。相对于其它的图像特征如纹理和形状来讲,颜色特征非常稳定,不局限于图像的大小和方向,并且对于旋转、平移、尺度变化,甚至各种变形都不敏感,表现出相当强的鲁棒性,因此在基于内容的图像检索中发挥着重要的作用,这也使得颜色特征成为图像检索中应用最为广泛的底层视觉特征。

  2.1 颜色模型

  颜色空间也称彩色模型, 它的用途是在某些标准下用通常可接受的方式对彩色加以说明。本质上,彩色模型是坐标系统和子空间的阐述。RGB色彩模式是工业界的一种颜色标准,在RGB模型中,RGB即是代表红、绿、蓝三个通道的颜色,通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来构成了所有颜色,是目前运用最广的颜色系统之一。将这三种颜色划分成256(0-255)个等级,这三原色光以不同的比例复合后,对人的眼睛可以形成与各种频率的可见光等效的色觉。目前大部分的数字图像都是用这种颜色空间表达的,然而,RGB空间结构并不符合人们对颜色相似性的主观判断,故而采用符合人们对颜色主观认识的HSV模型。HSV(hue,saturation,value)模型对用户来说是一种直观的颜色模型,直接对应于人眼的视觉特征,H表示色度、S表示饱和度、V表示亮度。HSV模型对应于一个圆锥形子集,包含RGB模型中的R、G、B三个面。色度H定义为绕圆锥中心轴的角度,取值范围为0°~ 360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。饱和度S定义为横截面圆心到横截面圆周点的距离,取值范围为0~1,S取值越大,表示色彩越纯,取值越小,表示色彩越灰。亮度V定义为圆锥横截面的圆心到圆锥顶点的距离,表示色彩的明亮程度,取值范围为0~1。HSV对用户来说是一种直观的颜色模型。我们可以从一种纯色彩开始,即指定色彩角H,并让V=S=l,然后我们可以通过向其中加入黑色和白色来得到我们需要的颜色。

  2.2 颜色特征提取

  常用的颜色特征提取方法都建立在颜色直方图的基础上,计算颜色直方图需要将颜色空间划分成若干个小的颜色区间,每个小区间成为直方图的一个bin。然后统计图像中各种颜色出现的频数,在统计的过程中不关心颜色所处的空间位置,每一种颜色出现的频数对应在相应的bin中,最终得到颜色直方图。在颜色直方图坐标中,横坐标表示颜色柄的划分值,纵坐标表示每个bin区间中包含的图像像素总和。一般来说,bin的数目越多,直方图对颜色的分辨能力就越强,检索效果也会越强。但有时bin数目越多的颜色空间划分方法不一定能够提高检索效果,那是因为在有的实际应用中,表示主要颜色的bin能够表达图像中大部分像素的颜色,所以,过多的颜色空间对主体颜色的贡献较少,反而加大了计算负担。除此之外,bin的数目增加后的颜色直方图即增加了计算负担,又不利于在大型图像库中建立索引,同时也带来了数据库中存储空间的容量问题。直方图均衡主要用于处理图像由于过度曝光或者曝光不足造成的前景背景过量或过暗的情况,可以增强图像的对比度,扩展图像灰度范围。本文结合藏毯图像的颜色特点,在划分合适数量的颜色空间基础上实现颜色特征的提取,最终提高图像的检索效果。

  三、传统的HSV颜色空间非均匀量化

  HSV的颜色空间包含三个分量:H、S、V,对H、S、V三个分量进行非均匀分割。将色调H分成8份,饱和度S的范围由圆心向圆周过渡,将其分为三份,亮度V划分为Black,Gray,White三份,各自量化区间为:

  HSV颜色空间被划分为72个不同的空间区域,再将三个简化后的颜色分量合成一维特征向量值,就将整个HSV颜色空间量化为72种颜色,减少了HSV颜色空间的有效颜色数量,简化了颜色特征提取的复杂度。通过量化公式I=9H+3S+V计算,最终得到72柄的一维颜色直方图,I的取值范围为[0,71]。

  四、一种改进的HSV颜色空间量化方法

  4.1 HSV颜色空间188维量化

  通常而言,在图像的生成、传输、变换过程中,由于受到噪声的干扰,会导致图像输出质量失真,影响对于图像的识别,因此在图像识别之前要对其进行预处理。藏毯图案较鲜艳且复杂,考虑到藏毯图像颜色特征在整个空间中的分布状况,采用颜色量化中的聚类方法,用少量的代表色代表整个藏毯图像。虽然采用比较大维的量化可以提高检索效果,但考虑到计算量和存储容量的限制问题,所以使用量化降维方法。为了避免出现某些空间中像素数量非常稀疏的情况,使量化更为有效,把HSV颜色空间量化成188维,根据图像颜色在HSV空间188维中的相同或不同的分布特点,均匀地选取若干个量化点,然后将其他量化点按颜色相似距离最短的原则组合为一个聚类,从而达到既能聚类出代表图像的颜色又能减少颜色数目的目的。具体处理方法为: