| 基于图像颜色特征的图像检索 |
|
现状概述及研究方案的确定 随着计算机应用的普及信息处理技术的发展,以文本、图像、声音和视频为主的媒体信息迅速成为信息交流和服务的主流,现代信息处理的对象和方法都有了很大的变化。大量各种信息被生成、采集、传输、流通和应用,我们正在快速进入一个信息化的社会。值得关注的是全世界的数字图像的容量正以惊人的速度增长,每天都会产生数以百万记的图像。随着互联网的发展,越来越多的人能够更加方便、快捷、经济地接触到这些图像媒体,人们面临的问题不再是缺少图像媒体的内容,而是如何在浩如烟海的图像世界中找到自己所需要的信息。如果没有对图像及视频数据的自动和有效地描述,大量信息将淹没在信息的海洋之中,无法在需要时被检索出来。这就要求有一种能够快速而且准确地查找访问图像的技术,也就是所谓的图像检索技术。 二、图像检索的主要研究内容和技术现状 图像检索的过程就是图像特征的提取、分析及匹配。 三、研究方案 图像检索需要匹配图像间相似度,因此需要设计度量图像间距离的模型。不同的特征可以被分成不同的特征矢量组。图像的特征划分基本上是根据特征矢量的不同特征。同一个区域内的特征矢量具有相同的属性。在n维特征空间的查询,实质上就是目标特征矢量的相似性度量。数据库内的图像文件的特征矢量集以及抽取方法,被事先抽取并保存。查询时,使用给出的模板,图像按照库内保存的方法抽取目标特征矢量。于是检索的设计转移到了图像特征空间的设计上。图像的特征大体分三类:颜色、形状、纹理。其中图像数据中直接包含的信息就是颜色,具有相同颜色的像点在一起聚合成各种形状,在人的大脑中抽象成各种符号,如果计算机也会这种抽象的过程,那么所有的问题就解决了。因此设计图像特征空间就要包含这种抽象的过程,使计算机处理图像后的结果尽量接近人脑思考后的结果。这既有可能会导致图像搜索上升一个层次——语义层搜索。可以看出图像的语义抽象距离现在已经不再遥远了。 作为图像的基本特征:颜色,人们针对它已经设计了很多种算法,包括颜色直方图、加权颜色直方图、颜色聚合度、模板匹配、模糊颜色连通直方图、颜色恒常性颜色检索等等,所有这些包括其中一些非常经典的算法的都没有很好的解决图像特征提取与匹配。因为他们往往都是依靠统计学对图像处理,而统计学一般都会舍弃统计中出现较小概率的事件从而达到较高效率的匹配,因此这样做在匹配结果上无论如何都不会使人满意。而且统计学往往只统计颜色信息往往就忽略了空间分布导致了损失了大量有用的图像信息。 所以要设计一种N维模板,其中既包含颜色信息又包含空间分布信息。在拥有这种模板后还要设计计算N维矢量间距离的算法。 但是RGB颜色空间并非均匀的线性空间,实验结果证明,距离一定的两种颜色,随这两种颜色的不同引起人的色知觉的差异是不同的。也就是说,对一定距离的某两种颜色让人感到色知觉差异很大,但对另外两种一样距离的颜色,可能会让人感觉差异很小。而在对颜色进行聚类量化时,需要用数量来描述颜色间的差别,简称它为色差,那么RGB颜色空间显然不能满足要求。因此需要一个均匀的颜色空间,在这个3维空间中,每个点代表一种颜色,空间中两点之间的距离代表两种颜色的色差,距离越小,色差越小,反之,色差越大。因此在这里采用Lab色空间,它是1976年CIE(国际照明委员会)推荐的一种近似的均匀色空间[10]。自身的优势:前面提到过Lab色彩模型的绝妙之处还在于它弥补了RGB色彩模型色彩分布不均的不足,因为RGB模型在蓝色到绿色之间的过渡色彩过多,而在绿色到红色之间又缺少黄色和其他色彩。另外,它的色域宽阔,它不仅包含了RGB,CMY的所有色域,还能表现它们不能表现的色彩。人的肉眼能感知的色彩,都能通过Lab模型表现出来,因此本实验中准备使用Lab色彩模型。 试验中主要采用颜色直方图作为颜色特征采集方式,利用颜色特征进行图像检索的关键之一是颜色特征的提取。图像的颜色特征可以是各种颜色的比例分布以及颜色的空间分布等,目前,大部分的检索系统都采用颜色比例分布作为颜色基本特征,这方面算法的研究,也多以此为基点,这就是图像领域中的直方图法。具体做法是,在确定颜色空间的基础上,统计每种颜色分量的像素数占图像总像素数的比例,得到图像各种颜色分量的比例分布——直方图,最后把直方图作为图像的颜色特征进行图像检索。 这里简要介绍一下颜色直方图: 1)一般直方图:记
图像P的该特征的直方图为
绝对值距离与欧式距离在计算中,对直方图特征每个颜色分量平等对待,即没有考虑颜色间的相似性。而在计算直方图特征向量的欧式距离时考虑颜色相似矩阵,可采用二次距离度量。直方图二次距离度量形式如下:
式中
四、预期达到的目标
|
| [返回][关闭] |