编辑: ok2015 | 2019-07-04 |
6 3.2 特征提取 3.2.1 概述 由于 3D 对象的光场数据库从实质上来说就是图像的数据库, 因此 3D 对象的 特征提取在这里转变成为 2D 图像的特征提取.按照图像的特征对图像内容的描 述程度,可以将特征分为底层、中层和高层三个级别.底层特征描述的是最基本 的视觉特征,如形状、颜色、纹理等;
中层特征指图像中包含的逻辑对象;
高层 特征描述图像中的高层语义和抽象概念[1] .中层和高层特征的提取非常复杂,目 前的图像检索技术大部分还是基于底层特征的,因此本文的研究也采用底层的特 征来进行实验. 底层特征中比较常用的有形状特征、颜色特征和纹理特征,以下一一进行介 绍. 3.2.2 形状特征 形状特征不仅需要先将物体或区域从图像中分割出来, 而且还要满足对尺寸、 旋转等变换的不变性,因此提取起来较为复杂.通常来说形状特征有两种,轮廓 特征和区域特征.轮廓特征(例如傅里叶描述符)描述对象的外边界,区域特征 (例如 Zernike 矩描述符)则关系到整个形状区域. 本文使用傅里叶描述符(Fourier Descriptor)来描述对象的轮廓特征.其基本 思路是,先从图像中提取出对象,再从对象中提取出轮廓,沿着对象的轮廓取点, 每个点可以表示成坐标(x,y),那么这一系列的点可以表示成复向量 再对所得的复向量使用离散傅里叶变换 此时便可以用得到的 的模 作为对象的傅里叶描述符. 本文所实现的系统所用的傅里叶描述符为
120 维的实向量,并在程序中简写 为FD 特征.
7 图3.2 沿对象轮廓取点示意图 3.2.3 颜色特征 然后是颜色特征,颜色特征中较为常见的有颜色直方图特征、颜色矩特征以 及颜色聚合向量特征等.其中颜色直方图(color histogram)特征在图像检索中用 的较多,其关注不同的颜色在图像中所占的比例,而与颜色在空间中的位置无关 [5] . 颜色直方图可以基于不同的颜色空间, 例如 RGB 空间和 HSV 空间. 虽然 RGB 空间非常常用,但RGB 空间结构与人们对颜色相似性的主观感受并不是很相符, 因此本文描述的系统采用的是 HSV 空间[1] .计算颜色直方图的方法很简单,将颜 色空间划分为小的颜色区间,此过程称为颜色量化,然后计算每个颜色区间内的 像素数量即得到颜色直方图. 本文所实现的系统用到的 HSV 空间颜色直方图为
256 维的实向量, 并在程序 中简写为 HSV 特征. 3.2.4 纹理特征 然后是纹理特征.纹理特征不依赖于图像的颜色和亮度,但能反映图像中的 同质现象,包含物体表面的结构组织信息.然而由于物体的形状和纹理之间存在 密切关系,加上纹理可能呈现嵌套式的分布,因此利用纹理特征进行图像检索也 存在一定的困难. 纹理特征又包括了小波纹理、Tamura 纹理等.小波纹理根据用于纹理分析的 小波变换分为两种, 金字塔结构的小波变换 (pyramid-structured wavelet transform, PWT)和树形结构的小波变换(tree-structured wavelet transform, TWT) .
8 本文所实现的系统用到的是树形结构的小波变换 TWT,为104 维的实向量, 并在程序中简写为 TWT 特征. 3.3 相似性度量 3.3.1 概述 有了每个视图的特征向量之后,非常重要的一点便是根据这些特征向量计算 对象之间的相似性,也可以表述为计算对象之间的距离,因为可以认为两个对象 之间距离越小,........