第26卷 第10期
文章编号:1006-9348(2009) 10-0270-04
计 算 机 仿 真
2009年10月
轮廓检测的图像检索方法
戴 磊
(徐州工程学院信电学院, 江苏徐州221008)
摘要:在图像检索领域中, 形状特征是图像的最重要视觉特征之一, 利用形状特征进行检索可提高检索的准确性, 但形状边界的自动提取一直是图像处理领域多年的难题。为了提高图像精度和准确性, 提出一种基于轮廓检测的图像检索方法, 首先用色彩聚类的方法对图像进行预处理, 对有意义的聚类区域进行边缘追踪, 然后采用基于Snake 轮廓检测的算法完成图像分割, 提取底层形状特征并用傅立叶描述子加以描述, 进行相似度匹配。引入支持向量机的相关反馈算法来提高检索精度。实验结果表明了方法的有效性。
关键词:图像检索; 色彩聚类; 轮廓检测; 傅立叶描述子; 支持向量机中图分类号:TP391141 文献标识码:B
A New Image Retr i eva l M ethod of Con tour D etecti on
DA ILei
(Depart m ent of I nfor mati onr and Electrical Engineering , Xuzhou I 221008, China ) ABSTRACT:The shape feature of i m ages is one of the . It can be used t o i m p r ove the accuracy of i m age retrieval. However aut has l ong been a difficult p r oblem in i m 2age p r ocessing . A ne w i m age detecti on is p resented . First , a method of col or clus 2tering is e mp l oyed t o r cont our -tracking is used t o the meaningful clustering regi on . Then an cont our detecti on is invoked t o i m p le ment the i m age seg mentati on . The l ow -level shape subsequently extracted and described by Fourier descri p t or for si m ilar matching . A t last, t o i m p r ove p on of i m age retrieval, a relevance feedback mechanis m based on support vect or machines is in 2voked . The experi m ent results show that this method is effective .
KE YWO R D S:I m age retrieval; Col or clustering; Cont our detecti on; Fourier descri p t or; Support vect or machines (S VM )
CB I R 可分为:基于颜色特征的图像检索技术, 基于纹理的图
1 引言
近年来随着计算机技术和网络技术的发展, 特别是伴随着网络带宽的增长、大规模存储介质的普及以及多媒体应用的兴起, 数字图像的数量正以惊人的速度增长。面对如此巨大的信息, 传统的基于文本的信息检索技术(T B I R ) 逐渐不能适应要求, 互连网上的图像检索已逐渐步入了以图像自身内容为基础的检索阶段。基于内容的图像检索(CB I R ) 正成为图像检索领域的研究热点[1]。
基于内容的图像检索首先需要提取图像的特征, 这些特征能够反映图像的视觉特点; 其获取的特征量存入特征库, 作为图像检索时的比较依据。根据所提取特征的不同,
收稿日期:2009-07-29 修回日期:2009-08-10
像检索技术, 基于形状的图像检索技术[2]。形状特征是图像
的最重要视觉特征之一, 是描述高层视觉特征的重要手段, 因此利用形状特征进行检索可提高检索的准确性[3]。
基于颜色特征的图像检索技术和基于纹理的图像检索技术目前发展比较成熟, 基于形状的图像检索技术还有待进一步研究。形状特征的表达必须以对图像中物体或区域的划分为基础。目前的图像分割算法在准确完成图像形状的提取上是一个难点, 其次形状特征描述子难以准确建立, 另外由于视点的变化还会产生各种失真问题。
鉴于此, 本文提出一种基于Snake 轮廓检测的图像检索方法。首先通过此方法完成图像分割, 然后提取底层的形状轮廓特征, 并用傅立叶描述子加以描述, 并加入相关反馈技术来提高反馈检索精度。该算法能较好解决形状特征的自动提取问题并将反馈技术很好的融入到图像检索中。
一个值作为Snake 模型。这样, 既对提取轮廓线的结果没有
2 图像分割
Snake 算法是由Kass 于1987年提出的一种边缘检测方
显著的影响, 又大大降低了运算量。
2. 3 Snake 分割
Snake 模型为:设V (s ) =(x (s ) , y (s ) ) , 其中s 为弧长, V (s ) 为轮廓曲线, 那么Snake 动态轮廓模型可以定义为以V (s ) 为变量的能量函数, 即
E snake =
法, 该算法模型又称为主动轮廓线模型, 该模型能够生成一条包围目标物体的闭合、光滑曲线[4]。它的主要原理是:位于势能场中的物体, 会受外力的作用向势能低的地方运动。如果图像是一个势能场, 那么放置在图像上的一条曲线也会向势能低的地方运动, 最终停在一个能量极小位置。根据不同的目的设计“图像势能场”, 可以利用这条活动曲线实现边缘检测、图像分割等功能。2. 1 图像预处理
Snake 模型的初值设置是一个始终制约Snake 模型应用和发展的重要问题, 因为它要求初值尽可能靠近物体真实轮廓。目前多采用手工选取的办法设置初始边界, 方法繁琐且精度较差。解决办法:可首先采用色彩聚类算法[5]来对图像进行预处理, 再对有意义的聚类区域进行边缘追踪, 并用边缘追踪得到的边界点作为模型初值。
色彩聚类是一种比较常用的图像分割方法, 它是把一幅彩色图像根据其中颜色相似程度划分为几个区域, 每一个区域都由相似的颜色组成。方法如下:
1) 将输入图像转化为带权值的无向图G (v, e ) , 图中的每一个顶点代表图像中的一个像素, 而每个顶点有4个相邻的顶点, 分别由4条边相连, 个顶点颜色的欧氏距离。
2) Col or
(颜色距离阈值) 区域, (像素个数) 。
3) 将所有面积小于T A rea (面积阈值) 的区域同与之相邻, 且颜色距离最小的区域合并。
4) 以多5维特征向量(H, S, I, A, n ) 来标识每一个聚合区域。其中, H, S, I 记录这个区域的平均颜色, A 是这个区域的面积, n 是这个区域的编号。2. 2 边缘追踪
对图像作色彩聚类之后, 即可采用边界追踪算法来对目标区域做边界搜索, 再以搜索结果作为Snake 算法的初值。对于边缘追踪算法, 采用固定起始点的8邻域搜索策略, 并在此基础上作如下改进:
1) 为了解决单像素宽的区域检测问题, 可通过设计基于重叠边界概念的搜索策略来解决, 即单像素宽的区域被看作是两条边界重叠在一起, 称为重叠边界, 而正常的边界称之为单边界, 搜索时, 当遍历了8个邻域找不到单边界时, 就转而寻找重叠边界
2) 为了检测双像素宽的区域, 可根据边界走向来动态设置搜索起始位置, 使搜索时总能保证搜寻起始点在边界的外侧。
然后, 对搜索的结果进行采样, 即每隔两个边界像素取
[E ∫
1
int
(V (s ) ) +E ext (V (S ) ) ]ds(1)
其中, E int (V (s ) ) 为内部能量函数定义为:
(s ) |2+β(s ) |V ″(s ) |2E int (V (s ) ) =a (s ) |V ′
(2)
(s ) 为内部能量函数的一阶项, 它用于控制轮廓线, 其中, V ′
(s ) 为内部能量函数的二阶项, 它用于控使其尽可能连续; V ″
制轮廓线, 使其尽可能平滑。a (s ) 和β(s ) 为以s 为变量的
一、二阶项权值。
E ext (V (s ) ) 为外部能量函数, 多以图像的梯度充当, 定
义为:
2
E ext (V (s ) ) =—|µI (V (s ) ) |
(3)
它是动态轮廓线的收缩限制力用于控制轮廓线, 使其Snake :() =
n -i
i =0
V i ) +(1-λi ) E ext (V i ) (4)
, , 1,. . . , V n }为离散化的轮廓曲线, V 0, V 1,. . . , n 个点; λi ∈[0, 1]为权值。
将外部函数代入, E snake (V ) =m in (E snake (V ) ) 使得能量总和为最低, 此时得到的V ={V 0, V 1, V 2,. . . , V n }即为所求轮廓。
首先通过在感兴趣目标附近放置一个初始轮廓线, 在内部能量(内力) 和外部能量(外力) 的作用下变形。外部能量吸引活动轮廓朝物体边缘活动, 而内部能量保持活动轮廓的光滑性和拓扑性, 当能量达到最小时, 活动轮廓收敛到所要检测的物体边缘。
~
~
~
~
~
~
3 提取轮廓特征
通常来说, 形状特征有两种表示方法, 一种是轮廓特征的, 一种是区域特征的。前者用到物体的外边界, 而后者则关系到整个形状区域。考虑到本文提出的算法是基于轮廓特征的, 应采用傅立叶描述子提取底层的轮廓特征作为目标区域的特征量进行图像匹配。
傅立叶形状描述子(Fourier shape descri p t ors ) 的基本思想是用物体边界的傅立叶变换作为其形状描述。假设一个二维物体的轮廓是由一系列坐标为(x s , y s ) 的像素组成, 其中0≤s ≤N -1, 而N 是轮廓上像素的总数。从这些边界点的坐标中可以推导出三种形状表达, 分别是曲率函数、质心距离和复坐标函数。
轮廓线上某点的曲率定义为轮廓切向角度相对于弧长
的变化率。曲率函数K (s ) 可以表示为:
K (s ) =
(s ) ds
(5)
其中, d (f 1, f 2) 是两幅图像形状向量之间的欧式距离; nor m (d (f 1, f 2) ) 为d (f 1, f 2) 归一化的结果。
其中, θ(s ) 是轮廓线的切向角度。质心距离定义为从物体边界点到物体中心(x c , y c ) 的距离, 如下所示:
R (s ) =
(x s -x c ) 2+(y s -y c ) 2
(6) (7)
5 基于TSC -SV M 的相关反馈算法
为了能在检索过程中准确实时的跟踪用户的查询需求, 以及在用户的查询需求发生转移时, 更好的进行图像检索, 应用时空约束支持向量机(TS C -S VM ) [6][7]方法会显得格外有效。
在图像检索中, 相关反馈信息具有明显的空间特性和时间特性。一方面, 相关反馈信息中的正例集合和负例集合从两个相反的角度表现了用户的查询需求。相关反馈信息中的正例集合和负例集合在特征空间分布上是不对称的,
这就是相关反馈信息的空间特性; 另一方面, 在相关反馈这种在线的人机交互过程中, 从系统的角度来看, 每一次循环中系统返回给用户评价的图像应该是尽可能有利于系统学习到用户需求的图像。随着不断的循环反馈, 系统返回的待评价图像应该越来越能体现用户的查询需求, 说明反馈图像存在明显的时间特性。
采用TSC -S VM 1所示。由于-S , 初始相关。因此, 用(, 或者通过浏览图像数据库由用户选择) 图(可以通过浏览图像数据库由用户选择) 。
复坐标函数是用复数所表示的像素坐标:
Z (s ) =(x s -x c ) +j (y s -y c )
对这种复坐标函数的傅立叶变换会产生一系列复数系数。这些系数在频率上表示了物体形状, 其中低频分量表示形状的宏观属性, 高频分量表达了形状的细节特征。形状描述符可以从这些变换参数中得出。为了保持旋转无关性, 形状描述符仅仅保留了参数的大小信息, 而省去了相位信息。缩放的无关性是通过将参数的大小除以DC 分量(或第一个非零参数) 的大小来保证的。请注意变换无关性是基于轮廓的形状表示所固有的特点。
对于曲率函数和质心距离函数, 只考虑正频率的坐标轴, 因为这时函数的傅立叶变换是对称的, 即有|F -i |=|F i |。基于曲率函数的形状描述符表示为:
(8) f K =|F 1|, |F 2|,. . . , |F M /2其中, F i 表示傅立叶变换参数的第i 个分量。类似的, 由质
心距离所导出的形状描述符为:
f R =
|F ||F ||F |
, ,. . . , |F 0||F 0|F 0(9)
对于复坐标函数, 用。由于DC 。因此, 化。:
f Z =
|F ()
|
|F 1|
,. . . ,
|F ||F ||F |
, ,. . . , |F 1||F 1||F 1|
(10)
为保证数据库中所有物体的形状特征都有相同的长度,
在实施傅立叶变换之前需要将所有边界点的数目统一为M 。例如M 可以取为2n =64, 这就可以采用快速傅立叶变换来提高算法效率。
4 相似性度量
基于内容的图像检索通常以用户提交的例子图像(sa m 2p le i m age ) 作为查询, 通过计算例子图像和数据库中候选图像之间在视觉特征上的相似度来进行匹配。常用的相似度方法都是向量空间模型, 即将视觉特征看作是向量空间中的点, 通过计算两个点之间的距离来衡量图像特征间的相似度, 距离越小表示越相似。
形状的相似度采用欧式距离进行计算, 首先将形状特征向量归一化, 设图像I 1和图像I 2的特征向量分别为f 1和f 2, 图像I 1和图像I 2相似度计算公式为:
(11) S =1-nor m (d (f 1, f 2) )
图1 采用TSC -SV M 图像检索流程图
接着, TSC -S VM 对反馈信息进行学习, 训练出最优分
界面w ・x +b =0(x 是反馈图像的图像底层特征向量) 。使得
Φ(w ) =||w ||2+C ∑S ξi i
2i =1
(L 是训练集S 中反馈图像的总数目)
最小, 并且满足约束条件:
y i (x i ・w +b ) ≥1-ξi (1≤i ≤L, ξi ≥0)
L
(12)
加大, 本文方法优势更明显, 经过15次反馈能够得到约84%
的正确率
。
(13)
其中b ∈R, y ∈{-1, 1}是反馈图像的用户评价(y =1表示属于相关类, y =-1表示属于非相关类) , C 为平衡常数, ξi 是松弛变量。根据得到的分界面, 系统按以下方法生成检索结果和待评价图像, 返回给用户:
1) 检索结果的生成
系统通过计算图像数据库中的每一幅图像(底层特征为z ) 到最优分界面的距离(即w ・z +b, 这里的距离有正负值之分) 来判断该图像属于哪一类(w ・z +b ≥0为相关类, w ・z +b
2) 待评价图像的生成
系统将图像数据库中到分界面的距离绝对值最小(包括相关和不相关) 的若干幅图像作为待评价图像返回给用户。然后, 若用户对检索结果不满意, 则对待评价图像做出相关性评价, 系统将这些评价过的图像加入到反馈信息中, 开始新的一次反馈循环; 若用户对检索结果满意, 则检索结束。
6 实验结果分析
本文在W indows 2000原型系统, 开发工具为vc ++61P317G, RAM 256M 的PC 验。Corel 图像库中选取的。
实验中用户首先从图像集中选取一幅图像作为初始正例图像, 将该图像所属的主题确定为查询需求(即所有属于该主题的图像都满足查询需求) , 同时选取图像集中的一幅非查询需求的图像做为初始负例图像, 初始相关反馈信息即由这两幅图像组成(称为第0次反馈循环) , 并开始检索过程。接着, 采用TSC -S VM 对获得的相关反馈信息进行学习, 系统利用学习到的分界面返回8幅相关图像作为检索结果, 并返回8幅待评价图像。然后, 用户按是否满足查询需求(即是否属于相关例子图像所属的主题) 来对待评价图像进行相关性评价(相关或不相关) , 并将这些评价过的图像返回, 与原有的相关反馈信息一起构成新的相关反馈信息, 并开始新一次的反馈循环。随着反馈循环次数的增加, 图像的检索精度会逐渐提高。在查询需求发生转移的情况下, TSC -S VM 方法也能够迅速跟踪到查询需求的转移, 快速提高检索的查准率。
图2为针对一幅图像的检索结果。上面第一幅为待检索的图像, 下面八幅为检索到的结果。图3为本文方法与基于颜色特征检索方法性能对比, 可以看出本文方法的每次检索正确率均优于基于颜色特征检索方法。随着反馈次数的
7 总结
对于形状特征的图像检索, 轮廓边界的自动提取一直是图像处理领域的一个难题。本文提出的基于Snake 轮廓检测的图像检索方法, 该算法通过对图像进行预处理, 对相关区域进行边缘追踪, 完成图像分割, 再用傅立叶描述子加以描述, 进行相似度匹配。引入支持应用时空约束支持向量机的相关反馈算法来提高检索精度。算法对形状特征明显的图像, 检索的正确率会优于传统的基于颜色和纹理的特征检索, 随着反馈次数的加大, 优势会更明显。
对目标的形状进行分析主要是基于轮廓边界和基于区域的方法。本文算法还只是利用了形状的外部边缘。如何与基于区域的方法相综合使用, 是今后要加强研究的一个方向。参考文献:
[1] 周媛, 石跃祥. 基于内容的多特征图像检索中的关键技术[J ].
图书馆, 2007, (3) . (下转第293页)
861-867.
[2] E R Ronan, et a1. A power electr onic -based distributi on trans 2
f or mer[J ].-543.
[3] MMarches oni, R Novar o, S Savi o . AC l ocomotive conversi on sys 2
tem s without heavy transf or mers:is it a p racticable s oluti on? [C ].Pr oceedings of the 2002I EEE I nternati onal Sy mposium on I ndustri 2al Electr onics . [s . I . ], 2002, 4:1172∃1177.
[4] 王丹, 等. 自平衡电子电力变压器[J ].中国电机工程学报,
2007, 27(6) :78-83.
[5] 黄贻煜, 等. 电力电子变压器在输电系统中的控制策略研究
[J ].继电器, 2004, 32(6) :35-39.
[6] 潘诗锋, 赵剑锋. 电力电子变压器及其发展综述[J ].江苏电
I EEE Trans on Power Delivery, 2002, 17(2) :537
[7] 董德智, 等. 基于双P WM 变换的电力电子变压器[J ].安徽
工业大学学报, 2006, 23(2) :169-173.
[8] 李茜. 电子变压器的小型化发展[J ].西南科技大学学报,
2004, 19(3) :45-48.
[9] 马先明, 张铁民. 压电陶瓷变压器在低压电源设计上的应用
[C ].中国农业工程学会2005年学术年会论文集, 2005:498-501.
[10] 黄俊, 王兆安编. 电力电子变流技术[M].北京:机械工业出
版社,
1995.
[作者简介]
储 健(1961-) , 男(汉族) , 天津人, 工学硕士,
副教授, 硕士生导师。研究方向:控制理论与控制工程。
机工程, 2003, 22(6) :52-54.
刘丽英(1976-) , 女(汉族) , 内蒙古凉城人, 工学
硕士, 讲师, 研究方向:电力电子与电力传动。
(上接第193页)
[5] 薛定宇. 反馈控制系统设计与分析[M].北京:清华大学出版
参考文献:
[1] 韩京清. 从P I D 技术到“自抗扰控制”技术[J ].控制工程,
2002, 5.
[2] 韩京清. 自抗扰控制器及其应用[J ].控制与决策, 1998, 13
(1) .
[3] 韩京清. 一类不确定对象的扩张状态观测器[].社, 20001250-
260.
[]
) , 男(汉族) , 浙江省台州市人, 硕
, 计算机控制。
夏 扬(1955-) , 男(汉族) , 安徽安庆人, 博士,
教授, 研究方向:主要从事非线性控制、智能控制、计算机控制系统等方面的教学与研究工作。
策, 1995, 10(1) .
[4] 刘鸣, 邵诚. [J ].
控制与决策, 夏 晴(1984-) , 男(汉族) , 江苏靖江人, 硕士
生, 研究方向:计算机控制。
(上接第273页)
[2] 戚红梅. 基于内容的图像信息资源检索技术进展研究[J ].情
[7] B Sch lkopf, C Burges and A S mola . Advances in Kernel Meth 2
ods:
Support Vect or Learning [M ].
Ca mbridge, MA:M I T
Press,
1999.
报杂志, 2008, (1) .
[3] Dong W ei -jun, Zhou M ing -quan, Geng Guo -hua . I m age re 2
trieval technique based on shape and s patial relati onshi p [J ].Com 2puter Engineering, 2005, 31:170-172.
[4] M Kass, A W itkin, DTerz opouls . Snake:active cont our models
[C ].
Pr oceeding
of
I nternati onal
Journal
of
Computer
V isi on, 1988.
[5] 李书达, 张新荣. 应用Snake 模型提取彩色图像目标轮廓线的
[作者简介]
戴 磊(1973-) , 男(汉族) , 江苏徐州人, 讲师,
硕士, 主要研究方向:图形图像处理和数据库。
研究[J ].中国图像图形学报A, 2003, (11) .
[6] P Hong, Q Tian, T S Huang . I ncor porate SupportVect orMachines
t o Content -Based I m age Retrieval with Relevance Feedback [J ].I EEE 2000I nternati onal Conference on I m age Pr ocessing (I C I P ’2000) , Vancouver, Canada, Sep 10-13, 2000, 3:750-753.
第26卷 第10期
文章编号:1006-9348(2009) 10-0270-04
计 算 机 仿 真
2009年10月
轮廓检测的图像检索方法
戴 磊
(徐州工程学院信电学院, 江苏徐州221008)
摘要:在图像检索领域中, 形状特征是图像的最重要视觉特征之一, 利用形状特征进行检索可提高检索的准确性, 但形状边界的自动提取一直是图像处理领域多年的难题。为了提高图像精度和准确性, 提出一种基于轮廓检测的图像检索方法, 首先用色彩聚类的方法对图像进行预处理, 对有意义的聚类区域进行边缘追踪, 然后采用基于Snake 轮廓检测的算法完成图像分割, 提取底层形状特征并用傅立叶描述子加以描述, 进行相似度匹配。引入支持向量机的相关反馈算法来提高检索精度。实验结果表明了方法的有效性。
关键词:图像检索; 色彩聚类; 轮廓检测; 傅立叶描述子; 支持向量机中图分类号:TP391141 文献标识码:B
A New Image Retr i eva l M ethod of Con tour D etecti on
DA ILei
(Depart m ent of I nfor mati onr and Electrical Engineering , Xuzhou I 221008, China ) ABSTRACT:The shape feature of i m ages is one of the . It can be used t o i m p r ove the accuracy of i m age retrieval. However aut has l ong been a difficult p r oblem in i m 2age p r ocessing . A ne w i m age detecti on is p resented . First , a method of col or clus 2tering is e mp l oyed t o r cont our -tracking is used t o the meaningful clustering regi on . Then an cont our detecti on is invoked t o i m p le ment the i m age seg mentati on . The l ow -level shape subsequently extracted and described by Fourier descri p t or for si m ilar matching . A t last, t o i m p r ove p on of i m age retrieval, a relevance feedback mechanis m based on support vect or machines is in 2voked . The experi m ent results show that this method is effective .
KE YWO R D S:I m age retrieval; Col or clustering; Cont our detecti on; Fourier descri p t or; Support vect or machines (S VM )
CB I R 可分为:基于颜色特征的图像检索技术, 基于纹理的图
1 引言
近年来随着计算机技术和网络技术的发展, 特别是伴随着网络带宽的增长、大规模存储介质的普及以及多媒体应用的兴起, 数字图像的数量正以惊人的速度增长。面对如此巨大的信息, 传统的基于文本的信息检索技术(T B I R ) 逐渐不能适应要求, 互连网上的图像检索已逐渐步入了以图像自身内容为基础的检索阶段。基于内容的图像检索(CB I R ) 正成为图像检索领域的研究热点[1]。
基于内容的图像检索首先需要提取图像的特征, 这些特征能够反映图像的视觉特点; 其获取的特征量存入特征库, 作为图像检索时的比较依据。根据所提取特征的不同,
收稿日期:2009-07-29 修回日期:2009-08-10
像检索技术, 基于形状的图像检索技术[2]。形状特征是图像
的最重要视觉特征之一, 是描述高层视觉特征的重要手段, 因此利用形状特征进行检索可提高检索的准确性[3]。
基于颜色特征的图像检索技术和基于纹理的图像检索技术目前发展比较成熟, 基于形状的图像检索技术还有待进一步研究。形状特征的表达必须以对图像中物体或区域的划分为基础。目前的图像分割算法在准确完成图像形状的提取上是一个难点, 其次形状特征描述子难以准确建立, 另外由于视点的变化还会产生各种失真问题。
鉴于此, 本文提出一种基于Snake 轮廓检测的图像检索方法。首先通过此方法完成图像分割, 然后提取底层的形状轮廓特征, 并用傅立叶描述子加以描述, 并加入相关反馈技术来提高反馈检索精度。该算法能较好解决形状特征的自动提取问题并将反馈技术很好的融入到图像检索中。
一个值作为Snake 模型。这样, 既对提取轮廓线的结果没有
2 图像分割
Snake 算法是由Kass 于1987年提出的一种边缘检测方
显著的影响, 又大大降低了运算量。
2. 3 Snake 分割
Snake 模型为:设V (s ) =(x (s ) , y (s ) ) , 其中s 为弧长, V (s ) 为轮廓曲线, 那么Snake 动态轮廓模型可以定义为以V (s ) 为变量的能量函数, 即
E snake =
法, 该算法模型又称为主动轮廓线模型, 该模型能够生成一条包围目标物体的闭合、光滑曲线[4]。它的主要原理是:位于势能场中的物体, 会受外力的作用向势能低的地方运动。如果图像是一个势能场, 那么放置在图像上的一条曲线也会向势能低的地方运动, 最终停在一个能量极小位置。根据不同的目的设计“图像势能场”, 可以利用这条活动曲线实现边缘检测、图像分割等功能。2. 1 图像预处理
Snake 模型的初值设置是一个始终制约Snake 模型应用和发展的重要问题, 因为它要求初值尽可能靠近物体真实轮廓。目前多采用手工选取的办法设置初始边界, 方法繁琐且精度较差。解决办法:可首先采用色彩聚类算法[5]来对图像进行预处理, 再对有意义的聚类区域进行边缘追踪, 并用边缘追踪得到的边界点作为模型初值。
色彩聚类是一种比较常用的图像分割方法, 它是把一幅彩色图像根据其中颜色相似程度划分为几个区域, 每一个区域都由相似的颜色组成。方法如下:
1) 将输入图像转化为带权值的无向图G (v, e ) , 图中的每一个顶点代表图像中的一个像素, 而每个顶点有4个相邻的顶点, 分别由4条边相连, 个顶点颜色的欧氏距离。
2) Col or
(颜色距离阈值) 区域, (像素个数) 。
3) 将所有面积小于T A rea (面积阈值) 的区域同与之相邻, 且颜色距离最小的区域合并。
4) 以多5维特征向量(H, S, I, A, n ) 来标识每一个聚合区域。其中, H, S, I 记录这个区域的平均颜色, A 是这个区域的面积, n 是这个区域的编号。2. 2 边缘追踪
对图像作色彩聚类之后, 即可采用边界追踪算法来对目标区域做边界搜索, 再以搜索结果作为Snake 算法的初值。对于边缘追踪算法, 采用固定起始点的8邻域搜索策略, 并在此基础上作如下改进:
1) 为了解决单像素宽的区域检测问题, 可通过设计基于重叠边界概念的搜索策略来解决, 即单像素宽的区域被看作是两条边界重叠在一起, 称为重叠边界, 而正常的边界称之为单边界, 搜索时, 当遍历了8个邻域找不到单边界时, 就转而寻找重叠边界
2) 为了检测双像素宽的区域, 可根据边界走向来动态设置搜索起始位置, 使搜索时总能保证搜寻起始点在边界的外侧。
然后, 对搜索的结果进行采样, 即每隔两个边界像素取
[E ∫
1
int
(V (s ) ) +E ext (V (S ) ) ]ds(1)
其中, E int (V (s ) ) 为内部能量函数定义为:
(s ) |2+β(s ) |V ″(s ) |2E int (V (s ) ) =a (s ) |V ′
(2)
(s ) 为内部能量函数的一阶项, 它用于控制轮廓线, 其中, V ′
(s ) 为内部能量函数的二阶项, 它用于控使其尽可能连续; V ″
制轮廓线, 使其尽可能平滑。a (s ) 和β(s ) 为以s 为变量的
一、二阶项权值。
E ext (V (s ) ) 为外部能量函数, 多以图像的梯度充当, 定
义为:
2
E ext (V (s ) ) =—|µI (V (s ) ) |
(3)
它是动态轮廓线的收缩限制力用于控制轮廓线, 使其Snake :() =
n -i
i =0
V i ) +(1-λi ) E ext (V i ) (4)
, , 1,. . . , V n }为离散化的轮廓曲线, V 0, V 1,. . . , n 个点; λi ∈[0, 1]为权值。
将外部函数代入, E snake (V ) =m in (E snake (V ) ) 使得能量总和为最低, 此时得到的V ={V 0, V 1, V 2,. . . , V n }即为所求轮廓。
首先通过在感兴趣目标附近放置一个初始轮廓线, 在内部能量(内力) 和外部能量(外力) 的作用下变形。外部能量吸引活动轮廓朝物体边缘活动, 而内部能量保持活动轮廓的光滑性和拓扑性, 当能量达到最小时, 活动轮廓收敛到所要检测的物体边缘。
~
~
~
~
~
~
3 提取轮廓特征
通常来说, 形状特征有两种表示方法, 一种是轮廓特征的, 一种是区域特征的。前者用到物体的外边界, 而后者则关系到整个形状区域。考虑到本文提出的算法是基于轮廓特征的, 应采用傅立叶描述子提取底层的轮廓特征作为目标区域的特征量进行图像匹配。
傅立叶形状描述子(Fourier shape descri p t ors ) 的基本思想是用物体边界的傅立叶变换作为其形状描述。假设一个二维物体的轮廓是由一系列坐标为(x s , y s ) 的像素组成, 其中0≤s ≤N -1, 而N 是轮廓上像素的总数。从这些边界点的坐标中可以推导出三种形状表达, 分别是曲率函数、质心距离和复坐标函数。
轮廓线上某点的曲率定义为轮廓切向角度相对于弧长
的变化率。曲率函数K (s ) 可以表示为:
K (s ) =
(s ) ds
(5)
其中, d (f 1, f 2) 是两幅图像形状向量之间的欧式距离; nor m (d (f 1, f 2) ) 为d (f 1, f 2) 归一化的结果。
其中, θ(s ) 是轮廓线的切向角度。质心距离定义为从物体边界点到物体中心(x c , y c ) 的距离, 如下所示:
R (s ) =
(x s -x c ) 2+(y s -y c ) 2
(6) (7)
5 基于TSC -SV M 的相关反馈算法
为了能在检索过程中准确实时的跟踪用户的查询需求, 以及在用户的查询需求发生转移时, 更好的进行图像检索, 应用时空约束支持向量机(TS C -S VM ) [6][7]方法会显得格外有效。
在图像检索中, 相关反馈信息具有明显的空间特性和时间特性。一方面, 相关反馈信息中的正例集合和负例集合从两个相反的角度表现了用户的查询需求。相关反馈信息中的正例集合和负例集合在特征空间分布上是不对称的,
这就是相关反馈信息的空间特性; 另一方面, 在相关反馈这种在线的人机交互过程中, 从系统的角度来看, 每一次循环中系统返回给用户评价的图像应该是尽可能有利于系统学习到用户需求的图像。随着不断的循环反馈, 系统返回的待评价图像应该越来越能体现用户的查询需求, 说明反馈图像存在明显的时间特性。
采用TSC -S VM 1所示。由于-S , 初始相关。因此, 用(, 或者通过浏览图像数据库由用户选择) 图(可以通过浏览图像数据库由用户选择) 。
复坐标函数是用复数所表示的像素坐标:
Z (s ) =(x s -x c ) +j (y s -y c )
对这种复坐标函数的傅立叶变换会产生一系列复数系数。这些系数在频率上表示了物体形状, 其中低频分量表示形状的宏观属性, 高频分量表达了形状的细节特征。形状描述符可以从这些变换参数中得出。为了保持旋转无关性, 形状描述符仅仅保留了参数的大小信息, 而省去了相位信息。缩放的无关性是通过将参数的大小除以DC 分量(或第一个非零参数) 的大小来保证的。请注意变换无关性是基于轮廓的形状表示所固有的特点。
对于曲率函数和质心距离函数, 只考虑正频率的坐标轴, 因为这时函数的傅立叶变换是对称的, 即有|F -i |=|F i |。基于曲率函数的形状描述符表示为:
(8) f K =|F 1|, |F 2|,. . . , |F M /2其中, F i 表示傅立叶变换参数的第i 个分量。类似的, 由质
心距离所导出的形状描述符为:
f R =
|F ||F ||F |
, ,. . . , |F 0||F 0|F 0(9)
对于复坐标函数, 用。由于DC 。因此, 化。:
f Z =
|F ()
|
|F 1|
,. . . ,
|F ||F ||F |
, ,. . . , |F 1||F 1||F 1|
(10)
为保证数据库中所有物体的形状特征都有相同的长度,
在实施傅立叶变换之前需要将所有边界点的数目统一为M 。例如M 可以取为2n =64, 这就可以采用快速傅立叶变换来提高算法效率。
4 相似性度量
基于内容的图像检索通常以用户提交的例子图像(sa m 2p le i m age ) 作为查询, 通过计算例子图像和数据库中候选图像之间在视觉特征上的相似度来进行匹配。常用的相似度方法都是向量空间模型, 即将视觉特征看作是向量空间中的点, 通过计算两个点之间的距离来衡量图像特征间的相似度, 距离越小表示越相似。
形状的相似度采用欧式距离进行计算, 首先将形状特征向量归一化, 设图像I 1和图像I 2的特征向量分别为f 1和f 2, 图像I 1和图像I 2相似度计算公式为:
(11) S =1-nor m (d (f 1, f 2) )
图1 采用TSC -SV M 图像检索流程图
接着, TSC -S VM 对反馈信息进行学习, 训练出最优分
界面w ・x +b =0(x 是反馈图像的图像底层特征向量) 。使得
Φ(w ) =||w ||2+C ∑S ξi i
2i =1
(L 是训练集S 中反馈图像的总数目)
最小, 并且满足约束条件:
y i (x i ・w +b ) ≥1-ξi (1≤i ≤L, ξi ≥0)
L
(12)
加大, 本文方法优势更明显, 经过15次反馈能够得到约84%
的正确率
。
(13)
其中b ∈R, y ∈{-1, 1}是反馈图像的用户评价(y =1表示属于相关类, y =-1表示属于非相关类) , C 为平衡常数, ξi 是松弛变量。根据得到的分界面, 系统按以下方法生成检索结果和待评价图像, 返回给用户:
1) 检索结果的生成
系统通过计算图像数据库中的每一幅图像(底层特征为z ) 到最优分界面的距离(即w ・z +b, 这里的距离有正负值之分) 来判断该图像属于哪一类(w ・z +b ≥0为相关类, w ・z +b
2) 待评价图像的生成
系统将图像数据库中到分界面的距离绝对值最小(包括相关和不相关) 的若干幅图像作为待评价图像返回给用户。然后, 若用户对检索结果不满意, 则对待评价图像做出相关性评价, 系统将这些评价过的图像加入到反馈信息中, 开始新的一次反馈循环; 若用户对检索结果满意, 则检索结束。
6 实验结果分析
本文在W indows 2000原型系统, 开发工具为vc ++61P317G, RAM 256M 的PC 验。Corel 图像库中选取的。
实验中用户首先从图像集中选取一幅图像作为初始正例图像, 将该图像所属的主题确定为查询需求(即所有属于该主题的图像都满足查询需求) , 同时选取图像集中的一幅非查询需求的图像做为初始负例图像, 初始相关反馈信息即由这两幅图像组成(称为第0次反馈循环) , 并开始检索过程。接着, 采用TSC -S VM 对获得的相关反馈信息进行学习, 系统利用学习到的分界面返回8幅相关图像作为检索结果, 并返回8幅待评价图像。然后, 用户按是否满足查询需求(即是否属于相关例子图像所属的主题) 来对待评价图像进行相关性评价(相关或不相关) , 并将这些评价过的图像返回, 与原有的相关反馈信息一起构成新的相关反馈信息, 并开始新一次的反馈循环。随着反馈循环次数的增加, 图像的检索精度会逐渐提高。在查询需求发生转移的情况下, TSC -S VM 方法也能够迅速跟踪到查询需求的转移, 快速提高检索的查准率。
图2为针对一幅图像的检索结果。上面第一幅为待检索的图像, 下面八幅为检索到的结果。图3为本文方法与基于颜色特征检索方法性能对比, 可以看出本文方法的每次检索正确率均优于基于颜色特征检索方法。随着反馈次数的
7 总结
对于形状特征的图像检索, 轮廓边界的自动提取一直是图像处理领域的一个难题。本文提出的基于Snake 轮廓检测的图像检索方法, 该算法通过对图像进行预处理, 对相关区域进行边缘追踪, 完成图像分割, 再用傅立叶描述子加以描述, 进行相似度匹配。引入支持应用时空约束支持向量机的相关反馈算法来提高检索精度。算法对形状特征明显的图像, 检索的正确率会优于传统的基于颜色和纹理的特征检索, 随着反馈次数的加大, 优势会更明显。
对目标的形状进行分析主要是基于轮廓边界和基于区域的方法。本文算法还只是利用了形状的外部边缘。如何与基于区域的方法相综合使用, 是今后要加强研究的一个方向。参考文献:
[1] 周媛, 石跃祥. 基于内容的多特征图像检索中的关键技术[J ].
图书馆, 2007, (3) . (下转第293页)
861-867.
[2] E R Ronan, et a1. A power electr onic -based distributi on trans 2
f or mer[J ].-543.
[3] MMarches oni, R Novar o, S Savi o . AC l ocomotive conversi on sys 2
tem s without heavy transf or mers:is it a p racticable s oluti on? [C ].Pr oceedings of the 2002I EEE I nternati onal Sy mposium on I ndustri 2al Electr onics . [s . I . ], 2002, 4:1172∃1177.
[4] 王丹, 等. 自平衡电子电力变压器[J ].中国电机工程学报,
2007, 27(6) :78-83.
[5] 黄贻煜, 等. 电力电子变压器在输电系统中的控制策略研究
[J ].继电器, 2004, 32(6) :35-39.
[6] 潘诗锋, 赵剑锋. 电力电子变压器及其发展综述[J ].江苏电
I EEE Trans on Power Delivery, 2002, 17(2) :537
[7] 董德智, 等. 基于双P WM 变换的电力电子变压器[J ].安徽
工业大学学报, 2006, 23(2) :169-173.
[8] 李茜. 电子变压器的小型化发展[J ].西南科技大学学报,
2004, 19(3) :45-48.
[9] 马先明, 张铁民. 压电陶瓷变压器在低压电源设计上的应用
[C ].中国农业工程学会2005年学术年会论文集, 2005:498-501.
[10] 黄俊, 王兆安编. 电力电子变流技术[M].北京:机械工业出
版社,
1995.
[作者简介]
储 健(1961-) , 男(汉族) , 天津人, 工学硕士,
副教授, 硕士生导师。研究方向:控制理论与控制工程。
机工程, 2003, 22(6) :52-54.
刘丽英(1976-) , 女(汉族) , 内蒙古凉城人, 工学
硕士, 讲师, 研究方向:电力电子与电力传动。
(上接第193页)
[5] 薛定宇. 反馈控制系统设计与分析[M].北京:清华大学出版
参考文献:
[1] 韩京清. 从P I D 技术到“自抗扰控制”技术[J ].控制工程,
2002, 5.
[2] 韩京清. 自抗扰控制器及其应用[J ].控制与决策, 1998, 13
(1) .
[3] 韩京清. 一类不确定对象的扩张状态观测器[].社, 20001250-
260.
[]
) , 男(汉族) , 浙江省台州市人, 硕
, 计算机控制。
夏 扬(1955-) , 男(汉族) , 安徽安庆人, 博士,
教授, 研究方向:主要从事非线性控制、智能控制、计算机控制系统等方面的教学与研究工作。
策, 1995, 10(1) .
[4] 刘鸣, 邵诚. [J ].
控制与决策, 夏 晴(1984-) , 男(汉族) , 江苏靖江人, 硕士
生, 研究方向:计算机控制。
(上接第273页)
[2] 戚红梅. 基于内容的图像信息资源检索技术进展研究[J ].情
[7] B Sch lkopf, C Burges and A S mola . Advances in Kernel Meth 2
ods:
Support Vect or Learning [M ].
Ca mbridge, MA:M I T
Press,
1999.
报杂志, 2008, (1) .
[3] Dong W ei -jun, Zhou M ing -quan, Geng Guo -hua . I m age re 2
trieval technique based on shape and s patial relati onshi p [J ].Com 2puter Engineering, 2005, 31:170-172.
[4] M Kass, A W itkin, DTerz opouls . Snake:active cont our models
[C ].
Pr oceeding
of
I nternati onal
Journal
of
Computer
V isi on, 1988.
[5] 李书达, 张新荣. 应用Snake 模型提取彩色图像目标轮廓线的
[作者简介]
戴 磊(1973-) , 男(汉族) , 江苏徐州人, 讲师,
硕士, 主要研究方向:图形图像处理和数据库。
研究[J ].中国图像图形学报A, 2003, (11) .
[6] P Hong, Q Tian, T S Huang . I ncor porate SupportVect orMachines
t o Content -Based I m age Retrieval with Relevance Feedback [J ].I EEE 2000I nternati onal Conference on I m age Pr ocessing (I C I P ’2000) , Vancouver, Canada, Sep 10-13, 2000, 3:750-753.