ComputerEngineeringandApplications计算机工程与应用2008,44(18)17
基于小波多尺度分解的MeanShift图像滤波方法
孙小炜,李言俊,陈义
SUNXiao-wei,LIYan-jun,CHENYi
西北工业大学航天学院,西安710072CollegeofAstronautics,NorthwesternPolytechnicalUniversity,Xi’an710072,ChinaE-mail:sunxiaoweicn@163.com
SUNXiao-wei,LIYan-jun,CHENYi.ImageMeanShiftfilteringmethodbasedonwaveletmulti-resolutiondecomposi-
(18):tion.ComputerEngineeringandApplications,2008,4417-20.Abstract:CombinedwithwavelettransformandMeanShiftfiltering,anefficientimagefilteringmethodispresented.Firstly,noised
imageisdecomposedtomulti-resolutionsub-bandimagesbyMallatpyramiddecomposition.Highfrequencysub-bandimagesaredenoisedbyMeanShiftfilter,withoutanychangestothelowfrequencyapproximationimage.Denoised-imageisobtainedbycom-posingthehighfrequencydetailimageswithMeanShiftfilteringandlowfrequencyapproximationimage.However,MeanShiftisaniterationscheme.Itwastesmoretimetocalculateandneedsmoreiterationtoensurehighernumericalaccuracy.Inordertoovercomeitsdisadvantage,GaussfunctioniscalculatedapproximatelybyFourierseries.Experimentresultshowsthatthenoiseoftheimageisremovedeffectively.Atthesametime,thedetailoftheimageiskeptwell.ThemethodhasbetterdenoisingeffectthantraditionalGaussfilteringmethod,Wienerfilteringmethod,singlewaveletthresholdingmethodandMeanShiftfilteringmethod.
Keywords:imagefiltering;waveletdecomposition;Gausskernelfunction;Fourierseries;MeanShiftiteration摘要:将小波多尺度分解与传统MeanShift滤波算法相结合提出的一种有效的图像滤波方法。先将含噪声图像进行Mallat塔式分解,获得不同尺度、不同频带的子图像。将低频近似图像保持不变,对高频细节进行MeanShift滤波,最后将低频近似图像与高频滤波后的图像进行合成得到去噪后的图像。由于MeanShift算法是一种迭代方法,要保证较高的数值计算精度则需要较多的迭代次数,耗费较长的计算时间,为克服这一缺点,提出了采用Fourier级数来近似计算高斯函数。实验结果表明该方法在降低噪声的同时能够尽可能的保留图像细节,其去噪效果优于传统的高斯滤波、Wiener滤波方法和单一小波域值法和MeanShift滤波方法。关键词:图像滤波;小波分解;高斯核函数;Fourier级数;MeanShift迭代DOI:10.3778/j.issn.1002-8331.2008.18.006
文章编号:(2008)1002-833118-0017-04
文献标识码:A
中图分类号:TP391.41
图像在形成和传输的过程中,不可避免的要受到噪声的干扰,为了尽量减少噪声对后续图像处理的影响具有重大的意
2]
义。MeanShift模型[1,是一种有效的特征空间分析方法,它可以实现图像的不连续保持性滤波,不仅可以滤除图像中的噪声信息,而且能够自适应地减小局部结构中显著边缘信息的平滑。由于MeanShift模型具有以上优点,因而能够有效滤除图像噪声的同时不损失图像的信息。小波分析[3](WaveletAnal-
方法是一种窗口大小固定但其时间窗和频率窗都可以改ysis)
变的时频局部化分析方法,即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,使得小波变换具有对信号的自适应性。正是由于这种特性使采用小波分析方法获得了较好的效果。
本文采用基于小波多分辨率分析的方法,首先对噪声图像
进行Mallat塔式分解,然后在保持低频图像不变的同时,对每一级图像中的水平、垂直和对角细节信息分别采用MeanShift滤波算法进行处理,滤除杂波干扰。最后将滤波得到的图像与低频近似图像合成得到最终的滤波结果。
1小波分解
1.1小波变换的基本概念
小波函数是一个由单一的函数! 经伸缩、平移而产生的一簇函数,其定义为[3]:
()! a,bx=a
1
!
x-b"
(1)
满足a,其中,(x)b∈R;a≠0。a代表伸缩因子;b代表平移因子;!
基金项目:国家自然科学基金(theNationalNaturalScienceFoundationofChinaunderGrantNo.60575013);西北工业大学研究生创新实验中心
资助项目。
作者简介:孙小炜(1979-),男,博士生,主要研究工作是计算机视觉和视频与图像处理;李言俊(1944-),男,教授,博士,主要研究工作是计算机视
收稿日期:2008-02-27
修回日期:2008-03-31
182008,44(18)ComputerEngineeringandApplications计算机工程与应用
x-b
,即"
核函数K具有多种定义形式,其中最常用的核函数为单位高斯核函数:
(x)KN=e
-‖x‖2#
2
为母小波函数。! (x)经过平移和伸缩变换后得到!
可以生成不同的频率成分。
小波变换的基本思想是通过平移和伸缩等运算功能对原始信号进行多尺度细化分析,即将信号分解为一系列具有不同空间分辨率、不同频率特性和方向特性的子带信号,这些子带信号具有良好的时域和频域特性。可以利用这些特性来表示原始信号的局部特征,进而实现对信号时域和频域的局部分析。
(7)
2
(x)的剖面函数k(x),使得:另外定义核函数K
(x)(‖x‖)(8)K=k
(x)的负导函数g(x),即g(x),其对应的核函数:定义k=-k(′x)(x)(‖x‖)G=g
概率密度函数(的梯度/(的估计为:fx)fx)
! (" (x)/fx)=/f=
(x-xi)2%k′‖
i=1n
2
1.2Mallat塔式分解
它的问世使小波分Mallat算法[3]是小波变换的快速算法,
析的实际意义逐渐被人们所重视。设{Vj}是一个给定的多分辨(x)与! (x)是尺度函数和母小波函数,若(分析," ∈Vj为一fx)确定整数,则(在尺度上可以近似地表示为:fx)(fx)fx)=Aj-1(fx)+Dj-1(fx)=$Aj(
m=-∞
(9)
(x)w! x-x‖"
i
2
i
h
d+2
(x)%w
i=1
i2
(10)
%C
+∞
j-1,m
()()" j-1,kx+%Dj-1,m! j-1,kx
m=-∞
+∞
由上面的定义,(x),(x)(‖x‖),上式可以重写为:g=-k(′x)G=g
(2)
! (/fx)=
(xi-x)G‖2%
i=1n
表示在第j-1尺度上对信号的近似,表其中,Aj-1(fx)Dj-1(fx)示信号在第j-1尺度上的细节信息。由于
,m〉〈" j,=hk-2mk" j-1,
〈" j,,m〉=gk-2mk! j-1,
因此
’
) ) ) ) ) () ) ) ) ) *
(x)w! x-x‖" =
i
2
i
&
h
(3)
2
h
(4)
[1**********]
d+2
(x)%w
i=1
i
n
Cj-1,m=%hk-2mCj,k
k=-∞+∞
+∞
414x-xx-x21
(xi)4(xi-x)(xi)4GiwG‖i‖w41%4%414i=141i=14
(11)×144414dx-x414
(xi)(xi)h%wGiw%414
414
i=1i=1525
n
"
30
! " 3
Dj-1,m=%gk-2mCj,k
k=-∞
上式右边的第二个中括号中的那一部分就是MeanShift[4-6]向
(x)为核函数对概率密量,第一个中括号中的那一部分是以G" (x)" 度函数(的估计,记做f,而式(6)定义的f(x)重新记做fx)G" (x),因此式(11)可以重新写为:fK
引入无穷矩阵:
(Hm,),(Gm,),,k=gk-2m,则有:H=G=Hm,kkk=hk-2mGm,
&
Cj-1=HCjDj-1=GCj
(5)
式(5)即是Mallat的塔式分解算法。根据实际需要可以依次对其逐级分解下去,这样就构成了多级小波分解的递推形式。因此,只要使用的小波函数尺度合适,便可以在任意尺度上观察信号。本文采用了Haar小波[3]。Haar小波实质上是一阶的
也是最简单的具有紧支特性的显式正交小波。Daubechies小波,
! (" (x)" (x)(x)/fx)=/f=2fMhKG
h
由式(12)可以得出:
(x)Mh=1h
2
(12)
" (x)/fK
" (x)f
G
(13)
表明,用核函数G在x点计算得到的MeanShift向量式(13)
正比于归一化的用核函数K估计的概率密度的函数Mh(x)
" (x)的梯度,归一化因子为用核函数G估计的点的概率密fK
(x)总是指向概率密度增加最大的度。因此MeanShift向量Mh方向。
2MeanShift
2.1概率密度梯度估计
2]
核密度估计方法[1,是统计模式识别中的一种重要的非参
(x)(又称为数估计概率密度函数的方法,该方法是从核函数K
窗口函数)出发,对每个样本xi,用正定矩阵+i表示xi处的窗
2.2带宽h的选取
核函数的形状通常不是密度估计中最关键的因素,带宽h对模型光滑程度的影响作用较大。带宽h的选择可以是全局固
8]
定的,也可以是自适应的[7,。带宽的大小可以看作是分割分辨
口形状和相对尺度。
对一个概率密度函数(,已知d维空间中n个采样点xi,fx)…,(的核函数估计为:i=1,n,fx)
" (x)f=
x-x
%Kn
i
i=1
i=1
(x)w"
i
率,带宽越大,越多的图像细节就会被忽略。因为Vn=h,如果h
(6)
非常大,将有更多的点对x处的密度产生影响,由于分布是归一化的,即:
1Kx-x=K
" -(u)du=1i
n
d
(xi)Vn%w
其中,为d维空间的立方体的体积,(xi)Vn=h,h为带宽,w≥0是一个赋给采样点xi的权重,(x)是一个核函数,并且满足K≥0d
(14)
因而距离xi较远的点也分担了对x的部分权重,从而较近点的权重减弱,距离远和距离近的点的权重相差不大,在这种情况" " 下,(x)是n因此f(x)非常光f
孙小炜,李言俊,陈义:基于小波多尺度分解的MeanShift图像滤波方法
时间和精度要求的计算结果。
2008,44(18)19
滑;反之,如果h很小,那么只有很少的点分担Vn,因此各点之! 间的权重由于距离的影响而出现较大的落差,因而f(x)是n个以样本点为中心的尖脉冲的叠加,好像是一个充满噪声的估计[9]。
如何选择合适的带宽,是核函数密度估计能够成功运用的关键。通常考虑对于径向高斯核函数,在一维情况下最优带宽! n为:hopt=1.06*!
[9]
-1
3.3算法的实现
设集合{Xi}i=1,为原始图像数据,T为收敛门限,X为收…,n
敛点,算法实现如下:采用Harr小波,对输入图像进行三层Mallat塔式分解。(1)(2)对分解后的每一层图像中的水平、垂直、对角细节信息
分别进行MeanShift滤波,即对所有数据点Xi,…,分别i=1,n,计算每一点的Mh(Xi),根据Mh(Xi)值移动窗口中心到下一个(Xi),重复这个过程直到Mh(Xi)则代点,并计算该点的Mh<T,表不需要再移动,将该点的像素值X赋值给初始数据点Xi,即Xi=X。
采用Gauss核函数进行MeanShift,用式(17),式(18)(3)
进行加速计算。
(4)重复步骤(1)和(2)直到所有数据收敛。(5)用小波逆变换对滤波后的图像进行重构。
*
*
*
! 定义为标准差。,其中! 则对于d维情况,最
优带宽为:
! hopt=!
"
4
1n
-
1(15)
3多尺度MeanShift图像滤波方法3.1MeanShift滤波
MeanShift聚类是通过在待检测图像空间搜索下一个平移点,同时设置搜索停止条件,当平移向量小于给定值时停止平移,这使得图像在高密度区域产生模糊效应。设集合{Pi}和集…,分别为d维输入、输出图像的像素点集合,从合{Ri},i=1,2,用式(13)分别计算该点像素的输入图像每一点像素Pi开始,
(x)直至收敛,将计算结果存入输出图像Ri。MeanShift向量Mh
4实验结果与分析
为了验证本文方法的有效性,将本文方法与传统的高斯滤波、小波软域值方法及传统Meanshift滤波方法进行比较。将
一幅核磁共振(MRI)图像(分辨率为512×灰度范围为512,加入12%的高斯噪声进行去噪。实验平台为Pentium[0,255])
软件环境为VC++6.0软件平台。高斯滤波窗IV2.4GHz的PC,
口为5×5;小波软域值滤波采用Sym4小波基和Donoho阈值;实验中设定MeanShift收敛门限,带宽用式(15)计算。图1为实验结果图像。
3.2算法的优化
采用高斯核函数进行MeanShift可以取得更好的图像滤波效果,但是需要选择较大的带宽! ,并且收敛速度也更慢。L.
(FastGaussGreengard和J.Strain[10]提出一种快速高斯变换
方法,将高斯变换的计算次数由O(mn)降低到Transform,FGT)
(m+n),其中m表示计算m个点的高斯变换,On表示n个高斯函数之和。但是,随着数据维数的增加,计算次数呈指数增长。C.Yang等[11]提出了一种改进的FGT算法,将数据位数扩展到了10维。但是,对于一般的数字图像处理来说,图像数据量小于,数据维数小于3维,文献[11]的方法对于低维数据(<6)的计算效果并不是非常理想。因此,采用傅立叶级数来加速高斯变换,在保证计算精度的同时减少计算时间。
设点xk的高斯变换具有如下形式:
(xk)G=1
带宽。
函数e的复Fourier级数展开式为:e=#Cke
-x
-∞
P
2
#qe
j=1
j
N
-xk-xj
2"
2
(16)
其中,“源点”,“目标点”,qj表示加权系数,xk表示xj表示" 为
-x
2
+∞
ik2! x
(k2! x(k2! x≈=#akcos+i#bksin
k=-nk=-n
(17)
nn
(k2! x)a0+2#akcos
k=1
&
((((((’(((((()
L/2
a0=2
ak=4
0
%e%e
-x
2
dx
(18)
(k2! x)…,cosdxk=1,P
以峰值信噪比PSNR(PeakSignaltoNoiseRatio)作为去噪效果测度指标,有些文献中也称为峰-峰信噪比,给定一幅大M×f0(x,,则图像fN(fx)y)的PSNR为:
L/2
-x
2
0
其中P为截断项,(18)中P根据实际需要的计算精度确定。式
的系数项ak,…,以降低式(17)计算时
k=0,n可以事先算出,和截断项P,并将求得的常系数ak代入式(17),即可得到满足
202008,44(18)
"
#######$
ComputerEngineeringandApplications计算机工程与应用
(max(()),(f0(x,)))maxfx,ymaxy1)fx,y-f(x,y! ! (
0
x=0
y=022
%
&&&&&&&’
(f,PSNRf0)=10*lg
(19)
(*)为求最大值运算。其中max
图1中,(a)为原始图像;(b)为在其中加入了12%的高斯噪声;(c)为高斯滤波结果;(d)为小波软域值滤波结果;(e)为文献[4]提出的MeanShift方法滤波结果,空间带宽和颜色带宽分别取3,(f)为本文提出的小波多尺度MeanShift滤波结90;果。表1中是对分别加入12%和25%的高斯噪声的图像使用4种不同滤波方法得到的PSNR结果的比较。
表1
不同噪声情况下几种滤波方法PSNR比较
噪声图像高斯滤波小波滤波Meanshift滤波本文方法
(s=0.12)22.0779PSNR
(s=0.25)18.3636PSNR
29.285725.8545
27.618025.8564
27.150625.3996
30.532725.9224
理。为了加速MeanShift迭代计算速度,采用复Fourier级数来
进行快速高斯变换,从而加快高斯核函数的计算精度和速度,在保证计算性能的不变的同时大大降低MeanShift迭代的计算时间。实验仿真结果表明本文所提出的方法是高效的。
参考文献:
[1]FukunagaK,HostetlerLD.Theestimationofthegradientofaden-
sityfunction,withapplicationsinpatternrecognition[J].IEEETran-sactionsonPatternAnalysisandMachineIntelligence,1975,21(1):32-40.
[2]ChengYi-zong.Meanshift,modeseeking,andclustering[J].IEEE
:TransPatternAnalysisandMachineIntelligence,1995,17(8)790-799.
戴道清,[3]MallatS.Awavelettourofsignalprocessing[M].杨力华,
黄文良,等译.2nded.Beijing:ChinaMachinePress,2002.[4]ComaniciuD,MeerP.Meanshift:arobustapproachtowardfeature
spaceanalysis[J].IEEETransonPatternAnalysisandMachineIn-(5):telligence,2002,24603-619.
[5]ComaniciuD,RameshV,MeerP.Real-timetrackingofnon-rigid
objectsusingmeanshift[C]//ComputerVisionandPatternRecog-2000:142-149.nition,
蔡自兴.MeanShift算法的收敛性分析[J].软件学报,[6]文志强,2007,
(2):18205-212.
杨培龙,罗颖昕,[7]WebbAR.Statisticalpatternrecognition[M].王萍,
译.2nded.Beijing:ElectronicsIndustryPress,2002.
RameshV,MeerP.Thevariablebandwidthmeanshift[8]ComaniciuD,
(1):anddata-drivenscaleselection[J].ComputerVision,2001438-445.[9]ScottDW.Multivariatedensityestimation[M].NewYork:JohnWiley,
1992.
[10]GreengardL,StrainJ.ThefastGausstransform[J].SIAMJSciStat
(1):Compu,1991,1279-94.
[11]YangC,DuraiswamiR,GumerovNA,etal.ImprovedfastGauss
transformandefficientkerneldensityestimation[C]//ICCV,2003:464-471.
比较结果图1(c)(f)和分析表1可知,本文滤波方法去噪~效果明显优于高斯滤波和小波软域值滤波方法。高斯滤波和小
波软域值滤波方法损失较多的高频细节成分,使图像模糊不清,本文方法既降低了图像的噪声同时又尽可能地保留图像的细节。由实验结果可知,本文方法的去噪效果也优于文献[4]的本文方法若根据噪声强弱调MeanShift滤波方法。实验发现,
节高斯核函数的带宽,可达到更佳的去噪和保留图像细节效果。在低噪声时,采用较小的带宽,可更好地保留图像细节;在强噪声时,较大的带宽,可达到较好的去噪效果。本文方法存在的缺陷是需进行一次小波多级分解和多个子图像重构及多个
运算量较大,需要耗费较大的计算时间,MeanShift滤波处理,
不利于图像的实时去噪处理。
5结语
本文提出了一种基于小波多尺度分解的MeanShift图像滤波方法。在该方法中,采用Mallat算法对图像进行多尺度小波分解,对不同分辨率图像细节分别进行MeanShift滤波处
(上接16页)
性能的影响。生成的语音训练映射图,与语谱图比较更加直观,易于“看图说话”,为语音训练提供一种新的可视化途径。
参考文献:
[1]ManshieJ.Theuseofsensoryaidsforteachingspeechtochildren
whoaredeaf,inspeechcommunicationandprofounddeafness[M]//GeoffPlantK-ES.London:WhurrPublishers,Ltd,1995.
姚佳,高忠华.基于语音识别技术的聋哑人视觉辅助语音训[2]陈汝琛,
练系统[J].中国生物医学工程学报,(4):1996,15360-365.吴玺宏,迟惠生.面向聋儿的计算机言语训练方法及其实[3]刘华东,
现[J].北京大学学报:自然科学版,(3):2004,40444-450.[4]O¨sterAM.Teachingspeechskillstodeafchildrenbycomputer-basedspeechtraining[J].QuarterlyProgressandStatusReport,1995,
(4):3667-75.
4结束语
本文提出了一种利用SOM网络的语音训练方法。利用
[5]KohonenT.Physiologicalinterpretationoftheselforganizingmapal-
(6):gorithm[J].NeuralNetworks,1993895-905.[6]PiconeJW.Signalmodelingtechniquesinspeechrecognition[C]//
ProceedingsoftheIEEE,1993,9:1215-1247.ofcompetitivelearning[J].NeuralNetworks,1994,7:973-984.
SOM网络的输出层可视化特点为语音受试者提供的视觉信
对行加强训练,并讨论了输出层神经元个数选取对SOM网络类
ComputerEngineeringandApplications计算机工程与应用2008,44(18)17
基于小波多尺度分解的MeanShift图像滤波方法
孙小炜,李言俊,陈义
SUNXiao-wei,LIYan-jun,CHENYi
西北工业大学航天学院,西安710072CollegeofAstronautics,NorthwesternPolytechnicalUniversity,Xi’an710072,ChinaE-mail:sunxiaoweicn@163.com
SUNXiao-wei,LIYan-jun,CHENYi.ImageMeanShiftfilteringmethodbasedonwaveletmulti-resolutiondecomposi-
(18):tion.ComputerEngineeringandApplications,2008,4417-20.Abstract:CombinedwithwavelettransformandMeanShiftfiltering,anefficientimagefilteringmethodispresented.Firstly,noised
imageisdecomposedtomulti-resolutionsub-bandimagesbyMallatpyramiddecomposition.Highfrequencysub-bandimagesaredenoisedbyMeanShiftfilter,withoutanychangestothelowfrequencyapproximationimage.Denoised-imageisobtainedbycom-posingthehighfrequencydetailimageswithMeanShiftfilteringandlowfrequencyapproximationimage.However,MeanShiftisaniterationscheme.Itwastesmoretimetocalculateandneedsmoreiterationtoensurehighernumericalaccuracy.Inordertoovercomeitsdisadvantage,GaussfunctioniscalculatedapproximatelybyFourierseries.Experimentresultshowsthatthenoiseoftheimageisremovedeffectively.Atthesametime,thedetailoftheimageiskeptwell.ThemethodhasbetterdenoisingeffectthantraditionalGaussfilteringmethod,Wienerfilteringmethod,singlewaveletthresholdingmethodandMeanShiftfilteringmethod.
Keywords:imagefiltering;waveletdecomposition;Gausskernelfunction;Fourierseries;MeanShiftiteration摘要:将小波多尺度分解与传统MeanShift滤波算法相结合提出的一种有效的图像滤波方法。先将含噪声图像进行Mallat塔式分解,获得不同尺度、不同频带的子图像。将低频近似图像保持不变,对高频细节进行MeanShift滤波,最后将低频近似图像与高频滤波后的图像进行合成得到去噪后的图像。由于MeanShift算法是一种迭代方法,要保证较高的数值计算精度则需要较多的迭代次数,耗费较长的计算时间,为克服这一缺点,提出了采用Fourier级数来近似计算高斯函数。实验结果表明该方法在降低噪声的同时能够尽可能的保留图像细节,其去噪效果优于传统的高斯滤波、Wiener滤波方法和单一小波域值法和MeanShift滤波方法。关键词:图像滤波;小波分解;高斯核函数;Fourier级数;MeanShift迭代DOI:10.3778/j.issn.1002-8331.2008.18.006
文章编号:(2008)1002-833118-0017-04
文献标识码:A
中图分类号:TP391.41
图像在形成和传输的过程中,不可避免的要受到噪声的干扰,为了尽量减少噪声对后续图像处理的影响具有重大的意
2]
义。MeanShift模型[1,是一种有效的特征空间分析方法,它可以实现图像的不连续保持性滤波,不仅可以滤除图像中的噪声信息,而且能够自适应地减小局部结构中显著边缘信息的平滑。由于MeanShift模型具有以上优点,因而能够有效滤除图像噪声的同时不损失图像的信息。小波分析[3](WaveletAnal-
方法是一种窗口大小固定但其时间窗和频率窗都可以改ysis)
变的时频局部化分析方法,即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,使得小波变换具有对信号的自适应性。正是由于这种特性使采用小波分析方法获得了较好的效果。
本文采用基于小波多分辨率分析的方法,首先对噪声图像
进行Mallat塔式分解,然后在保持低频图像不变的同时,对每一级图像中的水平、垂直和对角细节信息分别采用MeanShift滤波算法进行处理,滤除杂波干扰。最后将滤波得到的图像与低频近似图像合成得到最终的滤波结果。
1小波分解
1.1小波变换的基本概念
小波函数是一个由单一的函数! 经伸缩、平移而产生的一簇函数,其定义为[3]:
()! a,bx=a
1
!
x-b"
(1)
满足a,其中,(x)b∈R;a≠0。a代表伸缩因子;b代表平移因子;!
基金项目:国家自然科学基金(theNationalNaturalScienceFoundationofChinaunderGrantNo.60575013);西北工业大学研究生创新实验中心
资助项目。
作者简介:孙小炜(1979-),男,博士生,主要研究工作是计算机视觉和视频与图像处理;李言俊(1944-),男,教授,博士,主要研究工作是计算机视
收稿日期:2008-02-27
修回日期:2008-03-31
182008,44(18)ComputerEngineeringandApplications计算机工程与应用
x-b
,即"
核函数K具有多种定义形式,其中最常用的核函数为单位高斯核函数:
(x)KN=e
-‖x‖2#
2
为母小波函数。! (x)经过平移和伸缩变换后得到!
可以生成不同的频率成分。
小波变换的基本思想是通过平移和伸缩等运算功能对原始信号进行多尺度细化分析,即将信号分解为一系列具有不同空间分辨率、不同频率特性和方向特性的子带信号,这些子带信号具有良好的时域和频域特性。可以利用这些特性来表示原始信号的局部特征,进而实现对信号时域和频域的局部分析。
(7)
2
(x)的剖面函数k(x),使得:另外定义核函数K
(x)(‖x‖)(8)K=k
(x)的负导函数g(x),即g(x),其对应的核函数:定义k=-k(′x)(x)(‖x‖)G=g
概率密度函数(的梯度/(的估计为:fx)fx)
! (" (x)/fx)=/f=
(x-xi)2%k′‖
i=1n
2
1.2Mallat塔式分解
它的问世使小波分Mallat算法[3]是小波变换的快速算法,
析的实际意义逐渐被人们所重视。设{Vj}是一个给定的多分辨(x)与! (x)是尺度函数和母小波函数,若(分析," ∈Vj为一fx)确定整数,则(在尺度上可以近似地表示为:fx)(fx)fx)=Aj-1(fx)+Dj-1(fx)=$Aj(
m=-∞
(9)
(x)w! x-x‖"
i
2
i
h
d+2
(x)%w
i=1
i2
(10)
%C
+∞
j-1,m
()()" j-1,kx+%Dj-1,m! j-1,kx
m=-∞
+∞
由上面的定义,(x),(x)(‖x‖),上式可以重写为:g=-k(′x)G=g
(2)
! (/fx)=
(xi-x)G‖2%
i=1n
表示在第j-1尺度上对信号的近似,表其中,Aj-1(fx)Dj-1(fx)示信号在第j-1尺度上的细节信息。由于
,m〉〈" j,=hk-2mk" j-1,
〈" j,,m〉=gk-2mk! j-1,
因此
’
) ) ) ) ) () ) ) ) ) *
(x)w! x-x‖" =
i
2
i
&
h
(3)
2
h
(4)
[1**********]
d+2
(x)%w
i=1
i
n
Cj-1,m=%hk-2mCj,k
k=-∞+∞
+∞
414x-xx-x21
(xi)4(xi-x)(xi)4GiwG‖i‖w41%4%414i=141i=14
(11)×144414dx-x414
(xi)(xi)h%wGiw%414
414
i=1i=1525
n
"
30
! " 3
Dj-1,m=%gk-2mCj,k
k=-∞
上式右边的第二个中括号中的那一部分就是MeanShift[4-6]向
(x)为核函数对概率密量,第一个中括号中的那一部分是以G" (x)" 度函数(的估计,记做f,而式(6)定义的f(x)重新记做fx)G" (x),因此式(11)可以重新写为:fK
引入无穷矩阵:
(Hm,),(Gm,),,k=gk-2m,则有:H=G=Hm,kkk=hk-2mGm,
&
Cj-1=HCjDj-1=GCj
(5)
式(5)即是Mallat的塔式分解算法。根据实际需要可以依次对其逐级分解下去,这样就构成了多级小波分解的递推形式。因此,只要使用的小波函数尺度合适,便可以在任意尺度上观察信号。本文采用了Haar小波[3]。Haar小波实质上是一阶的
也是最简单的具有紧支特性的显式正交小波。Daubechies小波,
! (" (x)" (x)(x)/fx)=/f=2fMhKG
h
由式(12)可以得出:
(x)Mh=1h
2
(12)
" (x)/fK
" (x)f
G
(13)
表明,用核函数G在x点计算得到的MeanShift向量式(13)
正比于归一化的用核函数K估计的概率密度的函数Mh(x)
" (x)的梯度,归一化因子为用核函数G估计的点的概率密fK
(x)总是指向概率密度增加最大的度。因此MeanShift向量Mh方向。
2MeanShift
2.1概率密度梯度估计
2]
核密度估计方法[1,是统计模式识别中的一种重要的非参
(x)(又称为数估计概率密度函数的方法,该方法是从核函数K
窗口函数)出发,对每个样本xi,用正定矩阵+i表示xi处的窗
2.2带宽h的选取
核函数的形状通常不是密度估计中最关键的因素,带宽h对模型光滑程度的影响作用较大。带宽h的选择可以是全局固
8]
定的,也可以是自适应的[7,。带宽的大小可以看作是分割分辨
口形状和相对尺度。
对一个概率密度函数(,已知d维空间中n个采样点xi,fx)…,(的核函数估计为:i=1,n,fx)
" (x)f=
x-x
%Kn
i
i=1
i=1
(x)w"
i
率,带宽越大,越多的图像细节就会被忽略。因为Vn=h,如果h
(6)
非常大,将有更多的点对x处的密度产生影响,由于分布是归一化的,即:
1Kx-x=K
" -(u)du=1i
n
d
(xi)Vn%w
其中,为d维空间的立方体的体积,(xi)Vn=h,h为带宽,w≥0是一个赋给采样点xi的权重,(x)是一个核函数,并且满足K≥0d
(14)
因而距离xi较远的点也分担了对x的部分权重,从而较近点的权重减弱,距离远和距离近的点的权重相差不大,在这种情况" " 下,(x)是n因此f(x)非常光f
孙小炜,李言俊,陈义:基于小波多尺度分解的MeanShift图像滤波方法
时间和精度要求的计算结果。
2008,44(18)19
滑;反之,如果h很小,那么只有很少的点分担Vn,因此各点之! 间的权重由于距离的影响而出现较大的落差,因而f(x)是n个以样本点为中心的尖脉冲的叠加,好像是一个充满噪声的估计[9]。
如何选择合适的带宽,是核函数密度估计能够成功运用的关键。通常考虑对于径向高斯核函数,在一维情况下最优带宽! n为:hopt=1.06*!
[9]
-1
3.3算法的实现
设集合{Xi}i=1,为原始图像数据,T为收敛门限,X为收…,n
敛点,算法实现如下:采用Harr小波,对输入图像进行三层Mallat塔式分解。(1)(2)对分解后的每一层图像中的水平、垂直、对角细节信息
分别进行MeanShift滤波,即对所有数据点Xi,…,分别i=1,n,计算每一点的Mh(Xi),根据Mh(Xi)值移动窗口中心到下一个(Xi),重复这个过程直到Mh(Xi)则代点,并计算该点的Mh<T,表不需要再移动,将该点的像素值X赋值给初始数据点Xi,即Xi=X。
采用Gauss核函数进行MeanShift,用式(17),式(18)(3)
进行加速计算。
(4)重复步骤(1)和(2)直到所有数据收敛。(5)用小波逆变换对滤波后的图像进行重构。
*
*
*
! 定义为标准差。,其中! 则对于d维情况,最
优带宽为:
! hopt=!
"
4
1n
-
1(15)
3多尺度MeanShift图像滤波方法3.1MeanShift滤波
MeanShift聚类是通过在待检测图像空间搜索下一个平移点,同时设置搜索停止条件,当平移向量小于给定值时停止平移,这使得图像在高密度区域产生模糊效应。设集合{Pi}和集…,分别为d维输入、输出图像的像素点集合,从合{Ri},i=1,2,用式(13)分别计算该点像素的输入图像每一点像素Pi开始,
(x)直至收敛,将计算结果存入输出图像Ri。MeanShift向量Mh
4实验结果与分析
为了验证本文方法的有效性,将本文方法与传统的高斯滤波、小波软域值方法及传统Meanshift滤波方法进行比较。将
一幅核磁共振(MRI)图像(分辨率为512×灰度范围为512,加入12%的高斯噪声进行去噪。实验平台为Pentium[0,255])
软件环境为VC++6.0软件平台。高斯滤波窗IV2.4GHz的PC,
口为5×5;小波软域值滤波采用Sym4小波基和Donoho阈值;实验中设定MeanShift收敛门限,带宽用式(15)计算。图1为实验结果图像。
3.2算法的优化
采用高斯核函数进行MeanShift可以取得更好的图像滤波效果,但是需要选择较大的带宽! ,并且收敛速度也更慢。L.
(FastGaussGreengard和J.Strain[10]提出一种快速高斯变换
方法,将高斯变换的计算次数由O(mn)降低到Transform,FGT)
(m+n),其中m表示计算m个点的高斯变换,On表示n个高斯函数之和。但是,随着数据维数的增加,计算次数呈指数增长。C.Yang等[11]提出了一种改进的FGT算法,将数据位数扩展到了10维。但是,对于一般的数字图像处理来说,图像数据量小于,数据维数小于3维,文献[11]的方法对于低维数据(<6)的计算效果并不是非常理想。因此,采用傅立叶级数来加速高斯变换,在保证计算精度的同时减少计算时间。
设点xk的高斯变换具有如下形式:
(xk)G=1
带宽。
函数e的复Fourier级数展开式为:e=#Cke
-x
-∞
P
2
#qe
j=1
j
N
-xk-xj
2"
2
(16)
其中,“源点”,“目标点”,qj表示加权系数,xk表示xj表示" 为
-x
2
+∞
ik2! x
(k2! x(k2! x≈=#akcos+i#bksin
k=-nk=-n
(17)
nn
(k2! x)a0+2#akcos
k=1
&
((((((’(((((()
L/2
a0=2
ak=4
0
%e%e
-x
2
dx
(18)
(k2! x)…,cosdxk=1,P
以峰值信噪比PSNR(PeakSignaltoNoiseRatio)作为去噪效果测度指标,有些文献中也称为峰-峰信噪比,给定一幅大M×f0(x,,则图像fN(fx)y)的PSNR为:
L/2
-x
2
0
其中P为截断项,(18)中P根据实际需要的计算精度确定。式
的系数项ak,…,以降低式(17)计算时
k=0,n可以事先算出,和截断项P,并将求得的常系数ak代入式(17),即可得到满足
202008,44(18)
"
#######$
ComputerEngineeringandApplications计算机工程与应用
(max(()),(f0(x,)))maxfx,ymaxy1)fx,y-f(x,y! ! (
0
x=0
y=022
%
&&&&&&&’
(f,PSNRf0)=10*lg
(19)
(*)为求最大值运算。其中max
图1中,(a)为原始图像;(b)为在其中加入了12%的高斯噪声;(c)为高斯滤波结果;(d)为小波软域值滤波结果;(e)为文献[4]提出的MeanShift方法滤波结果,空间带宽和颜色带宽分别取3,(f)为本文提出的小波多尺度MeanShift滤波结90;果。表1中是对分别加入12%和25%的高斯噪声的图像使用4种不同滤波方法得到的PSNR结果的比较。
表1
不同噪声情况下几种滤波方法PSNR比较
噪声图像高斯滤波小波滤波Meanshift滤波本文方法
(s=0.12)22.0779PSNR
(s=0.25)18.3636PSNR
29.285725.8545
27.618025.8564
27.150625.3996
30.532725.9224
理。为了加速MeanShift迭代计算速度,采用复Fourier级数来
进行快速高斯变换,从而加快高斯核函数的计算精度和速度,在保证计算性能的不变的同时大大降低MeanShift迭代的计算时间。实验仿真结果表明本文所提出的方法是高效的。
参考文献:
[1]FukunagaK,HostetlerLD.Theestimationofthegradientofaden-
sityfunction,withapplicationsinpatternrecognition[J].IEEETran-sactionsonPatternAnalysisandMachineIntelligence,1975,21(1):32-40.
[2]ChengYi-zong.Meanshift,modeseeking,andclustering[J].IEEE
:TransPatternAnalysisandMachineIntelligence,1995,17(8)790-799.
戴道清,[3]MallatS.Awavelettourofsignalprocessing[M].杨力华,
黄文良,等译.2nded.Beijing:ChinaMachinePress,2002.[4]ComaniciuD,MeerP.Meanshift:arobustapproachtowardfeature
spaceanalysis[J].IEEETransonPatternAnalysisandMachineIn-(5):telligence,2002,24603-619.
[5]ComaniciuD,RameshV,MeerP.Real-timetrackingofnon-rigid
objectsusingmeanshift[C]//ComputerVisionandPatternRecog-2000:142-149.nition,
蔡自兴.MeanShift算法的收敛性分析[J].软件学报,[6]文志强,2007,
(2):18205-212.
杨培龙,罗颖昕,[7]WebbAR.Statisticalpatternrecognition[M].王萍,
译.2nded.Beijing:ElectronicsIndustryPress,2002.
RameshV,MeerP.Thevariablebandwidthmeanshift[8]ComaniciuD,
(1):anddata-drivenscaleselection[J].ComputerVision,2001438-445.[9]ScottDW.Multivariatedensityestimation[M].NewYork:JohnWiley,
1992.
[10]GreengardL,StrainJ.ThefastGausstransform[J].SIAMJSciStat
(1):Compu,1991,1279-94.
[11]YangC,DuraiswamiR,GumerovNA,etal.ImprovedfastGauss
transformandefficientkerneldensityestimation[C]//ICCV,2003:464-471.
比较结果图1(c)(f)和分析表1可知,本文滤波方法去噪~效果明显优于高斯滤波和小波软域值滤波方法。高斯滤波和小
波软域值滤波方法损失较多的高频细节成分,使图像模糊不清,本文方法既降低了图像的噪声同时又尽可能地保留图像的细节。由实验结果可知,本文方法的去噪效果也优于文献[4]的本文方法若根据噪声强弱调MeanShift滤波方法。实验发现,
节高斯核函数的带宽,可达到更佳的去噪和保留图像细节效果。在低噪声时,采用较小的带宽,可更好地保留图像细节;在强噪声时,较大的带宽,可达到较好的去噪效果。本文方法存在的缺陷是需进行一次小波多级分解和多个子图像重构及多个
运算量较大,需要耗费较大的计算时间,MeanShift滤波处理,
不利于图像的实时去噪处理。
5结语
本文提出了一种基于小波多尺度分解的MeanShift图像滤波方法。在该方法中,采用Mallat算法对图像进行多尺度小波分解,对不同分辨率图像细节分别进行MeanShift滤波处
(上接16页)
性能的影响。生成的语音训练映射图,与语谱图比较更加直观,易于“看图说话”,为语音训练提供一种新的可视化途径。
参考文献:
[1]ManshieJ.Theuseofsensoryaidsforteachingspeechtochildren
whoaredeaf,inspeechcommunicationandprofounddeafness[M]//GeoffPlantK-ES.London:WhurrPublishers,Ltd,1995.
姚佳,高忠华.基于语音识别技术的聋哑人视觉辅助语音训[2]陈汝琛,
练系统[J].中国生物医学工程学报,(4):1996,15360-365.吴玺宏,迟惠生.面向聋儿的计算机言语训练方法及其实[3]刘华东,
现[J].北京大学学报:自然科学版,(3):2004,40444-450.[4]O¨sterAM.Teachingspeechskillstodeafchildrenbycomputer-basedspeechtraining[J].QuarterlyProgressandStatusReport,1995,
(4):3667-75.
4结束语
本文提出了一种利用SOM网络的语音训练方法。利用
[5]KohonenT.Physiologicalinterpretationoftheselforganizingmapal-
(6):gorithm[J].NeuralNetworks,1993895-905.[6]PiconeJW.Signalmodelingtechniquesinspeechrecognition[C]//
ProceedingsoftheIEEE,1993,9:1215-1247.ofcompetitivelearning[J].NeuralNetworks,1994,7:973-984.
SOM网络的输出层可视化特点为语音受试者提供的视觉信
对行加强训练,并讨论了输出层神经元个数选取对SOM网络类