2008年4月四川大学学报(自然科学版)
Apr.2008
第45卷第2期
Journalof
SichuanUniversity(NaturalScienceEdition)
v01.45No.2
文章编号:0490—6756(2008)02—0307.04
基于麦克风阵列的近场声源定位
李
文,夏秀渝,何培宇,李
源
(四川大学电子信息学院,成都610064)
摘要:根据近场语音信号的特点,研究使用麦克风阵列的近场声源定位技术.为了克服MUSIC算法本身的局限,对阵列的输入信号进行时一频变换并抽取子带,在此基础上估计声
源的数量并对实现对语音信号的定位.最后,根据谱峰的特点,提出了一种快速谱峰搜索算法.仿真结果表明,在有混响的房间中,算法有效的提取了声源的方位.关键词:麦克风阵列;近场语音模型;声源定位中图分类号:TP202.7
文献标识码:A
Speech
source
localizationinnear-fieldbased
on
microphone
arrays
Lf
W砌,X舱X/u.h,HEPei.乳,Lf
Yuan
(Sdx)olof
Electronicand
InformationEngineering,SichuanUniversity,Chengdu610064,China)
Abstract:Based
on
thecharacteristicsofnear-fieldspeechsignal.Thispaperresearch鹤10ealizationtechnology
using
microphonearray.ToovercometheinherentlimitationsofMUSIC,wetransformtheinputsignalsto
frequencydomain,andthenextractsub-band.Onthisbasis,weestimatedthenumberofreceivesignalsand
realizelocalizationofspeechsource.Afastsearchalgorithmisproposedtofindthelocationofspeechsource.Thesimulationsres。ultsshowthatina
reverberationroom,the
algorithmeffectivelyfindsthepositionofthe
speech
source.
Keywords:microphonearray,near-fieldspeechmodel,speechSourcelocalization
j
1
引言
语音信号频率集中于300~3400I--Iz,是未经调制的基带信号.很多针对窄带信号提出的传统算法要麦克风阵列的声源定位是指用麦克风拾取声使用在麦克风阵列,则必须对阵列的输出信号进行音信号,通过对麦克风阵列的各路输出信号进行分预处理,如滤波,抽取子带等,以满足算法的窄带信析和处理,得到一个或者多个声源的位置信息.如号前提.
果声源能够持续地输出声音,通过对麦克风阵列接
2)传统的阵列信号多采用远场,平面波模型,
收到的信号进行实时分析和处理,则可以实现对移
而麦克风阵列多位于近场,需要使用球面波模型.动声源的定位和跟踪.
另外,在需要估计声源与阵列的距离时,还应该考与传统的阵列信号处理相比,麦克风阵列的信
虑信号在传播过程中发生的幅度衰减.
号处理有以下的不同:
3)传统的阵列信号处理中,噪声和信源通常是
,1)传统的阵列处理信号,如雷达信号,是经过不相干的.而麦克风阵列多位于室内等较封闭的环高频信号调制了的窄带信号,而麦克风阵列处理的
境中,除了环境噪声和其他声源的影响外,声源本
收稿日期:2007-01—18
基金项目:国家自然科学基金项目(60472096)
作者简介:李文(1983一),男,2005级硕士研究生.E-mail:ed.1ee@163.嗍
万
方数据
四川大学学报(自然科学版)
身在室内的混响也会对准确定位造成影响.
本文研究将MUSIC方法用于近场声源定位
第45卷
阵列中心为原点,第i个麦克风的横坐标为di.我
们把阵列中心作为参考点,设它接收到的声源歹的信号为S(£),则第i个阵元接收到的信号的相对幅
度为:
所需的处理和改进.针对谱峰的特点,提出了一种快速谱峰搜索算法,搜索结果表明,算法有效的估
计出了声源的位置.
2信号模型
一般认为,当声源与阵列的距离r≤2L2/2
量巧2万磊孬丢云亏萧,
i=1,2,…,M;
各个阵元接收到的信号的相对时延:
(2)
时,处于近场范围[1l,其中,L为阵列的孔径,A为
^.
声波的波长.这时我们应该用球面波模型代替平面
凸fij一——。c
i=1,2,…,M;
D
√(rsina)2+(df—rcosl2)2一,.
模型来描述声波的传播.除了考虑各个麦克风之间由于与声源的距离不同造成的接收到的信号的相
位差异以外,还应该考虑声波在空气中传播造成的
其中,c为声音的传播速度.(1)式中的噪声部分:
t
一’
(3)
幅度衰减.若毛(£)为声源信号,则麦克风阵列各个阵元的输出信号可以写成【1,2J:
卫
yi(t)=∑∑6鹕(£一Atmij")+&(£),
i=1,2,…,M;
(4)
第一部分为各个声源的各路回波的总和,M
(1)
zi(t)=∑kosi(t一△‘巧)-I-Yi(t),
j=1
i=1,2,…,M;歹=1,2,…,D
为不同方向的回波的总数,b。if和△£名j为第歹个声源的第优路回波对于第i个麦克风的幅度衰减
因子以及相对时延.毋(£)为加性白噪声.
其中下标i指该量属于第i路麦克风,J指第歹个声
源,麦克风数量为M,声源数量D.k甜和△‘d是阵
元i接收到的声源歹的信号的幅度衰减因子以及相对时延,Yi(£)则是各种噪声的总和.
3算法描述
MUSIC方法[3t4]是针对窄带信号处理提出
的,而语音信号是一个复杂的基带非平稳信号.为
了满足窄带前提,我们对阵列输入信号进行时.频处理并抽取子带,在此基础上估计声源的数量并实现声源定位.
首先,对麦克风阵列的输出信号,在时域进行
采样,抽取若干个点后进行N点离散傅立叶变换
(Discrete
FourierTransformation):
rx,(叫o)
Xl(COlX2(C01
…XI(coN一…X2(CON一
(4)
x:lx2(砧
…
图1
Fig.1
麦克风阵列的近场球面渡模型
Near
L‰(∞o)‰(叫1
…xM(∞N一
fieldmodelofmicrophonearray
X每行为某个阵元接收到的信号抽取若干个点后
的的离散傅立叶变换(D阿),每列为各阵元信号
对于如图1所示的均匀直线阵列,相邻阵元间的距离为Ad,声源距离阵列中心的距离为r,以
离散傅立叶变化后在同一频点处的值.
根据(1),
D
Xi(CO。)=∑koexp(-歹叫。At巧)S(叫。)+Y,(CO。),恕=1,2,…,N;
则对于(4)中的某个频点∞。有:
(5)
x(∞。)=[Xl(鲫。)x2(‰)…XM(CO。)]1’=
万方数据
第2期李文等:基于麦克风阵列的近场声源定位
加e一心血“眈e-./%At2_I
k12e-'%‘血12
klDe-知n△£1。k2De~如。血2D
Sl(甜。)S2(叫。)
+
yl(∞。)y2(Ⅲ。)
忌22e一知p笠
肺e-心atMt.惫胞e-以6tm2
愚加e’iranAtMD
SD(00。)yM(∞。)
AS(∞。)+y(叫。),咒=1,2…N
若各噪声信号均值为零,互不相关且与信号
Udiag[;tl,A2,…AM]UH,其中Al,A2,…AM为尺的
以下根据基于信息论的准则的description
length)法则【5,6】,利用
MDL(t):N(M—z)logl掣l+
f
1
§、]
【(ⅡA;)南J
‘=f十I
去z(2M—1)logN(7)
估计出D后,根据MUSIC方法,将u分解为
P(口,r)=
1
口HU★|I
2
(8)
=
[kl(口,r)e巾¨尬‘l¨’,’,…,忌M(口,
r)e-J,o(n’at小“¨]T.ki(口,r)和Atf(口,r)为第i路(3).则使得P(口,,.)最大的(a,r)即为声源所对
要判断出声源的方位,我们还应该搜索出谱峰
万
方数据(6)
________-_____——
___——___
下:
①当D=1时,在谱峰搜索结果中抽取r=O.5,1.0,1.5所对应的向量并相加,在其结果中搜索出若干极大值.则极大值中最大值对应的角度为
口.
②在a一5’~a+5’的范围内,搜索P(口,r)极大值,则极大值中的最大值对应的(口,r)即是对谱峰的估计值.
③若D≠1,则需D一1次重复上述过程.只是在①中,a应相应的取次大值,第三大值等.
4仿真实验
实验数据在matlab环境下的一个虚拟声学实验室中产生,首先计算房间的冲激响应,然后据此来模拟各个麦克风接收到的信号.虚拟房间宽,长,高为(4,5,3),单位:m.麦克风阵以及声源均位于高为1.5的平面,八个麦克风排列成均匀直线阵列,间距0.1m.其中第i个麦克风在平面中的位置为:(1.8-i,2,1.5),i=1,2,…8;房间混响时间
160
ITlS,声音
传播速度345m/s,房间各个面的反射系数如
表一所示.声源采样频率8KHz,量化精度16
bit.
输入数据每帧200点,添0补齐256点后进行
DFT,噪声信号为高斯白噪声,信噪比约20db,谱峰搜索时选取14个频率点分别计算后平均,角度的搜索步长为1。,距离步长为0.05m.
表1虚拟房间各个面的反射系数
Tab.1
Reflectioncoefficientofthevirtualroom
反射面X=OX=4y=0y=5Z=0Z=3反射系数0.7
0.7
0.7
0.7
0.5
0.8
单个信源的仿真:
声源为一段男声的中文,位置矢量为(1.7,2.
35,1.5),相对于麦克风阵列的中心其方位坐标为
(口,r)=(45。,0.495m).仿真结果如图2.
不相关,则X(∞。)的自相关矩阵为R=
E{x(埘。)X(∞。)H}=脚H+巧2J,其中,P=
E{S(cc,。)S(O.9。)H},d2为该频点处的噪声功率,J
为单位矩阵.可对其进行特征值分解:R=
特征值且J:Il>A2>…>AM.U的第i列为与Ai对应的R特征向量.
MDL(minimum
R的特征值分解的结果,估计声源数目D:
其中l=0,1,¨,M一1.声源数的估计值为使得
MDL(1)最小的z的值.因为语音信号的复杂性,所以这里取若干个频点分别估计出声源数后取统计平均,作为声源D的估计值.
信号空间魄和噪声空间UNtl|,则空间谱
其中,口
信号的相对幅度和相对时延,表达式参见(2)和应的位置.由于语音是一个复杂的非平稳信号,不
能保证始终包含某个频点,所以选取若干个频点,
分别求取空间谱然后平均.
所对应的口和r值.由于在一个面内搜索量很大,
根据实验发现,谱峰存在于某个“脊”之中,为了减少搜索量,我们可以先找出“脊”的位置,然后在在这个位置为中心的某个范围内搜索谱峰,过程如
310
四川大学学报(自然科学版)
第45卷
图2单个信源的DOA估计
Fig.2
DOA
estimateofsingle
SOUrCe
对声源位置的搜索结果为:
表2单信源谱峰搜索结果
Tab.2
Searchresultofthesingle
Si州g)1.wce
多个信源的仿真:
声源1位置矢量为(1.7,2.35,1.5),相对方位坐标(口l,r1)=(45。,0.495m).
声源2位置矢量:(1,2.60,1.5).相对方位坐标(口2,,.2)=(120",0.7m),仿真结果如图3:
图3两个信源的DOA估计
Fig.3
DOAestimateofdouble
sources
对声源位置的搜索结果为:
万
方数据表3双信源谱峰搜索结果
丁备6.3
SearchresultofdoubleSOUrCes
根据仿真结果,在一个和多个信源的情况下,算法都能较好的估计出声源的位置.
4结语
介绍了语音信号的近场模型,给出了使用麦克
风阵列对其定位的MUSIC算法,并给出了一种搜
索声源位置的方法.仿真结果表明,算法较好的实
现了在对一个和多个声源的定位.对角度和距离都得到了比较准确的估计.定位范围:0.2~1.5m,定位精度:角度定位精度±10。,距离定位精度±0.
05
ITI.但是随着距离的增加,近场模型失效,或者
房间反射系数增大,混响时间变长等对声源位置的
估计的准确性都会造成一定的影响.
参考文献-
[1]
MingJ,AlexCK,MengHE.Doaestimationof
speech
solJ/'ce
with
microphonearrays[J].Circuitsand
Systems,1998,98:293.
[2]JuT
L,XuYL,PengQ
C.Speech
80urce
k)calization
in
Nea.r
field[J].IC(℃AS[C],IIE朗℃[C].Chengdu:
2004,769.
[33肖先赐.现代谱估计:原理与应用[M].哈尔滨:哈
尔滨工业大学出版社,1991.
[4]Futoshi,AHideki,ToshihiroM.Sound
SOUl'Oe
localiza.
tion
and
separationin
rll篷itr
fleld[J].IEICETramFun.
dalTld'ltals,2000,E83.A(11):2286.
[5]刘德树.空间谱估计及其应用[M].合肥:中国科学
冀术大学出版社,1997.
[6]NezafatM,KavehM,XuW.EstimationoftheNU.rB.
berofsotlrcesbased
011
theeigenvectorsofthecovari—
alice
matrix[C].USA:Deptof
ElectrEngMinnesota
Univ,2004:465.
[责任编辑:李富河]
基于麦克风阵列的近场声源定位
作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:
李文, 夏秀渝, 何培宇, 李源, LI Wen, XIA Xiu-Yu, HE Pei-Yu, LI Yuan四川大学电子信息学院,成都,610064
四川大学学报(自然科学版)
JOURNAL OF SICHUAN UNIVERSITY(NATURAL SCIENCE EDITION)2008,45(2)5次
参考文献(6条)
1. Ming J;Alex C K;Meng H E Doa estimation of speech source with microphone arrays 19982. Ju T L;Xu Y L;Peng Q C Speech source localization in near field[会议论文] 20043. 肖先赐 现代谱估计:原理与应用 1991
4. Futoshi;AHideki;Toshihiro M Sound source localiza-tion and separation in near field 2000(11)5. 刘德树 空间谱估计及其应用 1997
6. Nezafat M;Kaveh M;Xu W Estimation of the num-ber of sources based on the eigenvectors of thecovari-anee matrix 2004
本文读者也读过(10条)
1. 刘真旭. Liu Zhenxu 基于麦克风阵列的实时声源定位[期刊论文]-计算机应用与软件2010,27(6)
2. 邵怀宗. 林静然. 彭启琮. 居太亮. 徐异凌 基于麦克风阵列的声源定位研究[期刊论文]-云南民族大学学报(自然科学版)2004,13(4)
3. 王大中. 李晓妮. WANG Da-zhong. LI Xiao-ni 基于麦克风阵列的语音信号实时时延估计[期刊论文]-吉林大学学报(信息科学版)2009,27(2)
4. 于豪光. 王洪源 基于麦克风阵列的声源时延估计算法的研究[期刊论文]-科技创新导报2008(32)
5. 胡郢. 刁帅. Hu Ying. Diao Shuai 基于T型麦克风阵列的近场三维声源定位[期刊论文]-武汉船舶职业技术学院学报2009,8(6)
6. 基于麦克风阵列声音信号定位方法的研究[期刊论文]-传感技术学报2010,23(5)
7. 王军. 种兰祥. WANG Jun. ZHONG Lan-xiang 麦克风阵列声源定位与跟踪性能改进[期刊论文]-计算机工程与应用2008,44(19)
8. 邓艳容. 景新幸. 任华娟. DENG Yan Rong. JING Xin Xing. REN Hua Juan 基于麦克风阵列的声源定位研究[期刊论文]-电子技术应用2010,36(2)
9. 杨祥清. 汪增福. YANG Xiang-qing. WANG Zeng-fu 基于麦克风阵列的三维声源定位算法及其实现[期刊论文]-声学技术2008,27(2)
10. 任勇. 胡方明. 李自学. Ren Yong. Hu Fangming. Li Zixue 基于麦克风阵列声源定位系统的FPGA实现[期刊论文]-电子科技2011,24(4)
引证文献(5条)
1. 郭威. 申利民. 谭云福. 陶凤莉 嵌入式语音识别在混响环境中的信号增强方法[期刊论文]-计算机应用研究2010(12)
2. 金光明. 谢植. 张传义. 金日炳 基于两个L型阵列的远场多声源定位方法[期刊论文]-东北大学学报:自然科学版2012(9)
3. 叶永. 陈建峰. 程萍. 冷欣 用于麦克风阵列的阵元筛选方法研究[期刊论文]-传感技术学报 2012(11)4. 刘来财. 何培宇 一种新的虚拟均匀线阵的构造方法[期刊论文]-四川大学学报(自然科学版) 2012(2)
5. 余帅. 何培宇 一种单通道语音倒谱域去混响新方法[期刊论文]-四川大学学报(自然科学版) 2012(4)
引用本文格式:李文. 夏秀渝. 何培宇. 李源. LI Wen. XIA Xiu-Yu. HE Pei-Yu. LI Yuan 基于麦克风阵列的近场声源定位[期刊论文]-四川大学学报(自然科学版) 2008(2)
2008年4月四川大学学报(自然科学版)
Apr.2008
第45卷第2期
Journalof
SichuanUniversity(NaturalScienceEdition)
v01.45No.2
文章编号:0490—6756(2008)02—0307.04
基于麦克风阵列的近场声源定位
李
文,夏秀渝,何培宇,李
源
(四川大学电子信息学院,成都610064)
摘要:根据近场语音信号的特点,研究使用麦克风阵列的近场声源定位技术.为了克服MUSIC算法本身的局限,对阵列的输入信号进行时一频变换并抽取子带,在此基础上估计声
源的数量并对实现对语音信号的定位.最后,根据谱峰的特点,提出了一种快速谱峰搜索算法.仿真结果表明,在有混响的房间中,算法有效的提取了声源的方位.关键词:麦克风阵列;近场语音模型;声源定位中图分类号:TP202.7
文献标识码:A
Speech
source
localizationinnear-fieldbased
on
microphone
arrays
Lf
W砌,X舱X/u.h,HEPei.乳,Lf
Yuan
(Sdx)olof
Electronicand
InformationEngineering,SichuanUniversity,Chengdu610064,China)
Abstract:Based
on
thecharacteristicsofnear-fieldspeechsignal.Thispaperresearch鹤10ealizationtechnology
using
microphonearray.ToovercometheinherentlimitationsofMUSIC,wetransformtheinputsignalsto
frequencydomain,andthenextractsub-band.Onthisbasis,weestimatedthenumberofreceivesignalsand
realizelocalizationofspeechsource.Afastsearchalgorithmisproposedtofindthelocationofspeechsource.Thesimulationsres。ultsshowthatina
reverberationroom,the
algorithmeffectivelyfindsthepositionofthe
speech
source.
Keywords:microphonearray,near-fieldspeechmodel,speechSourcelocalization
j
1
引言
语音信号频率集中于300~3400I--Iz,是未经调制的基带信号.很多针对窄带信号提出的传统算法要麦克风阵列的声源定位是指用麦克风拾取声使用在麦克风阵列,则必须对阵列的输出信号进行音信号,通过对麦克风阵列的各路输出信号进行分预处理,如滤波,抽取子带等,以满足算法的窄带信析和处理,得到一个或者多个声源的位置信息.如号前提.
果声源能够持续地输出声音,通过对麦克风阵列接
2)传统的阵列信号多采用远场,平面波模型,
收到的信号进行实时分析和处理,则可以实现对移
而麦克风阵列多位于近场,需要使用球面波模型.动声源的定位和跟踪.
另外,在需要估计声源与阵列的距离时,还应该考与传统的阵列信号处理相比,麦克风阵列的信
虑信号在传播过程中发生的幅度衰减.
号处理有以下的不同:
3)传统的阵列信号处理中,噪声和信源通常是
,1)传统的阵列处理信号,如雷达信号,是经过不相干的.而麦克风阵列多位于室内等较封闭的环高频信号调制了的窄带信号,而麦克风阵列处理的
境中,除了环境噪声和其他声源的影响外,声源本
收稿日期:2007-01—18
基金项目:国家自然科学基金项目(60472096)
作者简介:李文(1983一),男,2005级硕士研究生.E-mail:ed.1ee@163.嗍
万
方数据
四川大学学报(自然科学版)
身在室内的混响也会对准确定位造成影响.
本文研究将MUSIC方法用于近场声源定位
第45卷
阵列中心为原点,第i个麦克风的横坐标为di.我
们把阵列中心作为参考点,设它接收到的声源歹的信号为S(£),则第i个阵元接收到的信号的相对幅
度为:
所需的处理和改进.针对谱峰的特点,提出了一种快速谱峰搜索算法,搜索结果表明,算法有效的估
计出了声源的位置.
2信号模型
一般认为,当声源与阵列的距离r≤2L2/2
量巧2万磊孬丢云亏萧,
i=1,2,…,M;
各个阵元接收到的信号的相对时延:
(2)
时,处于近场范围[1l,其中,L为阵列的孔径,A为
^.
声波的波长.这时我们应该用球面波模型代替平面
凸fij一——。c
i=1,2,…,M;
D
√(rsina)2+(df—rcosl2)2一,.
模型来描述声波的传播.除了考虑各个麦克风之间由于与声源的距离不同造成的接收到的信号的相
位差异以外,还应该考虑声波在空气中传播造成的
其中,c为声音的传播速度.(1)式中的噪声部分:
t
一’
(3)
幅度衰减.若毛(£)为声源信号,则麦克风阵列各个阵元的输出信号可以写成【1,2J:
卫
yi(t)=∑∑6鹕(£一Atmij")+&(£),
i=1,2,…,M;
(4)
第一部分为各个声源的各路回波的总和,M
(1)
zi(t)=∑kosi(t一△‘巧)-I-Yi(t),
j=1
i=1,2,…,M;歹=1,2,…,D
为不同方向的回波的总数,b。if和△£名j为第歹个声源的第优路回波对于第i个麦克风的幅度衰减
因子以及相对时延.毋(£)为加性白噪声.
其中下标i指该量属于第i路麦克风,J指第歹个声
源,麦克风数量为M,声源数量D.k甜和△‘d是阵
元i接收到的声源歹的信号的幅度衰减因子以及相对时延,Yi(£)则是各种噪声的总和.
3算法描述
MUSIC方法[3t4]是针对窄带信号处理提出
的,而语音信号是一个复杂的基带非平稳信号.为
了满足窄带前提,我们对阵列输入信号进行时.频处理并抽取子带,在此基础上估计声源的数量并实现声源定位.
首先,对麦克风阵列的输出信号,在时域进行
采样,抽取若干个点后进行N点离散傅立叶变换
(Discrete
FourierTransformation):
rx,(叫o)
Xl(COlX2(C01
…XI(coN一…X2(CON一
(4)
x:lx2(砧
…
图1
Fig.1
麦克风阵列的近场球面渡模型
Near
L‰(∞o)‰(叫1
…xM(∞N一
fieldmodelofmicrophonearray
X每行为某个阵元接收到的信号抽取若干个点后
的的离散傅立叶变换(D阿),每列为各阵元信号
对于如图1所示的均匀直线阵列,相邻阵元间的距离为Ad,声源距离阵列中心的距离为r,以
离散傅立叶变化后在同一频点处的值.
根据(1),
D
Xi(CO。)=∑koexp(-歹叫。At巧)S(叫。)+Y,(CO。),恕=1,2,…,N;
则对于(4)中的某个频点∞。有:
(5)
x(∞。)=[Xl(鲫。)x2(‰)…XM(CO。)]1’=
万方数据
第2期李文等:基于麦克风阵列的近场声源定位
加e一心血“眈e-./%At2_I
k12e-'%‘血12
klDe-知n△£1。k2De~如。血2D
Sl(甜。)S2(叫。)
+
yl(∞。)y2(Ⅲ。)
忌22e一知p笠
肺e-心atMt.惫胞e-以6tm2
愚加e’iranAtMD
SD(00。)yM(∞。)
AS(∞。)+y(叫。),咒=1,2…N
若各噪声信号均值为零,互不相关且与信号
Udiag[;tl,A2,…AM]UH,其中Al,A2,…AM为尺的
以下根据基于信息论的准则的description
length)法则【5,6】,利用
MDL(t):N(M—z)logl掣l+
f
1
§、]
【(ⅡA;)南J
‘=f十I
去z(2M—1)logN(7)
估计出D后,根据MUSIC方法,将u分解为
P(口,r)=
1
口HU★|I
2
(8)
=
[kl(口,r)e巾¨尬‘l¨’,’,…,忌M(口,
r)e-J,o(n’at小“¨]T.ki(口,r)和Atf(口,r)为第i路(3).则使得P(口,,.)最大的(a,r)即为声源所对
要判断出声源的方位,我们还应该搜索出谱峰
万
方数据(6)
________-_____——
___——___
下:
①当D=1时,在谱峰搜索结果中抽取r=O.5,1.0,1.5所对应的向量并相加,在其结果中搜索出若干极大值.则极大值中最大值对应的角度为
口.
②在a一5’~a+5’的范围内,搜索P(口,r)极大值,则极大值中的最大值对应的(口,r)即是对谱峰的估计值.
③若D≠1,则需D一1次重复上述过程.只是在①中,a应相应的取次大值,第三大值等.
4仿真实验
实验数据在matlab环境下的一个虚拟声学实验室中产生,首先计算房间的冲激响应,然后据此来模拟各个麦克风接收到的信号.虚拟房间宽,长,高为(4,5,3),单位:m.麦克风阵以及声源均位于高为1.5的平面,八个麦克风排列成均匀直线阵列,间距0.1m.其中第i个麦克风在平面中的位置为:(1.8-i,2,1.5),i=1,2,…8;房间混响时间
160
ITlS,声音
传播速度345m/s,房间各个面的反射系数如
表一所示.声源采样频率8KHz,量化精度16
bit.
输入数据每帧200点,添0补齐256点后进行
DFT,噪声信号为高斯白噪声,信噪比约20db,谱峰搜索时选取14个频率点分别计算后平均,角度的搜索步长为1。,距离步长为0.05m.
表1虚拟房间各个面的反射系数
Tab.1
Reflectioncoefficientofthevirtualroom
反射面X=OX=4y=0y=5Z=0Z=3反射系数0.7
0.7
0.7
0.7
0.5
0.8
单个信源的仿真:
声源为一段男声的中文,位置矢量为(1.7,2.
35,1.5),相对于麦克风阵列的中心其方位坐标为
(口,r)=(45。,0.495m).仿真结果如图2.
不相关,则X(∞。)的自相关矩阵为R=
E{x(埘。)X(∞。)H}=脚H+巧2J,其中,P=
E{S(cc,。)S(O.9。)H},d2为该频点处的噪声功率,J
为单位矩阵.可对其进行特征值分解:R=
特征值且J:Il>A2>…>AM.U的第i列为与Ai对应的R特征向量.
MDL(minimum
R的特征值分解的结果,估计声源数目D:
其中l=0,1,¨,M一1.声源数的估计值为使得
MDL(1)最小的z的值.因为语音信号的复杂性,所以这里取若干个频点分别估计出声源数后取统计平均,作为声源D的估计值.
信号空间魄和噪声空间UNtl|,则空间谱
其中,口
信号的相对幅度和相对时延,表达式参见(2)和应的位置.由于语音是一个复杂的非平稳信号,不
能保证始终包含某个频点,所以选取若干个频点,
分别求取空间谱然后平均.
所对应的口和r值.由于在一个面内搜索量很大,
根据实验发现,谱峰存在于某个“脊”之中,为了减少搜索量,我们可以先找出“脊”的位置,然后在在这个位置为中心的某个范围内搜索谱峰,过程如
310
四川大学学报(自然科学版)
第45卷
图2单个信源的DOA估计
Fig.2
DOA
estimateofsingle
SOUrCe
对声源位置的搜索结果为:
表2单信源谱峰搜索结果
Tab.2
Searchresultofthesingle
Si州g)1.wce
多个信源的仿真:
声源1位置矢量为(1.7,2.35,1.5),相对方位坐标(口l,r1)=(45。,0.495m).
声源2位置矢量:(1,2.60,1.5).相对方位坐标(口2,,.2)=(120",0.7m),仿真结果如图3:
图3两个信源的DOA估计
Fig.3
DOAestimateofdouble
sources
对声源位置的搜索结果为:
万
方数据表3双信源谱峰搜索结果
丁备6.3
SearchresultofdoubleSOUrCes
根据仿真结果,在一个和多个信源的情况下,算法都能较好的估计出声源的位置.
4结语
介绍了语音信号的近场模型,给出了使用麦克
风阵列对其定位的MUSIC算法,并给出了一种搜
索声源位置的方法.仿真结果表明,算法较好的实
现了在对一个和多个声源的定位.对角度和距离都得到了比较准确的估计.定位范围:0.2~1.5m,定位精度:角度定位精度±10。,距离定位精度±0.
05
ITI.但是随着距离的增加,近场模型失效,或者
房间反射系数增大,混响时间变长等对声源位置的
估计的准确性都会造成一定的影响.
参考文献-
[1]
MingJ,AlexCK,MengHE.Doaestimationof
speech
solJ/'ce
with
microphonearrays[J].Circuitsand
Systems,1998,98:293.
[2]JuT
L,XuYL,PengQ
C.Speech
80urce
k)calization
in
Nea.r
field[J].IC(℃AS[C],IIE朗℃[C].Chengdu:
2004,769.
[33肖先赐.现代谱估计:原理与应用[M].哈尔滨:哈
尔滨工业大学出版社,1991.
[4]Futoshi,AHideki,ToshihiroM.Sound
SOUl'Oe
localiza.
tion
and
separationin
rll篷itr
fleld[J].IEICETramFun.
dalTld'ltals,2000,E83.A(11):2286.
[5]刘德树.空间谱估计及其应用[M].合肥:中国科学
冀术大学出版社,1997.
[6]NezafatM,KavehM,XuW.EstimationoftheNU.rB.
berofsotlrcesbased
011
theeigenvectorsofthecovari—
alice
matrix[C].USA:Deptof
ElectrEngMinnesota
Univ,2004:465.
[责任编辑:李富河]
基于麦克风阵列的近场声源定位
作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:
李文, 夏秀渝, 何培宇, 李源, LI Wen, XIA Xiu-Yu, HE Pei-Yu, LI Yuan四川大学电子信息学院,成都,610064
四川大学学报(自然科学版)
JOURNAL OF SICHUAN UNIVERSITY(NATURAL SCIENCE EDITION)2008,45(2)5次
参考文献(6条)
1. Ming J;Alex C K;Meng H E Doa estimation of speech source with microphone arrays 19982. Ju T L;Xu Y L;Peng Q C Speech source localization in near field[会议论文] 20043. 肖先赐 现代谱估计:原理与应用 1991
4. Futoshi;AHideki;Toshihiro M Sound source localiza-tion and separation in near field 2000(11)5. 刘德树 空间谱估计及其应用 1997
6. Nezafat M;Kaveh M;Xu W Estimation of the num-ber of sources based on the eigenvectors of thecovari-anee matrix 2004
本文读者也读过(10条)
1. 刘真旭. Liu Zhenxu 基于麦克风阵列的实时声源定位[期刊论文]-计算机应用与软件2010,27(6)
2. 邵怀宗. 林静然. 彭启琮. 居太亮. 徐异凌 基于麦克风阵列的声源定位研究[期刊论文]-云南民族大学学报(自然科学版)2004,13(4)
3. 王大中. 李晓妮. WANG Da-zhong. LI Xiao-ni 基于麦克风阵列的语音信号实时时延估计[期刊论文]-吉林大学学报(信息科学版)2009,27(2)
4. 于豪光. 王洪源 基于麦克风阵列的声源时延估计算法的研究[期刊论文]-科技创新导报2008(32)
5. 胡郢. 刁帅. Hu Ying. Diao Shuai 基于T型麦克风阵列的近场三维声源定位[期刊论文]-武汉船舶职业技术学院学报2009,8(6)
6. 基于麦克风阵列声音信号定位方法的研究[期刊论文]-传感技术学报2010,23(5)
7. 王军. 种兰祥. WANG Jun. ZHONG Lan-xiang 麦克风阵列声源定位与跟踪性能改进[期刊论文]-计算机工程与应用2008,44(19)
8. 邓艳容. 景新幸. 任华娟. DENG Yan Rong. JING Xin Xing. REN Hua Juan 基于麦克风阵列的声源定位研究[期刊论文]-电子技术应用2010,36(2)
9. 杨祥清. 汪增福. YANG Xiang-qing. WANG Zeng-fu 基于麦克风阵列的三维声源定位算法及其实现[期刊论文]-声学技术2008,27(2)
10. 任勇. 胡方明. 李自学. Ren Yong. Hu Fangming. Li Zixue 基于麦克风阵列声源定位系统的FPGA实现[期刊论文]-电子科技2011,24(4)
引证文献(5条)
1. 郭威. 申利民. 谭云福. 陶凤莉 嵌入式语音识别在混响环境中的信号增强方法[期刊论文]-计算机应用研究2010(12)
2. 金光明. 谢植. 张传义. 金日炳 基于两个L型阵列的远场多声源定位方法[期刊论文]-东北大学学报:自然科学版2012(9)
3. 叶永. 陈建峰. 程萍. 冷欣 用于麦克风阵列的阵元筛选方法研究[期刊论文]-传感技术学报 2012(11)4. 刘来财. 何培宇 一种新的虚拟均匀线阵的构造方法[期刊论文]-四川大学学报(自然科学版) 2012(2)
5. 余帅. 何培宇 一种单通道语音倒谱域去混响新方法[期刊论文]-四川大学学报(自然科学版) 2012(4)
引用本文格式:李文. 夏秀渝. 何培宇. 李源. LI Wen. XIA Xiu-Yu. HE Pei-Yu. LI Yuan 基于麦克风阵列的近场声源定位[期刊论文]-四川大学学报(自然科学版) 2008(2)