基于麦克风阵列的近场声源定位

2008年4月四川大学学报(自然科学版)

Apr.2008

第45卷第2期

Journalof

SichuanUniversity(NaturalScienceEdition)

v01.45No.2

文章编号:0490—6756(2008)02—0307.04

基于麦克风阵列的近场声源定位

文,夏秀渝,何培宇,李

(四川大学电子信息学院,成都610064)

摘要:根据近场语音信号的特点,研究使用麦克风阵列的近场声源定位技术.为了克服MUSIC算法本身的局限,对阵列的输入信号进行时一频变换并抽取子带,在此基础上估计声

源的数量并对实现对语音信号的定位.最后,根据谱峰的特点,提出了一种快速谱峰搜索算法.仿真结果表明,在有混响的房间中,算法有效的提取了声源的方位.关键词:麦克风阵列;近场语音模型;声源定位中图分类号:TP202.7

文献标识码:A

Speech

source

localizationinnear-fieldbased

on

microphone

arrays

Lf

W砌,X舱X/u.h,HEPei.乳,Lf

Yuan

(Sdx)olof

Electronicand

InformationEngineering,SichuanUniversity,Chengdu610064,China)

Abstract:Based

on

thecharacteristicsofnear-fieldspeechsignal.Thispaperresearch鹤10ealizationtechnology

using

microphonearray.ToovercometheinherentlimitationsofMUSIC,wetransformtheinputsignalsto

frequencydomain,andthenextractsub-band.Onthisbasis,weestimatedthenumberofreceivesignalsand

realizelocalizationofspeechsource.Afastsearchalgorithmisproposedtofindthelocationofspeechsource.Thesimulationsres。ultsshowthatina

reverberationroom,the

algorithmeffectivelyfindsthepositionofthe

speech

source.

Keywords:microphonearray,near-fieldspeechmodel,speechSourcelocalization

引言

语音信号频率集中于300~3400I--Iz,是未经调制的基带信号.很多针对窄带信号提出的传统算法要麦克风阵列的声源定位是指用麦克风拾取声使用在麦克风阵列,则必须对阵列的输出信号进行音信号,通过对麦克风阵列的各路输出信号进行分预处理,如滤波,抽取子带等,以满足算法的窄带信析和处理,得到一个或者多个声源的位置信息.如号前提.

果声源能够持续地输出声音,通过对麦克风阵列接

2)传统的阵列信号多采用远场,平面波模型,

收到的信号进行实时分析和处理,则可以实现对移

而麦克风阵列多位于近场,需要使用球面波模型.动声源的定位和跟踪.

另外,在需要估计声源与阵列的距离时,还应该考与传统的阵列信号处理相比,麦克风阵列的信

虑信号在传播过程中发生的幅度衰减.

号处理有以下的不同:

3)传统的阵列信号处理中,噪声和信源通常是

,1)传统的阵列处理信号,如雷达信号,是经过不相干的.而麦克风阵列多位于室内等较封闭的环高频信号调制了的窄带信号,而麦克风阵列处理的

境中,除了环境噪声和其他声源的影响外,声源本

收稿日期:2007-01—18

基金项目:国家自然科学基金项目(60472096)

作者简介:李文(1983一),男,2005级硕士研究生.E-mail:ed.1ee@163.嗍

万 

方数据

四川大学学报(自然科学版)

身在室内的混响也会对准确定位造成影响.

本文研究将MUSIC方法用于近场声源定位

第45卷

阵列中心为原点,第i个麦克风的横坐标为di.我

们把阵列中心作为参考点,设它接收到的声源歹的信号为S(£),则第i个阵元接收到的信号的相对幅

度为:

所需的处理和改进.针对谱峰的特点,提出了一种快速谱峰搜索算法,搜索结果表明,算法有效的估

计出了声源的位置.

2信号模型

一般认为,当声源与阵列的距离r≤2L2/2

量巧2万磊孬丢云亏萧,

i=1,2,…,M;

各个阵元接收到的信号的相对时延:

(2)

时,处于近场范围[1l,其中,L为阵列的孔径,A为

^.

声波的波长.这时我们应该用球面波模型代替平面

凸fij一——。c

i=1,2,…,M;

√(rsina)2+(df—rcosl2)2一,.

模型来描述声波的传播.除了考虑各个麦克风之间由于与声源的距离不同造成的接收到的信号的相

位差异以外,还应该考虑声波在空气中传播造成的

其中,c为声音的传播速度.(1)式中的噪声部分:

一’

(3)

幅度衰减.若毛(£)为声源信号,则麦克风阵列各个阵元的输出信号可以写成【1,2J:

yi(t)=∑∑6鹕(£一Atmij")+&(£),

i=1,2,…,M;

(4)

第一部分为各个声源的各路回波的总和,M

(1)

zi(t)=∑kosi(t一△‘巧)-I-Yi(t),

j=1

i=1,2,…,M;歹=1,2,…,D

为不同方向的回波的总数,b。if和△£名j为第歹个声源的第优路回波对于第i个麦克风的幅度衰减

因子以及相对时延.毋(£)为加性白噪声.

其中下标i指该量属于第i路麦克风,J指第歹个声

源,麦克风数量为M,声源数量D.k甜和△‘d是阵

元i接收到的声源歹的信号的幅度衰减因子以及相对时延,Yi(£)则是各种噪声的总和.

3算法描述

MUSIC方法[3t4]是针对窄带信号处理提出

的,而语音信号是一个复杂的基带非平稳信号.为

了满足窄带前提,我们对阵列输入信号进行时.频处理并抽取子带,在此基础上估计声源的数量并实现声源定位.

首先,对麦克风阵列的输出信号,在时域进行

采样,抽取若干个点后进行N点离散傅立叶变换

(Discrete

FourierTransformation):

rx,(叫o)

Xl(COlX2(C01

…XI(coN一…X2(CON一

(4)

x:lx2(砧

图1

Fig.1

麦克风阵列的近场球面渡模型

Near

L‰(∞o)‰(叫1

…xM(∞N一

fieldmodelofmicrophonearray

X每行为某个阵元接收到的信号抽取若干个点后

的的离散傅立叶变换(D阿),每列为各阵元信号

对于如图1所示的均匀直线阵列,相邻阵元间的距离为Ad,声源距离阵列中心的距离为r,以

离散傅立叶变化后在同一频点处的值.

根据(1),

Xi(CO。)=∑koexp(-歹叫。At巧)S(叫。)+Y,(CO。),恕=1,2,…,N;

则对于(4)中的某个频点∞。有:

(5)

x(∞。)=[Xl(鲫。)x2(‰)…XM(CO。)]1’=

万方数据 

第2期李文等:基于麦克风阵列的近场声源定位

加e一心血“眈e-./%At2_I

k12e-'%‘血12

klDe-知n△£1。k2De~如。血2D

Sl(甜。)S2(叫。)

yl(∞。)y2(Ⅲ。)

忌22e一知p笠

肺e-心atMt.惫胞e-以6tm2

愚加e’iranAtMD

SD(00。)yM(∞。)

AS(∞。)+y(叫。),咒=1,2…N

若各噪声信号均值为零,互不相关且与信号

Udiag[;tl,A2,…AM]UH,其中Al,A2,…AM为尺的

以下根据基于信息论的准则的description

length)法则【5,6】,利用

MDL(t):N(M—z)logl掣l+

§、]

【(ⅡA;)南J

‘=f十I

去z(2M—1)logN(7)

估计出D后,根据MUSIC方法,将u分解为

P(口,r)=

口HU★|I

(8)

[kl(口,r)e巾¨尬‘l¨’,’,…,忌M(口,

r)e-J,o(n’at小“¨]T.ki(口,r)和Atf(口,r)为第i路(3).则使得P(口,,.)最大的(a,r)即为声源所对

要判断出声源的方位,我们还应该搜索出谱峰

万 

方数据(6)

________-_____——

___——___

下:

①当D=1时,在谱峰搜索结果中抽取r=O.5,1.0,1.5所对应的向量并相加,在其结果中搜索出若干极大值.则极大值中最大值对应的角度为

口.

②在a一5’~a+5’的范围内,搜索P(口,r)极大值,则极大值中的最大值对应的(口,r)即是对谱峰的估计值.

③若D≠1,则需D一1次重复上述过程.只是在①中,a应相应的取次大值,第三大值等.

4仿真实验

实验数据在matlab环境下的一个虚拟声学实验室中产生,首先计算房间的冲激响应,然后据此来模拟各个麦克风接收到的信号.虚拟房间宽,长,高为(4,5,3),单位:m.麦克风阵以及声源均位于高为1.5的平面,八个麦克风排列成均匀直线阵列,间距0.1m.其中第i个麦克风在平面中的位置为:(1.8-i,2,1.5),i=1,2,…8;房间混响时间

160

ITlS,声音

传播速度345m/s,房间各个面的反射系数如

表一所示.声源采样频率8KHz,量化精度16

bit.

输入数据每帧200点,添0补齐256点后进行

DFT,噪声信号为高斯白噪声,信噪比约20db,谱峰搜索时选取14个频率点分别计算后平均,角度的搜索步长为1。,距离步长为0.05m.

表1虚拟房间各个面的反射系数

Tab.1

Reflectioncoefficientofthevirtualroom

反射面X=OX=4y=0y=5Z=0Z=3反射系数0.7

0.7

0.7

0.7

0.5

0.8

单个信源的仿真:

声源为一段男声的中文,位置矢量为(1.7,2.

35,1.5),相对于麦克风阵列的中心其方位坐标为

(口,r)=(45。,0.495m).仿真结果如图2.

不相关,则X(∞。)的自相关矩阵为R=

E{x(埘。)X(∞。)H}=脚H+巧2J,其中,P=

E{S(cc,。)S(O.9。)H},d2为该频点处的噪声功率,J

为单位矩阵.可对其进行特征值分解:R=

特征值且J:Il>A2>…>AM.U的第i列为与Ai对应的R特征向量.

MDL(minimum

R的特征值分解的结果,估计声源数目D:

其中l=0,1,¨,M一1.声源数的估计值为使得

MDL(1)最小的z的值.因为语音信号的复杂性,所以这里取若干个频点分别估计出声源数后取统计平均,作为声源D的估计值.

信号空间魄和噪声空间UNtl|,则空间谱

其中,口

信号的相对幅度和相对时延,表达式参见(2)和应的位置.由于语音是一个复杂的非平稳信号,不

能保证始终包含某个频点,所以选取若干个频点,

分别求取空间谱然后平均.

所对应的口和r值.由于在一个面内搜索量很大,

根据实验发现,谱峰存在于某个“脊”之中,为了减少搜索量,我们可以先找出“脊”的位置,然后在在这个位置为中心的某个范围内搜索谱峰,过程如

310

四川大学学报(自然科学版)

第45卷

图2单个信源的DOA估计

Fig.2

DOA

estimateofsingle

SOUrCe

对声源位置的搜索结果为:

表2单信源谱峰搜索结果

Tab.2

Searchresultofthesingle

Si州g)1.wce

多个信源的仿真:

声源1位置矢量为(1.7,2.35,1.5),相对方位坐标(口l,r1)=(45。,0.495m).

声源2位置矢量:(1,2.60,1.5).相对方位坐标(口2,,.2)=(120",0.7m),仿真结果如图3:

图3两个信源的DOA估计

Fig.3

DOAestimateofdouble

sources

对声源位置的搜索结果为:

万 

方数据表3双信源谱峰搜索结果

丁备6.3

SearchresultofdoubleSOUrCes

根据仿真结果,在一个和多个信源的情况下,算法都能较好的估计出声源的位置.

4结语

介绍了语音信号的近场模型,给出了使用麦克

风阵列对其定位的MUSIC算法,并给出了一种搜

索声源位置的方法.仿真结果表明,算法较好的实

现了在对一个和多个声源的定位.对角度和距离都得到了比较准确的估计.定位范围:0.2~1.5m,定位精度:角度定位精度±10。,距离定位精度±0.

05

ITI.但是随着距离的增加,近场模型失效,或者

房间反射系数增大,混响时间变长等对声源位置的

估计的准确性都会造成一定的影响.

参考文献-

[1]

MingJ,AlexCK,MengHE.Doaestimationof

speech

solJ/'ce

with

microphonearrays[J].Circuitsand

Systems,1998,98:293.

[2]JuT

L,XuYL,PengQ

C.Speech

80urce

k)calization

in

Nea.r

field[J].IC(℃AS[C],IIE朗℃[C].Chengdu:

2004,769.

[33肖先赐.现代谱估计:原理与应用[M].哈尔滨:哈

尔滨工业大学出版社,1991.

[4]Futoshi,AHideki,ToshihiroM.Sound

SOUl'Oe

localiza.

tion

and

separationin

rll篷itr

fleld[J].IEICETramFun.

dalTld'ltals,2000,E83.A(11):2286.

[5]刘德树.空间谱估计及其应用[M].合肥:中国科学

冀术大学出版社,1997.

[6]NezafatM,KavehM,XuW.EstimationoftheNU.rB.

berofsotlrcesbased

011

theeigenvectorsofthecovari—

alice

matrix[C].USA:Deptof

ElectrEngMinnesota

Univ,2004:465.

[责任编辑:李富河]

基于麦克风阵列的近场声源定位

作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:

李文, 夏秀渝, 何培宇, 李源, LI Wen, XIA Xiu-Yu, HE Pei-Yu, LI Yuan四川大学电子信息学院,成都,610064

四川大学学报(自然科学版)

JOURNAL OF SICHUAN UNIVERSITY(NATURAL SCIENCE EDITION)2008,45(2)5次

参考文献(6条)

1. Ming J;Alex C K;Meng H E Doa estimation of speech source with microphone arrays 19982. Ju T L;Xu Y L;Peng Q C Speech source localization in near field[会议论文] 20043. 肖先赐 现代谱估计:原理与应用 1991

4. Futoshi;AHideki;Toshihiro M Sound source localiza-tion and separation in near field 2000(11)5. 刘德树 空间谱估计及其应用 1997

6. Nezafat M;Kaveh M;Xu W Estimation of the num-ber of sources based on the eigenvectors of thecovari-anee matrix 2004

本文读者也读过(10条)

1. 刘真旭. Liu Zhenxu 基于麦克风阵列的实时声源定位[期刊论文]-计算机应用与软件2010,27(6)

2. 邵怀宗. 林静然. 彭启琮. 居太亮. 徐异凌 基于麦克风阵列的声源定位研究[期刊论文]-云南民族大学学报(自然科学版)2004,13(4)

3. 王大中. 李晓妮. WANG Da-zhong. LI Xiao-ni 基于麦克风阵列的语音信号实时时延估计[期刊论文]-吉林大学学报(信息科学版)2009,27(2)

4. 于豪光. 王洪源 基于麦克风阵列的声源时延估计算法的研究[期刊论文]-科技创新导报2008(32)

5. 胡郢. 刁帅. Hu Ying. Diao Shuai 基于T型麦克风阵列的近场三维声源定位[期刊论文]-武汉船舶职业技术学院学报2009,8(6)

6. 基于麦克风阵列声音信号定位方法的研究[期刊论文]-传感技术学报2010,23(5)

7. 王军. 种兰祥. WANG Jun. ZHONG Lan-xiang 麦克风阵列声源定位与跟踪性能改进[期刊论文]-计算机工程与应用2008,44(19)

8. 邓艳容. 景新幸. 任华娟. DENG Yan Rong. JING Xin Xing. REN Hua Juan 基于麦克风阵列的声源定位研究[期刊论文]-电子技术应用2010,36(2)

9. 杨祥清. 汪增福. YANG Xiang-qing. WANG Zeng-fu 基于麦克风阵列的三维声源定位算法及其实现[期刊论文]-声学技术2008,27(2)

10. 任勇. 胡方明. 李自学. Ren Yong. Hu Fangming. Li Zixue 基于麦克风阵列声源定位系统的FPGA实现[期刊论文]-电子科技2011,24(4)

引证文献(5条)

1. 郭威. 申利民. 谭云福. 陶凤莉 嵌入式语音识别在混响环境中的信号增强方法[期刊论文]-计算机应用研究2010(12)

2. 金光明. 谢植. 张传义. 金日炳 基于两个L型阵列的远场多声源定位方法[期刊论文]-东北大学学报:自然科学版2012(9)

3. 叶永. 陈建峰. 程萍. 冷欣 用于麦克风阵列的阵元筛选方法研究[期刊论文]-传感技术学报 2012(11)4. 刘来财. 何培宇 一种新的虚拟均匀线阵的构造方法[期刊论文]-四川大学学报(自然科学版) 2012(2)

5. 余帅. 何培宇 一种单通道语音倒谱域去混响新方法[期刊论文]-四川大学学报(自然科学版) 2012(4)

引用本文格式:李文. 夏秀渝. 何培宇. 李源. LI Wen. XIA Xiu-Yu. HE Pei-Yu. LI Yuan 基于麦克风阵列的近场声源定位[期刊论文]-四川大学学报(自然科学版) 2008(2)

2008年4月四川大学学报(自然科学版)

Apr.2008

第45卷第2期

Journalof

SichuanUniversity(NaturalScienceEdition)

v01.45No.2

文章编号:0490—6756(2008)02—0307.04

基于麦克风阵列的近场声源定位

文,夏秀渝,何培宇,李

(四川大学电子信息学院,成都610064)

摘要:根据近场语音信号的特点,研究使用麦克风阵列的近场声源定位技术.为了克服MUSIC算法本身的局限,对阵列的输入信号进行时一频变换并抽取子带,在此基础上估计声

源的数量并对实现对语音信号的定位.最后,根据谱峰的特点,提出了一种快速谱峰搜索算法.仿真结果表明,在有混响的房间中,算法有效的提取了声源的方位.关键词:麦克风阵列;近场语音模型;声源定位中图分类号:TP202.7

文献标识码:A

Speech

source

localizationinnear-fieldbased

on

microphone

arrays

Lf

W砌,X舱X/u.h,HEPei.乳,Lf

Yuan

(Sdx)olof

Electronicand

InformationEngineering,SichuanUniversity,Chengdu610064,China)

Abstract:Based

on

thecharacteristicsofnear-fieldspeechsignal.Thispaperresearch鹤10ealizationtechnology

using

microphonearray.ToovercometheinherentlimitationsofMUSIC,wetransformtheinputsignalsto

frequencydomain,andthenextractsub-band.Onthisbasis,weestimatedthenumberofreceivesignalsand

realizelocalizationofspeechsource.Afastsearchalgorithmisproposedtofindthelocationofspeechsource.Thesimulationsres。ultsshowthatina

reverberationroom,the

algorithmeffectivelyfindsthepositionofthe

speech

source.

Keywords:microphonearray,near-fieldspeechmodel,speechSourcelocalization

引言

语音信号频率集中于300~3400I--Iz,是未经调制的基带信号.很多针对窄带信号提出的传统算法要麦克风阵列的声源定位是指用麦克风拾取声使用在麦克风阵列,则必须对阵列的输出信号进行音信号,通过对麦克风阵列的各路输出信号进行分预处理,如滤波,抽取子带等,以满足算法的窄带信析和处理,得到一个或者多个声源的位置信息.如号前提.

果声源能够持续地输出声音,通过对麦克风阵列接

2)传统的阵列信号多采用远场,平面波模型,

收到的信号进行实时分析和处理,则可以实现对移

而麦克风阵列多位于近场,需要使用球面波模型.动声源的定位和跟踪.

另外,在需要估计声源与阵列的距离时,还应该考与传统的阵列信号处理相比,麦克风阵列的信

虑信号在传播过程中发生的幅度衰减.

号处理有以下的不同:

3)传统的阵列信号处理中,噪声和信源通常是

,1)传统的阵列处理信号,如雷达信号,是经过不相干的.而麦克风阵列多位于室内等较封闭的环高频信号调制了的窄带信号,而麦克风阵列处理的

境中,除了环境噪声和其他声源的影响外,声源本

收稿日期:2007-01—18

基金项目:国家自然科学基金项目(60472096)

作者简介:李文(1983一),男,2005级硕士研究生.E-mail:ed.1ee@163.嗍

万 

方数据

四川大学学报(自然科学版)

身在室内的混响也会对准确定位造成影响.

本文研究将MUSIC方法用于近场声源定位

第45卷

阵列中心为原点,第i个麦克风的横坐标为di.我

们把阵列中心作为参考点,设它接收到的声源歹的信号为S(£),则第i个阵元接收到的信号的相对幅

度为:

所需的处理和改进.针对谱峰的特点,提出了一种快速谱峰搜索算法,搜索结果表明,算法有效的估

计出了声源的位置.

2信号模型

一般认为,当声源与阵列的距离r≤2L2/2

量巧2万磊孬丢云亏萧,

i=1,2,…,M;

各个阵元接收到的信号的相对时延:

(2)

时,处于近场范围[1l,其中,L为阵列的孔径,A为

^.

声波的波长.这时我们应该用球面波模型代替平面

凸fij一——。c

i=1,2,…,M;

√(rsina)2+(df—rcosl2)2一,.

模型来描述声波的传播.除了考虑各个麦克风之间由于与声源的距离不同造成的接收到的信号的相

位差异以外,还应该考虑声波在空气中传播造成的

其中,c为声音的传播速度.(1)式中的噪声部分:

一’

(3)

幅度衰减.若毛(£)为声源信号,则麦克风阵列各个阵元的输出信号可以写成【1,2J:

yi(t)=∑∑6鹕(£一Atmij")+&(£),

i=1,2,…,M;

(4)

第一部分为各个声源的各路回波的总和,M

(1)

zi(t)=∑kosi(t一△‘巧)-I-Yi(t),

j=1

i=1,2,…,M;歹=1,2,…,D

为不同方向的回波的总数,b。if和△£名j为第歹个声源的第优路回波对于第i个麦克风的幅度衰减

因子以及相对时延.毋(£)为加性白噪声.

其中下标i指该量属于第i路麦克风,J指第歹个声

源,麦克风数量为M,声源数量D.k甜和△‘d是阵

元i接收到的声源歹的信号的幅度衰减因子以及相对时延,Yi(£)则是各种噪声的总和.

3算法描述

MUSIC方法[3t4]是针对窄带信号处理提出

的,而语音信号是一个复杂的基带非平稳信号.为

了满足窄带前提,我们对阵列输入信号进行时.频处理并抽取子带,在此基础上估计声源的数量并实现声源定位.

首先,对麦克风阵列的输出信号,在时域进行

采样,抽取若干个点后进行N点离散傅立叶变换

(Discrete

FourierTransformation):

rx,(叫o)

Xl(COlX2(C01

…XI(coN一…X2(CON一

(4)

x:lx2(砧

图1

Fig.1

麦克风阵列的近场球面渡模型

Near

L‰(∞o)‰(叫1

…xM(∞N一

fieldmodelofmicrophonearray

X每行为某个阵元接收到的信号抽取若干个点后

的的离散傅立叶变换(D阿),每列为各阵元信号

对于如图1所示的均匀直线阵列,相邻阵元间的距离为Ad,声源距离阵列中心的距离为r,以

离散傅立叶变化后在同一频点处的值.

根据(1),

Xi(CO。)=∑koexp(-歹叫。At巧)S(叫。)+Y,(CO。),恕=1,2,…,N;

则对于(4)中的某个频点∞。有:

(5)

x(∞。)=[Xl(鲫。)x2(‰)…XM(CO。)]1’=

万方数据 

第2期李文等:基于麦克风阵列的近场声源定位

加e一心血“眈e-./%At2_I

k12e-'%‘血12

klDe-知n△£1。k2De~如。血2D

Sl(甜。)S2(叫。)

yl(∞。)y2(Ⅲ。)

忌22e一知p笠

肺e-心atMt.惫胞e-以6tm2

愚加e’iranAtMD

SD(00。)yM(∞。)

AS(∞。)+y(叫。),咒=1,2…N

若各噪声信号均值为零,互不相关且与信号

Udiag[;tl,A2,…AM]UH,其中Al,A2,…AM为尺的

以下根据基于信息论的准则的description

length)法则【5,6】,利用

MDL(t):N(M—z)logl掣l+

§、]

【(ⅡA;)南J

‘=f十I

去z(2M—1)logN(7)

估计出D后,根据MUSIC方法,将u分解为

P(口,r)=

口HU★|I

(8)

[kl(口,r)e巾¨尬‘l¨’,’,…,忌M(口,

r)e-J,o(n’at小“¨]T.ki(口,r)和Atf(口,r)为第i路(3).则使得P(口,,.)最大的(a,r)即为声源所对

要判断出声源的方位,我们还应该搜索出谱峰

万 

方数据(6)

________-_____——

___——___

下:

①当D=1时,在谱峰搜索结果中抽取r=O.5,1.0,1.5所对应的向量并相加,在其结果中搜索出若干极大值.则极大值中最大值对应的角度为

口.

②在a一5’~a+5’的范围内,搜索P(口,r)极大值,则极大值中的最大值对应的(口,r)即是对谱峰的估计值.

③若D≠1,则需D一1次重复上述过程.只是在①中,a应相应的取次大值,第三大值等.

4仿真实验

实验数据在matlab环境下的一个虚拟声学实验室中产生,首先计算房间的冲激响应,然后据此来模拟各个麦克风接收到的信号.虚拟房间宽,长,高为(4,5,3),单位:m.麦克风阵以及声源均位于高为1.5的平面,八个麦克风排列成均匀直线阵列,间距0.1m.其中第i个麦克风在平面中的位置为:(1.8-i,2,1.5),i=1,2,…8;房间混响时间

160

ITlS,声音

传播速度345m/s,房间各个面的反射系数如

表一所示.声源采样频率8KHz,量化精度16

bit.

输入数据每帧200点,添0补齐256点后进行

DFT,噪声信号为高斯白噪声,信噪比约20db,谱峰搜索时选取14个频率点分别计算后平均,角度的搜索步长为1。,距离步长为0.05m.

表1虚拟房间各个面的反射系数

Tab.1

Reflectioncoefficientofthevirtualroom

反射面X=OX=4y=0y=5Z=0Z=3反射系数0.7

0.7

0.7

0.7

0.5

0.8

单个信源的仿真:

声源为一段男声的中文,位置矢量为(1.7,2.

35,1.5),相对于麦克风阵列的中心其方位坐标为

(口,r)=(45。,0.495m).仿真结果如图2.

不相关,则X(∞。)的自相关矩阵为R=

E{x(埘。)X(∞。)H}=脚H+巧2J,其中,P=

E{S(cc,。)S(O.9。)H},d2为该频点处的噪声功率,J

为单位矩阵.可对其进行特征值分解:R=

特征值且J:Il>A2>…>AM.U的第i列为与Ai对应的R特征向量.

MDL(minimum

R的特征值分解的结果,估计声源数目D:

其中l=0,1,¨,M一1.声源数的估计值为使得

MDL(1)最小的z的值.因为语音信号的复杂性,所以这里取若干个频点分别估计出声源数后取统计平均,作为声源D的估计值.

信号空间魄和噪声空间UNtl|,则空间谱

其中,口

信号的相对幅度和相对时延,表达式参见(2)和应的位置.由于语音是一个复杂的非平稳信号,不

能保证始终包含某个频点,所以选取若干个频点,

分别求取空间谱然后平均.

所对应的口和r值.由于在一个面内搜索量很大,

根据实验发现,谱峰存在于某个“脊”之中,为了减少搜索量,我们可以先找出“脊”的位置,然后在在这个位置为中心的某个范围内搜索谱峰,过程如

310

四川大学学报(自然科学版)

第45卷

图2单个信源的DOA估计

Fig.2

DOA

estimateofsingle

SOUrCe

对声源位置的搜索结果为:

表2单信源谱峰搜索结果

Tab.2

Searchresultofthesingle

Si州g)1.wce

多个信源的仿真:

声源1位置矢量为(1.7,2.35,1.5),相对方位坐标(口l,r1)=(45。,0.495m).

声源2位置矢量:(1,2.60,1.5).相对方位坐标(口2,,.2)=(120",0.7m),仿真结果如图3:

图3两个信源的DOA估计

Fig.3

DOAestimateofdouble

sources

对声源位置的搜索结果为:

万 

方数据表3双信源谱峰搜索结果

丁备6.3

SearchresultofdoubleSOUrCes

根据仿真结果,在一个和多个信源的情况下,算法都能较好的估计出声源的位置.

4结语

介绍了语音信号的近场模型,给出了使用麦克

风阵列对其定位的MUSIC算法,并给出了一种搜

索声源位置的方法.仿真结果表明,算法较好的实

现了在对一个和多个声源的定位.对角度和距离都得到了比较准确的估计.定位范围:0.2~1.5m,定位精度:角度定位精度±10。,距离定位精度±0.

05

ITI.但是随着距离的增加,近场模型失效,或者

房间反射系数增大,混响时间变长等对声源位置的

估计的准确性都会造成一定的影响.

参考文献-

[1]

MingJ,AlexCK,MengHE.Doaestimationof

speech

solJ/'ce

with

microphonearrays[J].Circuitsand

Systems,1998,98:293.

[2]JuT

L,XuYL,PengQ

C.Speech

80urce

k)calization

in

Nea.r

field[J].IC(℃AS[C],IIE朗℃[C].Chengdu:

2004,769.

[33肖先赐.现代谱估计:原理与应用[M].哈尔滨:哈

尔滨工业大学出版社,1991.

[4]Futoshi,AHideki,ToshihiroM.Sound

SOUl'Oe

localiza.

tion

and

separationin

rll篷itr

fleld[J].IEICETramFun.

dalTld'ltals,2000,E83.A(11):2286.

[5]刘德树.空间谱估计及其应用[M].合肥:中国科学

冀术大学出版社,1997.

[6]NezafatM,KavehM,XuW.EstimationoftheNU.rB.

berofsotlrcesbased

011

theeigenvectorsofthecovari—

alice

matrix[C].USA:Deptof

ElectrEngMinnesota

Univ,2004:465.

[责任编辑:李富河]

基于麦克风阵列的近场声源定位

作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:

李文, 夏秀渝, 何培宇, 李源, LI Wen, XIA Xiu-Yu, HE Pei-Yu, LI Yuan四川大学电子信息学院,成都,610064

四川大学学报(自然科学版)

JOURNAL OF SICHUAN UNIVERSITY(NATURAL SCIENCE EDITION)2008,45(2)5次

参考文献(6条)

1. Ming J;Alex C K;Meng H E Doa estimation of speech source with microphone arrays 19982. Ju T L;Xu Y L;Peng Q C Speech source localization in near field[会议论文] 20043. 肖先赐 现代谱估计:原理与应用 1991

4. Futoshi;AHideki;Toshihiro M Sound source localiza-tion and separation in near field 2000(11)5. 刘德树 空间谱估计及其应用 1997

6. Nezafat M;Kaveh M;Xu W Estimation of the num-ber of sources based on the eigenvectors of thecovari-anee matrix 2004

本文读者也读过(10条)

1. 刘真旭. Liu Zhenxu 基于麦克风阵列的实时声源定位[期刊论文]-计算机应用与软件2010,27(6)

2. 邵怀宗. 林静然. 彭启琮. 居太亮. 徐异凌 基于麦克风阵列的声源定位研究[期刊论文]-云南民族大学学报(自然科学版)2004,13(4)

3. 王大中. 李晓妮. WANG Da-zhong. LI Xiao-ni 基于麦克风阵列的语音信号实时时延估计[期刊论文]-吉林大学学报(信息科学版)2009,27(2)

4. 于豪光. 王洪源 基于麦克风阵列的声源时延估计算法的研究[期刊论文]-科技创新导报2008(32)

5. 胡郢. 刁帅. Hu Ying. Diao Shuai 基于T型麦克风阵列的近场三维声源定位[期刊论文]-武汉船舶职业技术学院学报2009,8(6)

6. 基于麦克风阵列声音信号定位方法的研究[期刊论文]-传感技术学报2010,23(5)

7. 王军. 种兰祥. WANG Jun. ZHONG Lan-xiang 麦克风阵列声源定位与跟踪性能改进[期刊论文]-计算机工程与应用2008,44(19)

8. 邓艳容. 景新幸. 任华娟. DENG Yan Rong. JING Xin Xing. REN Hua Juan 基于麦克风阵列的声源定位研究[期刊论文]-电子技术应用2010,36(2)

9. 杨祥清. 汪增福. YANG Xiang-qing. WANG Zeng-fu 基于麦克风阵列的三维声源定位算法及其实现[期刊论文]-声学技术2008,27(2)

10. 任勇. 胡方明. 李自学. Ren Yong. Hu Fangming. Li Zixue 基于麦克风阵列声源定位系统的FPGA实现[期刊论文]-电子科技2011,24(4)

引证文献(5条)

1. 郭威. 申利民. 谭云福. 陶凤莉 嵌入式语音识别在混响环境中的信号增强方法[期刊论文]-计算机应用研究2010(12)

2. 金光明. 谢植. 张传义. 金日炳 基于两个L型阵列的远场多声源定位方法[期刊论文]-东北大学学报:自然科学版2012(9)

3. 叶永. 陈建峰. 程萍. 冷欣 用于麦克风阵列的阵元筛选方法研究[期刊论文]-传感技术学报 2012(11)4. 刘来财. 何培宇 一种新的虚拟均匀线阵的构造方法[期刊论文]-四川大学学报(自然科学版) 2012(2)

5. 余帅. 何培宇 一种单通道语音倒谱域去混响新方法[期刊论文]-四川大学学报(自然科学版) 2012(4)

引用本文格式:李文. 夏秀渝. 何培宇. 李源. LI Wen. XIA Xiu-Yu. HE Pei-Yu. LI Yuan 基于麦克风阵列的近场声源定位[期刊论文]-四川大学学报(自然科学版) 2008(2)


相关文章

  • 基于麦克风阵列的语音增强方法
  • 基于麦克风阵列的语音增强方法 概述:在日常生活和工作中,语音通信是人与人之间互相传递信息沟通不可缺少的方式.在语音通信中,语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声.通信设备的内部噪声及其他讲话者的干扰.这些干扰共同作用,最终 ...查看


  • 语音识别的痛点在哪,从交互到精准识别如何做?
  • 语音识别是目前应用最成熟的人机交互方式,从最初大家体验过的有屏手持设备这种近场的语音识别,如Siri以及各种语音助手,到现在,语音识别的应用已经完成了向智能硬件以及机器人上延伸,不过,新的人机交互对硬件.算法要求更加苛刻,各企业正面临着巨大 ...查看


  • 基于麦克风阵列的实时声源定位
  • 第27卷第6期 2010年6月 计算机应用与软件 Co m puter App lications and So ft w are Vo l 127No . 6Jun . 2010 基于麦克风阵列的实时声源定位 刘真旭 (上海交通大学计算机 ...查看


  • 基于机器人听觉的声源定位策略
  • 基于机器人听觉的声源定位策略 吕晓玲 张明路 河北工业大学 机械工程学院, 天津300130 摘要:针对机器人听觉定位,提出了五个传声器阵列作为机器人的耳朵,其中四个传声器组成的平面阵确定声源空间位置,另外一个传声器辅助实现声源位于机器人前 ...查看


  • 基于一阶差分传声器阵列频域LMS语音增强算法
  • 堕童堡查(v2 凹@6@@可@@嗡响⑨0⑨回U 文章编号:11102-8684{2010108--0053-04 基于一阶差分传声器阵列频域 LMS语音增强算法・ 王扇珍,宋辉,刘加 (清华大学电子工程系,清华信息科学与技术国家实验室(筹) ...查看


  • 高速铁路桥梁声屏障插入损失五声源预测模式研究
  • ? 高速铁路桥梁声屏障插入损失五声源预测模式研究 高速铁路桥梁声屏障插入损失五声源预测模式研究 胡文林1,2,胡叙洪1,齐春雨1,王少林1 (1.铁道第三勘察设计院集团有限公司轨道交通勘察设计国家地方联合工程实验室,天津 300251:2. ...查看


  • 国外风洞试验的新机制_新概念_新技术
  • 第18卷 第4期 2004年12月 流体力学实验与测量 Experiments and Measurements in F luid Mechanics V ol. 18, N o. 4 Dec. ,2004 文章编号:100723124( ...查看


  • 本科毕业设计答辩讲稿
  • 1.各位老师们同学们,大家下午好,我叫xxx,来自航海学院电子信息工程xx班,我的指导老师是xxx教授.我毕业设计的题目是xxxxxx. 2.这是我的答辩提纲,主要分为四个部分,分别是简介,TDE信号模型,TDE算法和结果及分析.个部分主要 ...查看


  • 声学名词解释
  • B 波长 声波振动一次所传播的距离,用声波的速度除以声波的频率就可以计算出该频率声波的波长,声波的波长范围为17米至1.7厘米,在室内声学中,波长的计算对于声场的分析有着十分重要的意义,要充分重视波长的作用.例如只有障碍物在尺寸大于一个声波 ...查看


热门内容