基于麦克风阵列的近场声源定位

２００８年４月四川大学学报（自然科学版）

Ａｐｒ．２００８

第４５卷第２期

Ｊｏｕｒｎａｌｏｆ

ＳｉｃｈｕａｎＵｎｉｖｅｒｓｉｔｙ（ＮａｔｕｒａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ）

ｖ０１．４５Ｎｏ．２

文章编号：０４９０—６７５６（２００８）０２—０３０７．０４

基于麦克风阵列的近场声源定位

李

文，夏秀渝，何培宇，李

源

（四川大学电子信息学院，成都６１００６４）

摘要：根据近场语音信号的特点，研究使用麦克风阵列的近场声源定位技术．为了克服ＭＵＳＩＣ算法本身的局限，对阵列的输入信号进行时一频变换并抽取子带，在此基础上估计声

源的数量并对实现对语音信号的定位．最后，根据谱峰的特点，提出了一种快速谱峰搜索算法．仿真结果表明，在有混响的房间中，算法有效的提取了声源的方位．关键词：麦克风阵列；近场语音模型；声源定位中图分类号：ＴＰ２０２．７

文献标识码：Ａ

Ｓｐｅｅｃｈ

ｓｏｕｒｃｅ

ｌｏｃａｌｉｚａｔｉｏｎｉｎｎｅａｒ－ｆｉｅｌｄｂａｓｅｄ

ｏｎ

ｍｉｃｒｏｐｈｏｎｅ

ａｒｒａｙｓ

Ｌｆ

Ｗ砌，Ｘ舱Ｘ／ｕ．ｈ，ＨＥＰｅｉ．乳，Ｌｆ

Ｙｕａｎ

（Ｓｄｘ）ｏｌｏｆ

Ｅｌｅｃｔｒｏｎｉｃａｎｄ

ＩｎｆｏｒｍａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇ，ＳｉｃｈｕａｎＵｎｉｖｅｒｓｉｔｙ，Ｃｈｅｎｇｄｕ６１００６４，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ｂａｓｅｄ

ｏｎ

ｔｈｅｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｎｅａｒ－ｆｉｅｌｄｓｐｅｅｃｈｓｉｇｎａｌ．Ｔｈｉｓｐａｐｅｒｒｅｓｅａｒｃｈ鹤１０ｅａｌｉｚａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ

ｕｓｉｎｇ

ｍｉｃｒｏｐｈｏｎｅａｒｒａｙ．ＴｏｏｖｅｒｃｏｍｅｔｈｅｉｎｈｅｒｅｎｔｌｉｍｉｔａｔｉｏｎｓｏｆＭＵＳＩＣ，ｗｅｔｒａｎｓｆｏｒｍｔｈｅｉｎｐｕｔｓｉｇｎａｌｓｔｏ

ｆｒｅｑｕｅｎｃｙｄｏｍａｉｎ，ａｎｄｔｈｅｎｅｘｔｒａｃｔｓｕｂ－ｂａｎｄ．Ｏｎｔｈｉｓｂａｓｉｓ，ｗｅｅｓｔｉｍａｔｅｄｔｈｅｎｕｍｂｅｒｏｆｒｅｃｅｉｖｅｓｉｇｎａｌｓａｎｄ

ｒｅａｌｉｚｅｌｏｃａｌｉｚａｔｉｏｎｏｆｓｐｅｅｃｈｓｏｕｒｃｅ．Ａｆａｓｔｓｅａｒｃｈａｌｇｏｒｉｔｈｍｉｓｐｒｏｐｏｓｅｄｔｏｆｉｎｄｔｈｅｌｏｃａｔｉｏｎｏｆｓｐｅｅｃｈｓｏｕｒｃｅ．Ｔｈｅｓｉｍｕｌａｔｉｏｎｓｒｅｓ。ｕｌｔｓｓｈｏｗｔｈａｔｉｎａ

ｒｅｖｅｒｂｅｒａｔｉｏｎｒｏｏｍ，ｔｈｅ

ａｌｇｏｒｉｔｈｍｅｆｆｅｃｔｉｖｅｌｙｆｉｎｄｓｔｈｅｐｏｓｉｔｉｏｎｏｆｔｈｅ

ｓｐｅｅｃｈ

ｓｏｕｒｃｅ．

Ｋｅｙｗｏｒｄｓ：ｍｉｃｒｏｐｈｏｎｅａｒｒａｙ，ｎｅａｒ－ｆｉｅｌｄｓｐｅｅｃｈｍｏｄｅｌ，ｓｐｅｅｃｈＳｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎ

ｊ

１

引言

语音信号频率集中于３００～３４００Ｉ－－Ｉｚ，是未经调制的基带信号．很多针对窄带信号提出的传统算法要麦克风阵列的声源定位是指用麦克风拾取声使用在麦克风阵列，则必须对阵列的输出信号进行音信号，通过对麦克风阵列的各路输出信号进行分预处理，如滤波，抽取子带等，以满足算法的窄带信析和处理，得到一个或者多个声源的位置信息．如号前提．

果声源能够持续地输出声音，通过对麦克风阵列接

２）传统的阵列信号多采用远场，平面波模型，

收到的信号进行实时分析和处理，则可以实现对移

而麦克风阵列多位于近场，需要使用球面波模型．动声源的定位和跟踪．

另外，在需要估计声源与阵列的距离时，还应该考与传统的阵列信号处理相比，麦克风阵列的信

虑信号在传播过程中发生的幅度衰减．

号处理有以下的不同：

３）传统的阵列信号处理中，噪声和信源通常是

，１）传统的阵列处理信号，如雷达信号，是经过不相干的．而麦克风阵列多位于室内等较封闭的环高频信号调制了的窄带信号，而麦克风阵列处理的

境中，除了环境噪声和其他声源的影响外，声源本

收稿日期：２００７－０１—１８

基金项目：国家自然科学基金项目（６０４７２０９６）

作者简介：李文（１９８３一），男，２００５级硕士研究生．Ｅ－ｍａｉｌ：ｅｄ．１ｅｅ＠１６３．嗍

万　

方数据

四川大学学报（自然科学版）

身在室内的混响也会对准确定位造成影响．

本文研究将ＭＵＳＩＣ方法用于近场声源定位

第４５卷

阵列中心为原点，第ｉ个麦克风的横坐标为ｄｉ．我

们把阵列中心作为参考点，设它接收到的声源歹的信号为Ｓ（￡），则第ｉ个阵元接收到的信号的相对幅

度为：

所需的处理和改进．针对谱峰的特点，提出了一种快速谱峰搜索算法，搜索结果表明，算法有效的估

计出了声源的位置．

２信号模型

一般认为，当声源与阵列的距离ｒ≤２Ｌ２／２

量巧２万磊孬丢云亏萧，

ｉ＝１，２，…，Ｍ；

各个阵元接收到的信号的相对时延：

（２）

时，处于近场范围［１ｌ，其中，Ｌ为阵列的孔径，Ａ为

＾．

声波的波长．这时我们应该用球面波模型代替平面

凸ｆｉｊ一——。ｃ

ｉ＝１，２，…，Ｍ；

Ｄ

√（ｒｓｉｎａ）２＋（ｄｆ—ｒｃｏｓｌ２）２一，．

模型来描述声波的传播．除了考虑各个麦克风之间由于与声源的距离不同造成的接收到的信号的相

位差异以外，还应该考虑声波在空气中传播造成的

其中，ｃ为声音的传播速度．（１）式中的噪声部分：

ｔ

一’

（３）

幅度衰减．若毛（￡）为声源信号，则麦克风阵列各个阵元的输出信号可以写成【１，２Ｊ：

卫

ｙｉ（ｔ）＝∑∑６鹕（￡一Ａｔｍｉｊ＂）＋＆（￡），

ｉ＝１，２，…，Ｍ；

（４）

第一部分为各个声源的各路回波的总和，Ｍ

（１）

ｚｉ（ｔ）＝∑ｋｏｓｉ（ｔ一△‘巧）－Ｉ－Ｙｉ（ｔ），

ｊ＝１

ｉ＝１，２，…，Ｍ；歹＝１，２，…，Ｄ

为不同方向的回波的总数，ｂ。ｉｆ和△￡名ｊ为第歹个声源的第优路回波对于第ｉ个麦克风的幅度衰减

因子以及相对时延．毋（￡）为加性白噪声．

其中下标ｉ指该量属于第ｉ路麦克风，Ｊ指第歹个声

源，麦克风数量为Ｍ，声源数量Ｄ．ｋ甜和△‘ｄ是阵

元ｉ接收到的声源歹的信号的幅度衰减因子以及相对时延，Ｙｉ（￡）则是各种噪声的总和．

３算法描述

ＭＵＳＩＣ方法［３ｔ４］是针对窄带信号处理提出

的，而语音信号是一个复杂的基带非平稳信号．为

了满足窄带前提，我们对阵列输入信号进行时．频处理并抽取子带，在此基础上估计声源的数量并实现声源定位．

首先，对麦克风阵列的输出信号，在时域进行

采样，抽取若干个点后进行Ｎ点离散傅立叶变换

（Ｄｉｓｃｒｅｔｅ

ＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍａｔｉｏｎ）：

ｒｘ，（叫ｏ）

Ｘｌ（ＣＯｌＸ２（Ｃ０１

…ＸＩ（ｃｏＮ一…Ｘ２（ＣＯＮ一

（４）

ｘ：ｌｘ２（砧

…

图１

Ｆｉｇ．１

麦克风阵列的近场球面渡模型

Ｎｅａｒ

Ｌ‰（∞ｏ）‰（叫１

…ｘＭ（∞Ｎ一

ｆｉｅｌｄｍｏｄｅｌｏｆｍｉｃｒｏｐｈｏｎｅａｒｒａｙ

Ｘ每行为某个阵元接收到的信号抽取若干个点后

的的离散傅立叶变换（Ｄ阿），每列为各阵元信号

对于如图１所示的均匀直线阵列，相邻阵元间的距离为Ａｄ，声源距离阵列中心的距离为ｒ，以

离散傅立叶变化后在同一频点处的值．

根据（１），

Ｄ

Ｘｉ（ＣＯ。）＝∑ｋｏｅｘｐ（－歹叫。Ａｔ巧）Ｓ（叫。）＋Ｙ，（ＣＯ。），恕＝１，２，…，Ｎ；

则对于（４）中的某个频点∞。有：

（５）

ｘ（∞。）＝［Ｘｌ（鲫。）ｘ２（‰）…ＸＭ（ＣＯ。）］１’＝

万方数据　

第２期李文等：基于麦克风阵列的近场声源定位

加ｅ一心血“眈ｅ－．／％Ａｔ２＿Ｉ

ｋ１２ｅ－＇％‘血１２

ｋｌＤｅ－知ｎ△￡１。ｋ２Ｄｅ～如。血２Ｄ

Ｓｌ（甜。）Ｓ２（叫。）

＋

ｙｌ（∞。）ｙ２（Ⅲ。）

忌２２ｅ一知ｐ笠

肺ｅ－心ａｔＭｔ．惫胞ｅ－以６ｔｍ２

愚加ｅ’ｉｒａｎＡｔＭＤ

ＳＤ（００。）ｙＭ（∞。）

ＡＳ（∞。）＋ｙ（叫。），咒＝１，２…Ｎ

若各噪声信号均值为零，互不相关且与信号

Ｕｄｉａｇ［；ｔｌ，Ａ２，…ＡＭ］ＵＨ，其中Ａｌ，Ａ２，…ＡＭ为尺的

以下根据基于信息论的准则的ｄｅｓｃｒｉｐｔｉｏｎ

ｌｅｎｇｔｈ）法则【５，６】，利用

ＭＤＬ（ｔ）：Ｎ（Ｍ—ｚ）ｌｏｇｌ掣ｌ＋

ｆ

１

§、］

【（ⅡＡ；）南Ｊ

‘＝ｆ十Ｉ

去ｚ（２Ｍ—１）ｌｏｇＮ（７）

估计出Ｄ后，根据ＭＵＳＩＣ方法，将ｕ分解为

Ｐ（口，ｒ）＝

１

口ＨＵ★｜Ｉ

２

（８）

＝

［ｋｌ（口，ｒ）ｅ巾¨尬‘ｌ¨’，’，…，忌Ｍ（口，

ｒ）ｅ－Ｊ，ｏ（ｎ’ａｔ小“¨］Ｔ．ｋｉ（口，ｒ）和Ａｔｆ（口，ｒ）为第ｉ路（３）．则使得Ｐ（口，，．）最大的（ａ，ｒ）即为声源所对

要判断出声源的方位，我们还应该搜索出谱峰

万　

方数据（６）

＿＿＿＿＿＿＿＿－＿＿＿＿＿——

＿＿＿——＿＿＿

下：

①当Ｄ＝１时，在谱峰搜索结果中抽取ｒ＝Ｏ．５，１．０，１．５所对应的向量并相加，在其结果中搜索出若干极大值．则极大值中最大值对应的角度为

口．

②在ａ一５’～ａ＋５’的范围内，搜索Ｐ（口，ｒ）极大值，则极大值中的最大值对应的（口，ｒ）即是对谱峰的估计值．

③若Ｄ≠１，则需Ｄ一１次重复上述过程．只是在①中，ａ应相应的取次大值，第三大值等．

４仿真实验

实验数据在ｍａｔｌａｂ环境下的一个虚拟声学实验室中产生，首先计算房间的冲激响应，然后据此来模拟各个麦克风接收到的信号．虚拟房间宽，长，高为（４，５，３），单位：ｍ．麦克风阵以及声源均位于高为１．５的平面，八个麦克风排列成均匀直线阵列，间距０．１ｍ．其中第ｉ个麦克风在平面中的位置为：（１．８－ｉ，２，１．５），ｉ＝１，２，…８；房间混响时间

１６０

ＩＴｌＳ，声音

传播速度３４５ｍ／ｓ，房间各个面的反射系数如

表一所示．声源采样频率８ＫＨｚ，量化精度１６

ｂｉｔ．

输入数据每帧２００点，添０补齐２５６点后进行

ＤＦＴ，噪声信号为高斯白噪声，信噪比约２０ｄｂ，谱峰搜索时选取１４个频率点分别计算后平均，角度的搜索步长为１。，距离步长为０．０５ｍ．

表１虚拟房间各个面的反射系数

Ｔａｂ．１

Ｒｅｆｌｅｃｔｉｏｎｃｏｅｆｆｉｃｉｅｎｔｏｆｔｈｅｖｉｒｔｕａｌｒｏｏｍ

反射面Ｘ＝ＯＸ＝４ｙ＝０ｙ＝５Ｚ＝０Ｚ＝３反射系数０．７

０．７

０．５

０．８

单个信源的仿真：

声源为一段男声的中文，位置矢量为（１．７，２．

３５，１．５），相对于麦克风阵列的中心其方位坐标为

（口，ｒ）＝（４５。，０．４９５ｍ）．仿真结果如图２．

不相关，则Ｘ（∞。）的自相关矩阵为Ｒ＝

Ｅ｛ｘ（埘。）Ｘ（∞。）Ｈ｝＝脚Ｈ＋巧２Ｊ，其中，Ｐ＝

Ｅ｛Ｓ（ｃｃ，。）Ｓ（Ｏ．９。）Ｈ｝，ｄ２为该频点处的噪声功率，Ｊ

为单位矩阵．可对其进行特征值分解：Ｒ＝

特征值且Ｊ：Ｉｌ＞Ａ２＞…＞ＡＭ．Ｕ的第ｉ列为与Ａｉ对应的Ｒ特征向量．

ＭＤＬ（ｍｉｎｉｍｕｍ

Ｒ的特征值分解的结果，估计声源数目Ｄ：

其中ｌ＝０，１，¨，Ｍ一１．声源数的估计值为使得

ＭＤＬ（１）最小的ｚ的值．因为语音信号的复杂性，所以这里取若干个频点分别估计出声源数后取统计平均，作为声源Ｄ的估计值．

信号空间魄和噪声空间ＵＮｔｌ｜，则空间谱

其中，口

信号的相对幅度和相对时延，表达式参见（２）和应的位置．由于语音是一个复杂的非平稳信号，不

能保证始终包含某个频点，所以选取若干个频点，

分别求取空间谱然后平均．

所对应的口和ｒ值．由于在一个面内搜索量很大，

根据实验发现，谱峰存在于某个“脊”之中，为了减少搜索量，我们可以先找出“脊”的位置，然后在在这个位置为中心的某个范围内搜索谱峰，过程如

３１０

四川大学学报（自然科学版）

第４５卷

图２单个信源的ＤＯＡ估计

Ｆｉｇ．２

ＤＯＡ

ｅｓｔｉｍａｔｅｏｆｓｉｎｇｌｅ

ＳＯＵｒＣｅ

对声源位置的搜索结果为：

表２单信源谱峰搜索结果

Ｔａｂ．２

Ｓｅａｒｃｈｒｅｓｕｌｔｏｆｔｈｅｓｉｎｇｌｅ

Ｓｉ州ｇ）１．ｗｃｅ

多个信源的仿真：

声源１位置矢量为（１．７，２．３５，１．５），相对方位坐标（口ｌ，ｒ１）＝（４５。，０．４９５ｍ）．

声源２位置矢量：（１，２．６０，１．５）．相对方位坐标（口２，，．２）＝（１２０＂，０．７ｍ），仿真结果如图３：

图３两个信源的ＤＯＡ估计

Ｆｉｇ．３

ＤＯＡｅｓｔｉｍａｔｅｏｆｄｏｕｂｌｅ

ｓｏｕｒｃｅｓ

对声源位置的搜索结果为：

万　

方数据表３双信源谱峰搜索结果

丁备６．３

ＳｅａｒｃｈｒｅｓｕｌｔｏｆｄｏｕｂｌｅＳＯＵｒＣｅｓ

根据仿真结果，在一个和多个信源的情况下，算法都能较好的估计出声源的位置．

４结语

介绍了语音信号的近场模型，给出了使用麦克

风阵列对其定位的ＭＵＳＩＣ算法，并给出了一种搜

索声源位置的方法．仿真结果表明，算法较好的实

现了在对一个和多个声源的定位．对角度和距离都得到了比较准确的估计．定位范围：０．２～１．５ｍ，定位精度：角度定位精度±１０。，距离定位精度±０．

０５

ＩＴＩ．但是随着距离的增加，近场模型失效，或者

房间反射系数增大，混响时间变长等对声源位置的

估计的准确性都会造成一定的影响．

参考文献－

［１］

ＭｉｎｇＪ，ＡｌｅｘＣＫ，ＭｅｎｇＨＥ．Ｄｏａｅｓｔｉｍａｔｉｏｎｏｆ

ｓｐｅｅｃｈ

ｓｏｌＪ／＇ｃｅ

ｗｉｔｈ

ｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓ［Ｊ］．Ｃｉｒｃｕｉｔｓａｎｄ

Ｓｙｓｔｅｍｓ，１９９８，９８：２９３．

［２］ＪｕＴ

Ｌ，ＸｕＹＬ，ＰｅｎｇＱ

Ｃ．Ｓｐｅｅｃｈ

８０ｕｒｃｅ

ｋ）ｃａｌｉｚａｔｉｏｎ

ｉｎ

Ｎｅａ．ｒ

ｆｉｅｌｄ［Ｊ］．ＩＣ（℃ＡＳ［Ｃ］，ＩＩＥ朗℃［Ｃ］．Ｃｈｅｎｇｄｕ：

２００４，７６９．

［３３肖先赐．现代谱估计：原理与应用［Ｍ］．哈尔滨：哈

尔滨工业大学出版社，１９９１．

［４］Ｆｕｔｏｓｈｉ，ＡＨｉｄｅｋｉ，ＴｏｓｈｉｈｉｒｏＭ．Ｓｏｕｎｄ

ＳＯＵｌ＇Ｏｅ

ｌｏｃａｌｉｚａ．

ｔｉｏｎ

ａｎｄ

ｓｅｐａｒａｔｉｏｎｉｎ

ｒｌｌ篷ｉｔｒ

ｆｌｅｌｄ［Ｊ］．ＩＥＩＣＥＴｒａｍＦｕｎ．

ｄａｌＴｌｄ＇ｌｔａｌｓ，２０００，Ｅ８３．Ａ（１１）：２２８６．

［５］刘德树．空间谱估计及其应用［Ｍ］．合肥：中国科学

冀术大学出版社，１９９７．

［６］ＮｅｚａｆａｔＭ，ＫａｖｅｈＭ，ＸｕＷ．ＥｓｔｉｍａｔｉｏｎｏｆｔｈｅＮＵ．ｒＢ．

ｂｅｒｏｆｓｏｔｌｒｃｅｓｂａｓｅｄ

０１１

ｔｈｅｅｉｇｅｎｖｅｃｔｏｒｓｏｆｔｈｅｃｏｖａｒｉ—

ａｌｉｃｅ

ｍａｔｒｉｘ［Ｃ］．ＵＳＡ：Ｄｅｐｔｏｆ

ＥｌｅｃｔｒＥｎｇＭｉｎｎｅｓｏｔａ

Ｕｎｉｖ，２００４：４６５．

［责任编辑：李富河］

基于麦克风阵列的近场声源定位

作者：作者单位：刊名：英文刊名：年，卷(期)：被引用次数：

李文，夏秀渝，何培宇，李源， LI Wen， XIA Xiu-Yu， HE Pei-Yu， LI Yuan四川大学电子信息学院,成都,610064

四川大学学报（自然科学版）

JOURNAL OF SICHUAN UNIVERSITY(NATURAL SCIENCE EDITION)2008,45(2)5次

参考文献(6条)

1. Ming J;Alex C K;Meng H E Doa estimation of speech source with microphone arrays 19982. Ju T L;Xu Y L;Peng Q C Speech source localization in near field[会议论文] 20043. 肖先赐现代谱估计:原理与应用 1991

4. Futoshi;AHideki;Toshihiro M Sound source localiza-tion and separation in near field 2000(11)5. 刘德树空间谱估计及其应用 1997

6. Nezafat M;Kaveh M;Xu W Estimation of the num-ber of sources based on the eigenvectors of thecovari-anee matrix 2004

本文读者也读过(10条)

1. 刘真旭. Liu Zhenxu 基于麦克风阵列的实时声源定位[期刊论文]-计算机应用与软件2010,27(6)

2. 邵怀宗. 林静然. 彭启琮. 居太亮. 徐异凌基于麦克风阵列的声源定位研究[期刊论文]-云南民族大学学报(自然科学版)2004,13(4)

3. 王大中. 李晓妮. WANG Da-zhong. LI Xiao-ni 基于麦克风阵列的语音信号实时时延估计[期刊论文]-吉林大学学报（信息科学版）2009,27(2)

4. 于豪光. 王洪源基于麦克风阵列的声源时延估计算法的研究[期刊论文]-科技创新导报2008(32)

5. 胡郢. 刁帅. Hu Ying. Diao Shuai 基于T型麦克风阵列的近场三维声源定位[期刊论文]-武汉船舶职业技术学院学报2009,8(6)

6. 基于麦克风阵列声音信号定位方法的研究[期刊论文]-传感技术学报2010,23(5)

7. 王军. 种兰祥. WANG Jun. ZHONG Lan-xiang 麦克风阵列声源定位与跟踪性能改进[期刊论文]-计算机工程与应用2008,44(19)

8. 邓艳容. 景新幸. 任华娟. DENG Yan Rong. JING Xin Xing. REN Hua Juan 基于麦克风阵列的声源定位研究[期刊论文]-电子技术应用2010,36(2)

9. 杨祥清. 汪增福. YANG Xiang-qing. WANG Zeng-fu 基于麦克风阵列的三维声源定位算法及其实现[期刊论文]-声学技术2008,27(2)

10. 任勇. 胡方明. 李自学. Ren Yong. Hu Fangming. Li Zixue 基于麦克风阵列声源定位系统的FPGA实现[期刊论文]-电子科技2011,24(4)

引证文献(5条)

1. 郭威. 申利民. 谭云福. 陶凤莉嵌入式语音识别在混响环境中的信号增强方法[期刊论文]-计算机应用研究2010(12)

2. 金光明. 谢植. 张传义. 金日炳基于两个L型阵列的远场多声源定位方法[期刊论文]-东北大学学报：自然科学版2012(9)

3. 叶永. 陈建峰. 程萍. 冷欣用于麦克风阵列的阵元筛选方法研究[期刊论文]-传感技术学报 2012(11)4. 刘来财. 何培宇一种新的虚拟均匀线阵的构造方法[期刊论文]-四川大学学报（自然科学版） 2012(2)

5. 余帅. 何培宇一种单通道语音倒谱域去混响新方法[期刊论文]-四川大学学报（自然科学版） 2012(4)

引用本文格式：李文. 夏秀渝. 何培宇. 李源. LI Wen. XIA Xiu-Yu. HE Pei-Yu. LI Yuan 基于麦克风阵列的近场声源定位[期刊论文]-四川大学学报（自然科学版） 2008(2)

２００８年４月四川大学学报（自然科学版）

Ａｐｒ．２００８

第４５卷第２期

Ｊｏｕｒｎａｌｏｆ

ＳｉｃｈｕａｎＵｎｉｖｅｒｓｉｔｙ（ＮａｔｕｒａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ）

ｖ０１．４５Ｎｏ．２

文章编号：０４９０—６７５６（２００８）０２—０３０７．０４

基于麦克风阵列的近场声源定位

李

文，夏秀渝，何培宇，李

源

（四川大学电子信息学院，成都６１００６４）

文献标识码：Ａ

Ｓｐｅｅｃｈ

ｓｏｕｒｃｅ

ｌｏｃａｌｉｚａｔｉｏｎｉｎｎｅａｒ－ｆｉｅｌｄｂａｓｅｄ

ｏｎ

ｍｉｃｒｏｐｈｏｎｅ

ａｒｒａｙｓ

Ｌｆ

Ｗ砌，Ｘ舱Ｘ／ｕ．ｈ，ＨＥＰｅｉ．乳，Ｌｆ

Ｙｕａｎ

（Ｓｄｘ）ｏｌｏｆ

Ｅｌｅｃｔｒｏｎｉｃａｎｄ

ＩｎｆｏｒｍａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇ，ＳｉｃｈｕａｎＵｎｉｖｅｒｓｉｔｙ，Ｃｈｅｎｇｄｕ６１００６４，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ｂａｓｅｄ

ｏｎ

ｕｓｉｎｇ

ｒｅｖｅｒｂｅｒａｔｉｏｎｒｏｏｍ，ｔｈｅ

ａｌｇｏｒｉｔｈｍｅｆｆｅｃｔｉｖｅｌｙｆｉｎｄｓｔｈｅｐｏｓｉｔｉｏｎｏｆｔｈｅ

ｓｐｅｅｃｈ

ｓｏｕｒｃｅ．

ｊ

１

引言

果声源能够持续地输出声音，通过对麦克风阵列接

２）传统的阵列信号多采用远场，平面波模型，

收到的信号进行实时分析和处理，则可以实现对移

而麦克风阵列多位于近场，需要使用球面波模型．动声源的定位和跟踪．

另外，在需要估计声源与阵列的距离时，还应该考与传统的阵列信号处理相比，麦克风阵列的信

虑信号在传播过程中发生的幅度衰减．

号处理有以下的不同：

３）传统的阵列信号处理中，噪声和信源通常是

，１）传统的阵列处理信号，如雷达信号，是经过不相干的．而麦克风阵列多位于室内等较封闭的环高频信号调制了的窄带信号，而麦克风阵列处理的

境中，除了环境噪声和其他声源的影响外，声源本

收稿日期：２００７－０１—１８

基金项目：国家自然科学基金项目（６０４７２０９６）

作者简介：李文（１９８３一），男，２００５级硕士研究生．Ｅ－ｍａｉｌ：ｅｄ．１ｅｅ＠１６３．嗍

万　

方数据

四川大学学报（自然科学版）

身在室内的混响也会对准确定位造成影响．

本文研究将ＭＵＳＩＣ方法用于近场声源定位

第４５卷

阵列中心为原点，第ｉ个麦克风的横坐标为ｄｉ．我

们把阵列中心作为参考点，设它接收到的声源歹的信号为Ｓ（￡），则第ｉ个阵元接收到的信号的相对幅

度为：

所需的处理和改进．针对谱峰的特点，提出了一种快速谱峰搜索算法，搜索结果表明，算法有效的估

计出了声源的位置．

２信号模型

一般认为，当声源与阵列的距离ｒ≤２Ｌ２／２

量巧２万磊孬丢云亏萧，

ｉ＝１，２，…，Ｍ；

各个阵元接收到的信号的相对时延：

（２）

时，处于近场范围［１ｌ，其中，Ｌ为阵列的孔径，Ａ为

＾．

声波的波长．这时我们应该用球面波模型代替平面

凸ｆｉｊ一——。ｃ

ｉ＝１，２，…，Ｍ；

Ｄ

√（ｒｓｉｎａ）２＋（ｄｆ—ｒｃｏｓｌ２）２一，．

模型来描述声波的传播．除了考虑各个麦克风之间由于与声源的距离不同造成的接收到的信号的相

位差异以外，还应该考虑声波在空气中传播造成的

其中，ｃ为声音的传播速度．（１）式中的噪声部分：

ｔ

一’

（３）

幅度衰减．若毛（￡）为声源信号，则麦克风阵列各个阵元的输出信号可以写成【１，２Ｊ：

卫

ｙｉ（ｔ）＝∑∑６鹕（￡一Ａｔｍｉｊ＂）＋＆（￡），

ｉ＝１，２，…，Ｍ；

（４）

第一部分为各个声源的各路回波的总和，Ｍ

（１）

ｚｉ（ｔ）＝∑ｋｏｓｉ（ｔ一△‘巧）－Ｉ－Ｙｉ（ｔ），

ｊ＝１

ｉ＝１，２，…，Ｍ；歹＝１，２，…，Ｄ

为不同方向的回波的总数，ｂ。ｉｆ和△￡名ｊ为第歹个声源的第优路回波对于第ｉ个麦克风的幅度衰减

因子以及相对时延．毋（￡）为加性白噪声．

其中下标ｉ指该量属于第ｉ路麦克风，Ｊ指第歹个声

源，麦克风数量为Ｍ，声源数量Ｄ．ｋ甜和△‘ｄ是阵

元ｉ接收到的声源歹的信号的幅度衰减因子以及相对时延，Ｙｉ（￡）则是各种噪声的总和．

３算法描述

ＭＵＳＩＣ方法［３ｔ４］是针对窄带信号处理提出

的，而语音信号是一个复杂的基带非平稳信号．为

了满足窄带前提，我们对阵列输入信号进行时．频处理并抽取子带，在此基础上估计声源的数量并实现声源定位．

首先，对麦克风阵列的输出信号，在时域进行

采样，抽取若干个点后进行Ｎ点离散傅立叶变换

（Ｄｉｓｃｒｅｔｅ

ＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍａｔｉｏｎ）：

ｒｘ，（叫ｏ）

Ｘｌ（ＣＯｌＸ２（Ｃ０１

…ＸＩ（ｃｏＮ一…Ｘ２（ＣＯＮ一

（４）

ｘ：ｌｘ２（砧

…

图１

Ｆｉｇ．１

麦克风阵列的近场球面渡模型

Ｎｅａｒ

Ｌ‰（∞ｏ）‰（叫１

…ｘＭ（∞Ｎ一

ｆｉｅｌｄｍｏｄｅｌｏｆｍｉｃｒｏｐｈｏｎｅａｒｒａｙ

Ｘ每行为某个阵元接收到的信号抽取若干个点后

的的离散傅立叶变换（Ｄ阿），每列为各阵元信号

对于如图１所示的均匀直线阵列，相邻阵元间的距离为Ａｄ，声源距离阵列中心的距离为ｒ，以

离散傅立叶变化后在同一频点处的值．

根据（１），

Ｄ

Ｘｉ（ＣＯ。）＝∑ｋｏｅｘｐ（－歹叫。Ａｔ巧）Ｓ（叫。）＋Ｙ，（ＣＯ。），恕＝１，２，…，Ｎ；

则对于（４）中的某个频点∞。有：

（５）

ｘ（∞。）＝［Ｘｌ（鲫。）ｘ２（‰）…ＸＭ（ＣＯ。）］１’＝

万方数据　

第２期李文等：基于麦克风阵列的近场声源定位

加ｅ一心血“眈ｅ－．／％Ａｔ２＿Ｉ

ｋ１２ｅ－＇％‘血１２

ｋｌＤｅ－知ｎ△￡１。ｋ２Ｄｅ～如。血２Ｄ

Ｓｌ（甜。）Ｓ２（叫。）

＋

ｙｌ（∞。）ｙ２（Ⅲ。）

忌２２ｅ一知ｐ笠

肺ｅ－心ａｔＭｔ．惫胞ｅ－以６ｔｍ２

愚加ｅ’ｉｒａｎＡｔＭＤ

ＳＤ（００。）ｙＭ（∞。）

ＡＳ（∞。）＋ｙ（叫。），咒＝１，２…Ｎ

若各噪声信号均值为零，互不相关且与信号

Ｕｄｉａｇ［；ｔｌ，Ａ２，…ＡＭ］ＵＨ，其中Ａｌ，Ａ２，…ＡＭ为尺的

以下根据基于信息论的准则的ｄｅｓｃｒｉｐｔｉｏｎ

ｌｅｎｇｔｈ）法则【５，６】，利用

ＭＤＬ（ｔ）：Ｎ（Ｍ—ｚ）ｌｏｇｌ掣ｌ＋

ｆ

１

§、］

【（ⅡＡ；）南Ｊ

‘＝ｆ十Ｉ

去ｚ（２Ｍ—１）ｌｏｇＮ（７）

估计出Ｄ后，根据ＭＵＳＩＣ方法，将ｕ分解为

Ｐ（口，ｒ）＝

１

口ＨＵ★｜Ｉ

２

（８）

＝

［ｋｌ（口，ｒ）ｅ巾¨尬‘ｌ¨’，’，…，忌Ｍ（口，

ｒ）ｅ－Ｊ，ｏ（ｎ’ａｔ小“¨］Ｔ．ｋｉ（口，ｒ）和Ａｔｆ（口，ｒ）为第ｉ路（３）．则使得Ｐ（口，，．）最大的（ａ，ｒ）即为声源所对

要判断出声源的方位，我们还应该搜索出谱峰

万　

方数据（６）

＿＿＿＿＿＿＿＿－＿＿＿＿＿——

＿＿＿——＿＿＿

下：

口．

②在ａ一５’～ａ＋５’的范围内，搜索Ｐ（口，ｒ）极大值，则极大值中的最大值对应的（口，ｒ）即是对谱峰的估计值．

③若Ｄ≠１，则需Ｄ一１次重复上述过程．只是在①中，ａ应相应的取次大值，第三大值等．

４仿真实验

１６０

ＩＴｌＳ，声音

传播速度３４５ｍ／ｓ，房间各个面的反射系数如

表一所示．声源采样频率８ＫＨｚ，量化精度１６

ｂｉｔ．

输入数据每帧２００点，添０补齐２５６点后进行

表１虚拟房间各个面的反射系数

Ｔａｂ．１

Ｒｅｆｌｅｃｔｉｏｎｃｏｅｆｆｉｃｉｅｎｔｏｆｔｈｅｖｉｒｔｕａｌｒｏｏｍ

反射面Ｘ＝ＯＸ＝４ｙ＝０ｙ＝５Ｚ＝０Ｚ＝３反射系数０．７

０．７

０．５

０．８

单个信源的仿真：

声源为一段男声的中文，位置矢量为（１．７，２．

３５，１．５），相对于麦克风阵列的中心其方位坐标为

（口，ｒ）＝（４５。，０．４９５ｍ）．仿真结果如图２．

不相关，则Ｘ（∞。）的自相关矩阵为Ｒ＝

Ｅ｛ｘ（埘。）Ｘ（∞。）Ｈ｝＝脚Ｈ＋巧２Ｊ，其中，Ｐ＝

Ｅ｛Ｓ（ｃｃ，。）Ｓ（Ｏ．９。）Ｈ｝，ｄ２为该频点处的噪声功率，Ｊ

为单位矩阵．可对其进行特征值分解：Ｒ＝

特征值且Ｊ：Ｉｌ＞Ａ２＞…＞ＡＭ．Ｕ的第ｉ列为与Ａｉ对应的Ｒ特征向量．

ＭＤＬ（ｍｉｎｉｍｕｍ

Ｒ的特征值分解的结果，估计声源数目Ｄ：

其中ｌ＝０，１，¨，Ｍ一１．声源数的估计值为使得

ＭＤＬ（１）最小的ｚ的值．因为语音信号的复杂性，所以这里取若干个频点分别估计出声源数后取统计平均，作为声源Ｄ的估计值．

信号空间魄和噪声空间ＵＮｔｌ｜，则空间谱

其中，口

信号的相对幅度和相对时延，表达式参见（２）和应的位置．由于语音是一个复杂的非平稳信号，不

能保证始终包含某个频点，所以选取若干个频点，

分别求取空间谱然后平均．

所对应的口和ｒ值．由于在一个面内搜索量很大，

３１０

四川大学学报（自然科学版）

第４５卷

图２单个信源的ＤＯＡ估计

Ｆｉｇ．２

ＤＯＡ

ｅｓｔｉｍａｔｅｏｆｓｉｎｇｌｅ

ＳＯＵｒＣｅ

对声源位置的搜索结果为：

表２单信源谱峰搜索结果

Ｔａｂ．２

Ｓｅａｒｃｈｒｅｓｕｌｔｏｆｔｈｅｓｉｎｇｌｅ

Ｓｉ州ｇ）１．ｗｃｅ

多个信源的仿真：

声源１位置矢量为（１．７，２．３５，１．５），相对方位坐标（口ｌ，ｒ１）＝（４５。，０．４９５ｍ）．

声源２位置矢量：（１，２．６０，１．５）．相对方位坐标（口２，，．２）＝（１２０＂，０．７ｍ），仿真结果如图３：

图３两个信源的ＤＯＡ估计

Ｆｉｇ．３

ＤＯＡｅｓｔｉｍａｔｅｏｆｄｏｕｂｌｅ

ｓｏｕｒｃｅｓ

对声源位置的搜索结果为：

万　

方数据表３双信源谱峰搜索结果

丁备６．３

ＳｅａｒｃｈｒｅｓｕｌｔｏｆｄｏｕｂｌｅＳＯＵｒＣｅｓ

根据仿真结果，在一个和多个信源的情况下，算法都能较好的估计出声源的位置．

４结语

介绍了语音信号的近场模型，给出了使用麦克

风阵列对其定位的ＭＵＳＩＣ算法，并给出了一种搜

索声源位置的方法．仿真结果表明，算法较好的实

０５

ＩＴＩ．但是随着距离的增加，近场模型失效，或者

房间反射系数增大，混响时间变长等对声源位置的

估计的准确性都会造成一定的影响．

参考文献－

［１］

ＭｉｎｇＪ，ＡｌｅｘＣＫ，ＭｅｎｇＨＥ．Ｄｏａｅｓｔｉｍａｔｉｏｎｏｆ

ｓｐｅｅｃｈ

ｓｏｌＪ／＇ｃｅ

ｗｉｔｈ

ｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓ［Ｊ］．Ｃｉｒｃｕｉｔｓａｎｄ

Ｓｙｓｔｅｍｓ，１９９８，９８：２９３．

［２］ＪｕＴ

Ｌ，ＸｕＹＬ，ＰｅｎｇＱ

Ｃ．Ｓｐｅｅｃｈ

８０ｕｒｃｅ

ｋ）ｃａｌｉｚａｔｉｏｎ

ｉｎ

Ｎｅａ．ｒ

ｆｉｅｌｄ［Ｊ］．ＩＣ（℃ＡＳ［Ｃ］，ＩＩＥ朗℃［Ｃ］．Ｃｈｅｎｇｄｕ：

２００４，７６９．

［３３肖先赐．现代谱估计：原理与应用［Ｍ］．哈尔滨：哈

尔滨工业大学出版社，１９９１．

［４］Ｆｕｔｏｓｈｉ，ＡＨｉｄｅｋｉ，ＴｏｓｈｉｈｉｒｏＭ．Ｓｏｕｎｄ

ＳＯＵｌ＇Ｏｅ

ｌｏｃａｌｉｚａ．

ｔｉｏｎ

ａｎｄ

ｓｅｐａｒａｔｉｏｎｉｎ

ｒｌｌ篷ｉｔｒ

ｆｌｅｌｄ［Ｊ］．ＩＥＩＣＥＴｒａｍＦｕｎ．

ｄａｌＴｌｄ＇ｌｔａｌｓ，２０００，Ｅ８３．Ａ（１１）：２２８６．

［５］刘德树．空间谱估计及其应用［Ｍ］．合肥：中国科学

冀术大学出版社，１９９７．

［６］ＮｅｚａｆａｔＭ，ＫａｖｅｈＭ，ＸｕＷ．ＥｓｔｉｍａｔｉｏｎｏｆｔｈｅＮＵ．ｒＢ．

ｂｅｒｏｆｓｏｔｌｒｃｅｓｂａｓｅｄ

０１１

ｔｈｅｅｉｇｅｎｖｅｃｔｏｒｓｏｆｔｈｅｃｏｖａｒｉ—

ａｌｉｃｅ

ｍａｔｒｉｘ［Ｃ］．ＵＳＡ：Ｄｅｐｔｏｆ

ＥｌｅｃｔｒＥｎｇＭｉｎｎｅｓｏｔａ

Ｕｎｉｖ，２００４：４６５．

［责任编辑：李富河］

基于麦克风阵列的近场声源定位

作者：作者单位：刊名：英文刊名：年，卷(期)：被引用次数：

李文，夏秀渝，何培宇，李源， LI Wen， XIA Xiu-Yu， HE Pei-Yu， LI Yuan四川大学电子信息学院,成都,610064

四川大学学报（自然科学版）

JOURNAL OF SICHUAN UNIVERSITY(NATURAL SCIENCE EDITION)2008,45(2)5次

参考文献(6条)

4. Futoshi;AHideki;Toshihiro M Sound source localiza-tion and separation in near field 2000(11)5. 刘德树空间谱估计及其应用 1997

6. Nezafat M;Kaveh M;Xu W Estimation of the num-ber of sources based on the eigenvectors of thecovari-anee matrix 2004

本文读者也读过(10条)

1. 刘真旭. Liu Zhenxu 基于麦克风阵列的实时声源定位[期刊论文]-计算机应用与软件2010,27(6)

2. 邵怀宗. 林静然. 彭启琮. 居太亮. 徐异凌基于麦克风阵列的声源定位研究[期刊论文]-云南民族大学学报(自然科学版)2004,13(4)

3. 王大中. 李晓妮. WANG Da-zhong. LI Xiao-ni 基于麦克风阵列的语音信号实时时延估计[期刊论文]-吉林大学学报（信息科学版）2009,27(2)

4. 于豪光. 王洪源基于麦克风阵列的声源时延估计算法的研究[期刊论文]-科技创新导报2008(32)

5. 胡郢. 刁帅. Hu Ying. Diao Shuai 基于T型麦克风阵列的近场三维声源定位[期刊论文]-武汉船舶职业技术学院学报2009,8(6)

6. 基于麦克风阵列声音信号定位方法的研究[期刊论文]-传感技术学报2010,23(5)

7. 王军. 种兰祥. WANG Jun. ZHONG Lan-xiang 麦克风阵列声源定位与跟踪性能改进[期刊论文]-计算机工程与应用2008,44(19)

8. 邓艳容. 景新幸. 任华娟. DENG Yan Rong. JING Xin Xing. REN Hua Juan 基于麦克风阵列的声源定位研究[期刊论文]-电子技术应用2010,36(2)

9. 杨祥清. 汪增福. YANG Xiang-qing. WANG Zeng-fu 基于麦克风阵列的三维声源定位算法及其实现[期刊论文]-声学技术2008,27(2)

10. 任勇. 胡方明. 李自学. Ren Yong. Hu Fangming. Li Zixue 基于麦克风阵列声源定位系统的FPGA实现[期刊论文]-电子科技2011,24(4)

引证文献(5条)

1. 郭威. 申利民. 谭云福. 陶凤莉嵌入式语音识别在混响环境中的信号增强方法[期刊论文]-计算机应用研究2010(12)

2. 金光明. 谢植. 张传义. 金日炳基于两个L型阵列的远场多声源定位方法[期刊论文]-东北大学学报：自然科学版2012(9)

5. 余帅. 何培宇一种单通道语音倒谱域去混响新方法[期刊论文]-四川大学学报（自然科学版） 2012(4)

基于麦克风阵列的近场声源定位

相关文章