小波变换在语音信号处理中的应用
李显业[1**********]9光信息3班
摘要:语音是一种由人发出来的声波,所以它就和其他各种声音一样,也具有声音的物理属性。但是,它还具有一些自己所特有的性质,如音质,音强,音调等。语音是一种很复杂的信号,人们对语音信号已经进行了很长时间的研究,,已经掌握了它的一些性质。。小波变换在语音信号处理的应用很广泛,本文将介绍小波变换在语音信号处理中的一些应用。
关键词:小波变换语音处理
引言:
2011年,苹果的语音识别技术风靡全球,语音识别技术也进入了普通大众的视线。中国在这方面以科大讯飞为首,首先进入面向用户的阶段。学过信号系统的我们,不妨想一想如何对信号进行处理和识别?大家可能会想到傅里叶变换。但是在利用傅立叶变换分析信号时,存在着某些缺陷。比如,傅里叶总是假定信号为周期性信号,将待分析信号分解成周期性的正弦信号,然后根据分解得到正弦信号得到待分析信号的频率信息和相位信息,为了分析信号的局部特征,发展了短时傅立叶变换,但是在利用短时傅立叶变换分析信号时,由于在时频平面的不同位置处分析单元的形状保持不变,既不具有分析频率降低时视野自动放宽的特点,也不具有频率特性品质因数恒定的特点而。小波变换就可以很好的解决这些问题。那么什么是小波变换呢?
小波的定义:
小波是一个积分为0的函数假定f(t)∈L(R)是能量为E=f(t)的能量有限信号。小波变换的基本思想就是将任一平方函数或能量有限信号L(R)通过多分辨率分析表示成小波系数的叠加小波变换是一种信号的时间尺度分析方法具有多分辨率分析的特点而且在时频两域内都具有表征信号局部特征的能力是一种窗口大小固定不变但其形状可变时间窗和频域窗都可变的时频局部分析方法。 222
小波及其变换的特点:
小波有两个特点:一是在时域都具有紧支集或近似紧支集;二是正负交替的“波动性”,也即直流分量为零。。
小波变换主要有以下特点:
(1)具有多分辨率的特点,可以由粗及细地逐步观察信号;
(2)可以看成用基本频率特性Ψ(w)的通带滤波器在不同尺度a下对信号做滤波。由傅立叶变换的尺度特性可知,这组滤波器具有品质因数恒定,,即相对带宽(带宽与中心频率之比)恒定的特点;
(3)适当的选择小波基,使Ψ(t)在时域上为有限支撑,Ψ(w)在频域上也比较集中,就可以使小波变换在时、频域都具有表征信号局部特征的能力,因此有利于检测信号的瞬态或奇异点。小波分析的主要特点就是能够分析信号的局部特征,利用小波变换可以非常准确地分析信号在什么时刻发生畸变,小波可检测出许多其它分析方法忽略的信号特征。
小波变换语音信号处理中的应用:
1,语音基音周期检测
人在发浊音时,声门周期性地打开和闭合,使来自肺部的空气形成一串周期性的脉冲气流进入声道,这种周期性的脉冲称为基音周期,基音周期是玉器音信号处理中的一个非常重要的参数,在语音编码、合成、话者识别和声音转换等研究和应用领域中,一般都要应用到基音周期参数。在声门闭合时,引起语音信号出现锐变,由于小波变换不但具有良好的频率分辨率,而且具有良好的时间分辨率,根据小波变换的这一特点,对语音信号作小波变换,在各尺度下系数的模的极大值就对应于信号突变点的位置。采用小波变换检测出语音信号的声门闭合时刻,再通过计算声门闭合时刻之间的时间就可以确定出语音的基音周期。为了检测出信号的突变点,首先要选取光滑函数的一阶导数作为母小波函数。通常选取具有紧支集正则的2次样条小波,它是3次样条函数的一阶导数,与传统基音周期估计自相关函数相比,小波变换无需假定分析窗是静态的,只要峰值点检测准确,就可以精确估计基音周期。用小波变换检测基音周期,可以很好
地估计出大动态范围的基音周期,而传统的方法则不行。因为如果基音周期较宽,必须采用很大的窗函数口,这在实际应用中很不方便,在有的情况下可能无法实现,但是,利用小波变换检测基音周期,仍存在一定的误差,特别是在汉语发音中第三声的情况。如何减小音调对基音频率的影响仍是一个值得研究的问题。
2,语音去噪和增强
语音通信过程不可避免地会受到各种噪声的干扰,噪声降低了语音的信噪比和可懂度。小波变换具有多尺度的特性,可以由粗及细的逐步观察信号。语音信号去噪和增强的目的就是从带噪语音信号中去掉语音信号中所含有噪音成分从而得到比较纯净语音信号。首先对带噪语音信号进行小波变换,得到各尺度的小波系数。然后对得到小波系数进行噪声估计。进行噪声估计的方法比较多,可以针对每一层分解得到的小波系数进行噪声估计,也可以只是对近似部分的系数进行估计,还可以针对所有得到的系数进行估计。阈值的选取方法可以是“硬阈值”,也可以是“软阈值”所谓的“硬阈值”就是对根据得到阈值α,把绝对值小于α小波系数置为0,而其他的系数不变。“软阈值”是用小波系数的绝对值,减去α,对于小于α的小波系数置为0。
“硬阈值”处理的计算公式为:
d‘= d,if|d|>α 0,if|d|
其中,d‘为处理后的小波系数,d为处理前的小波系数,α为阈值。“软阈值”处理的计算公式为:
sgn(d)||d|−α|,if|d|>αd’= 0,if|d|
其中,d‘为处理后的小波系数,d为处理前的小波系数,α为阈值。利用小波变换进行去噪的过程如下
小波去噪过程
因为小波变换具有和人耳相似的频率特性,所以利用小波变换进行去噪可以达到比较理想的效果。使用小波变换进行去噪和增强的关键在于阈值的选取,如果阈值选得过高,会使信号丢失过多的细节,使信号失真:如果阈值选得过低,则不能达到去噪的目的。有比较多的文献讨论关于语音去噪和增强的问题。 语音检测
语音信号检测的目的是能够正确区分语音信号与各种背景噪声,它有着重要的应用意义,因此越来越引起人们的重视。语音信号检测算法主要依据语音与噪声的不同特性进行信噪分离,从而达到检测的目的。传统的方法有基于短时能量、过零率等。这些算法都要求条件比较理想,在实际的应用中很难达到理想的效果。根据语音的特点,可以把语音信号进行小波分解,然后对得到小波分解系数进行统计分析,可以区分出语音信号。语音信号的统计特性可以用它的波形振幅概率密度函数来描述。具体方法如下:首先获取根据间范围内一段语音信号的大量取样数据的幅度绝对值并计算出其幅度直方图:然后,根据统计的直方图,寻找近似的概率密度表达式。通过对语音信号的统计特性进行研究,语音信号振幅分布可用两种概率密函数逼近,一种是修正的伽玛概率密度函数,另一种是正态分布概率密度函数。小波变换在语音信号的其它方面还有许多的应用,如说话人识别,汉语声调识别,语音信号压缩等等。
结论:
小波变换是科学家、工程师和数学家们共同创造的,反映了大科学时代学科之间的综合、渗透的优势,小波变换还在不断的发展当中,它不仅能应用到像语音信号这样的一维信号当中,还可应用到诸如图像等二维信号中。随着人们对小波变换的深入研究,它的应用将会越来越广泛,在进行
语音信号的处理中,它的作用也将越来越大。
参考文献
1杨福生,小波变换的工程分析与应用,北京科学出版社,1999
2李辉,基于前置滤波和小波变换的带噪语音基音周期检测方法,数据采集与处理,2005,1(20) 3马建芬,小波变换在语音去噪中的应用,太原理工大学学报,2001,
4苏秦,赵鹤鸣,基于小波变换的多尺度多阈值语音信号去噪,苏州大学学报(工学版),2003
5李硕,李冰洋,王密,小波变换及其在语音信号处理中的应用,哈尔滨师范大学自然科学学报2006
小波变换在语音信号处理中的应用
李显业[1**********]9光信息3班
摘要:语音是一种由人发出来的声波,所以它就和其他各种声音一样,也具有声音的物理属性。但是,它还具有一些自己所特有的性质,如音质,音强,音调等。语音是一种很复杂的信号,人们对语音信号已经进行了很长时间的研究,,已经掌握了它的一些性质。。小波变换在语音信号处理的应用很广泛,本文将介绍小波变换在语音信号处理中的一些应用。
关键词:小波变换语音处理
引言:
2011年,苹果的语音识别技术风靡全球,语音识别技术也进入了普通大众的视线。中国在这方面以科大讯飞为首,首先进入面向用户的阶段。学过信号系统的我们,不妨想一想如何对信号进行处理和识别?大家可能会想到傅里叶变换。但是在利用傅立叶变换分析信号时,存在着某些缺陷。比如,傅里叶总是假定信号为周期性信号,将待分析信号分解成周期性的正弦信号,然后根据分解得到正弦信号得到待分析信号的频率信息和相位信息,为了分析信号的局部特征,发展了短时傅立叶变换,但是在利用短时傅立叶变换分析信号时,由于在时频平面的不同位置处分析单元的形状保持不变,既不具有分析频率降低时视野自动放宽的特点,也不具有频率特性品质因数恒定的特点而。小波变换就可以很好的解决这些问题。那么什么是小波变换呢?
小波的定义:
小波是一个积分为0的函数假定f(t)∈L(R)是能量为E=f(t)的能量有限信号。小波变换的基本思想就是将任一平方函数或能量有限信号L(R)通过多分辨率分析表示成小波系数的叠加小波变换是一种信号的时间尺度分析方法具有多分辨率分析的特点而且在时频两域内都具有表征信号局部特征的能力是一种窗口大小固定不变但其形状可变时间窗和频域窗都可变的时频局部分析方法。 222
小波及其变换的特点:
小波有两个特点:一是在时域都具有紧支集或近似紧支集;二是正负交替的“波动性”,也即直流分量为零。。
小波变换主要有以下特点:
(1)具有多分辨率的特点,可以由粗及细地逐步观察信号;
(2)可以看成用基本频率特性Ψ(w)的通带滤波器在不同尺度a下对信号做滤波。由傅立叶变换的尺度特性可知,这组滤波器具有品质因数恒定,,即相对带宽(带宽与中心频率之比)恒定的特点;
(3)适当的选择小波基,使Ψ(t)在时域上为有限支撑,Ψ(w)在频域上也比较集中,就可以使小波变换在时、频域都具有表征信号局部特征的能力,因此有利于检测信号的瞬态或奇异点。小波分析的主要特点就是能够分析信号的局部特征,利用小波变换可以非常准确地分析信号在什么时刻发生畸变,小波可检测出许多其它分析方法忽略的信号特征。
小波变换语音信号处理中的应用:
1,语音基音周期检测
人在发浊音时,声门周期性地打开和闭合,使来自肺部的空气形成一串周期性的脉冲气流进入声道,这种周期性的脉冲称为基音周期,基音周期是玉器音信号处理中的一个非常重要的参数,在语音编码、合成、话者识别和声音转换等研究和应用领域中,一般都要应用到基音周期参数。在声门闭合时,引起语音信号出现锐变,由于小波变换不但具有良好的频率分辨率,而且具有良好的时间分辨率,根据小波变换的这一特点,对语音信号作小波变换,在各尺度下系数的模的极大值就对应于信号突变点的位置。采用小波变换检测出语音信号的声门闭合时刻,再通过计算声门闭合时刻之间的时间就可以确定出语音的基音周期。为了检测出信号的突变点,首先要选取光滑函数的一阶导数作为母小波函数。通常选取具有紧支集正则的2次样条小波,它是3次样条函数的一阶导数,与传统基音周期估计自相关函数相比,小波变换无需假定分析窗是静态的,只要峰值点检测准确,就可以精确估计基音周期。用小波变换检测基音周期,可以很好
地估计出大动态范围的基音周期,而传统的方法则不行。因为如果基音周期较宽,必须采用很大的窗函数口,这在实际应用中很不方便,在有的情况下可能无法实现,但是,利用小波变换检测基音周期,仍存在一定的误差,特别是在汉语发音中第三声的情况。如何减小音调对基音频率的影响仍是一个值得研究的问题。
2,语音去噪和增强
语音通信过程不可避免地会受到各种噪声的干扰,噪声降低了语音的信噪比和可懂度。小波变换具有多尺度的特性,可以由粗及细的逐步观察信号。语音信号去噪和增强的目的就是从带噪语音信号中去掉语音信号中所含有噪音成分从而得到比较纯净语音信号。首先对带噪语音信号进行小波变换,得到各尺度的小波系数。然后对得到小波系数进行噪声估计。进行噪声估计的方法比较多,可以针对每一层分解得到的小波系数进行噪声估计,也可以只是对近似部分的系数进行估计,还可以针对所有得到的系数进行估计。阈值的选取方法可以是“硬阈值”,也可以是“软阈值”所谓的“硬阈值”就是对根据得到阈值α,把绝对值小于α小波系数置为0,而其他的系数不变。“软阈值”是用小波系数的绝对值,减去α,对于小于α的小波系数置为0。
“硬阈值”处理的计算公式为:
d‘= d,if|d|>α 0,if|d|
其中,d‘为处理后的小波系数,d为处理前的小波系数,α为阈值。“软阈值”处理的计算公式为:
sgn(d)||d|−α|,if|d|>αd’= 0,if|d|
其中,d‘为处理后的小波系数,d为处理前的小波系数,α为阈值。利用小波变换进行去噪的过程如下
小波去噪过程
因为小波变换具有和人耳相似的频率特性,所以利用小波变换进行去噪可以达到比较理想的效果。使用小波变换进行去噪和增强的关键在于阈值的选取,如果阈值选得过高,会使信号丢失过多的细节,使信号失真:如果阈值选得过低,则不能达到去噪的目的。有比较多的文献讨论关于语音去噪和增强的问题。 语音检测
语音信号检测的目的是能够正确区分语音信号与各种背景噪声,它有着重要的应用意义,因此越来越引起人们的重视。语音信号检测算法主要依据语音与噪声的不同特性进行信噪分离,从而达到检测的目的。传统的方法有基于短时能量、过零率等。这些算法都要求条件比较理想,在实际的应用中很难达到理想的效果。根据语音的特点,可以把语音信号进行小波分解,然后对得到小波分解系数进行统计分析,可以区分出语音信号。语音信号的统计特性可以用它的波形振幅概率密度函数来描述。具体方法如下:首先获取根据间范围内一段语音信号的大量取样数据的幅度绝对值并计算出其幅度直方图:然后,根据统计的直方图,寻找近似的概率密度表达式。通过对语音信号的统计特性进行研究,语音信号振幅分布可用两种概率密函数逼近,一种是修正的伽玛概率密度函数,另一种是正态分布概率密度函数。小波变换在语音信号的其它方面还有许多的应用,如说话人识别,汉语声调识别,语音信号压缩等等。
结论:
小波变换是科学家、工程师和数学家们共同创造的,反映了大科学时代学科之间的综合、渗透的优势,小波变换还在不断的发展当中,它不仅能应用到像语音信号这样的一维信号当中,还可应用到诸如图像等二维信号中。随着人们对小波变换的深入研究,它的应用将会越来越广泛,在进行
语音信号的处理中,它的作用也将越来越大。
参考文献
1杨福生,小波变换的工程分析与应用,北京科学出版社,1999
2李辉,基于前置滤波和小波变换的带噪语音基音周期检测方法,数据采集与处理,2005,1(20) 3马建芬,小波变换在语音去噪中的应用,太原理工大学学报,2001,
4苏秦,赵鹤鸣,基于小波变换的多尺度多阈值语音信号去噪,苏州大学学报(工学版),2003
5李硕,李冰洋,王密,小波变换及其在语音信号处理中的应用,哈尔滨师范大学自然科学学报2006