第二节 谱减法语音增强技术
1979年,Boll首次提出了谱减法的语音增强思想,该方法由于原理简单、计 算量小、易于实现等特性,是目前最通用的语音增强方法之一。其基本思想是[4]:
①假设语音和噪声统计独立噪声,按帧对语音进行处理; ②将所有帧分为语音帧和噪声帧;
③在噪声帧对噪声谱|N(?)|进行跟踪和更新,在语音帧用带噪语音频谱
?|Y(?)|减去噪声谱幅度则可得到干净语音频谱|S???|。
通过引入参数,谱减法可以提供更大的灵活性,式(2.2)给出代参谱减法表达式:
?bb??|Y???|??|N???|,|S???|b??|N???|bb |S???|?? b?|N???|其它?(2.2)
当b?1时,式(2.2)代表幅度谱减;当b?2时,表示功率谱减。?与?为自由参数。
一旦在频域完成了谱减运算,便可由式(2.3)中的反变换得到增强语音:
?? S(k)?IFFTS[(?|)?ejarYg(?)|]
(2.3)
谱减法虽然简单,却有一个很大缺陷,那就是引入了恼人的“音乐噪声”。这种残留噪声是由于噪声估计不准确引起的,它们随机地分布在各个频率阶段并且具有一定的节奏起伏感,被形象地称之为“音乐噪声”。
第三节 基于维纳滤波法的语音增强
另一种可供选择的方法是设计一个线性滤波器H使得增强后信号具有最小
??均方误差,也即s?k??y?k??h?k?,满足??E?s?k??s?k??2最小。式(2.4)给出了频域上统计意义最优滤波器的解决方案:
??
H(?)?(2.4) |S(?)|
|S???|2?|N???|2式(2.4)也被称为维纳滤波,是由Lim和Oppenheim于1979年首次提出来。实际情况下干净语音功率谱以及噪声功率谱均不可预先得到,常采用谱估计器、?噪声估计器等方法分别得到干净语音功率谱的估计值S???以及噪声功率谱估计?N值???。类似于谱减法,也可对维纳滤波器进行改进,得到带参数型维纳滤波器: ??|S2(?)| H(?)???S2?????N2?????
???(2.5) 对照式(2.5)可知式(2.4)相当于??1,??1/2的情况,当??1,??1/2,式(2.5)相当于功率谱滤波。维纳滤波相对谱减法的主要优势在于:增强后语音的残留噪声类似于白噪声,“音乐噪声”得到了很大抑制。但是维纳滤波是基本平稳条件下最小均方误差下的最优估计,实际环境中,由于噪声是非平稳的,语音也是非平稳的,这使得维纳滤波存在一定的缺陷。 第四节 本章小结
本章介绍了几种常用的语音增强算法,包括自适应噪声抵消法,谱减法以及维纳滤波法,但每种方法都有各自的缺陷,比如,自适应噪声抵销法需要参考噪声输入,这样就增加了硬件上的成本;谱减法会引入类似音乐的噪声残余;维纳滤波法也只能使用傅里叶变换对信号进行处理,但傅里叶变换无法体现信号的细节特征。下一章将介绍能够在频域同时对信号进行处理的小波变换,并研究基于小波分析的语音增强算法。
第三章 小波变换在信号处理中的应用
小波分析的主要优点就是能够分析信号的局部特征和检测出许多其他分析方法忽略的信号特征,因此它拥有“数学显微镜”的称号。小波变换作为一种数字理论和方法在科学技术和工程界引起了越来越多的关注和重视。尤其在工程应用领域,特别是信号处理,应用数学,应用物理,地震勘测,故障诊断等领域被认为是近年来在工具和方法上的重大突破[5]。
第一节 小波理论的提出与发展
小波变换是近10年来迅速发展起来的一种时频局部分析方法,它克服了短时傅里叶变换固定分辨率的缺点,能够将信号在多尺度多分辨率上进行小波分解,各尺度上分解得到的小波系数代表信号在不同分辨率上的信息。同时小波变换与人耳的听觉特性非常相似,便于研究利用人耳的听觉特性,是分析语音这种非平稳信号的有力工具,所以近年来有很多研究者都利用小波变换来处理语音信号。小波变换去噪的原理是:语音信号的能量集中在低频段,而噪声能量则主要集中高频段,这样就可将噪声小波系数占主要成分的那些尺度上的噪声小波分量置零或给予很小的权重,然后用处理后的小波系数重构恢复信号。同时,随着小波变换理论的发展,小波变换去噪不断丰富,并且取得良好的效果,如1992年Mallat提出了利用小波变换模极大值去噪,Donobo在1995年提出了非线性小波变换阈值去噪,这种方法使得小波去噪得到广泛应用,吸引了众多研究者。
第二节 小波变换的基本性质
一、小波变换与傅里叶变换
在信号处理领域,傅里叶变换无疑是最重要的方法之一,是一个强有力的信号分析工具,并且具有很重要的物理意义[6]。信号f(x)的傅里叶变换公式和反演公式为: ??f?x?ei?xdx??
??1f?x??F???ei?xdx?2???F(?)??(3.1) 傅里叶变换能够反映信号的频谱特性,这点决定了他在信号分析中的地位。对平稳信号来说,理想工具是傅里叶变换,然而实际中,大多数的信号均含有大量的非稳态成份。例如语音信号,在不同的时间对应不同音节,它的频域特性随时间而变化,对这类时变信号进行分析,通常需要提取一种具有一定的时间和频率的基函数来分析时变信号。而傅里叶变换是一种全局的变换,只能反映信号的整体特征,在时域不能局部化,难以检测到局域突变信号,然而在实际应用中,人们感兴趣的信息往往都是在局部突然变化的信号里体现。 另一方面,在分析信号时发现,在分析高频信号时需要对时域中时间长度较短的信号分析才能得到高频分量;对低频信号,由于周期较长则需要对时域中时间较长的信号进行分析,这样才能得到一个周期内的完整信号。小波变换正具有这样的调节能力。 二、连续小波变换与离散小波变换
如果在L2?R?空间中的函数满足容许性条件:
C??R?(3.2)
就可以作为一个小波母函数,其中????为ψ(x)的傅里叶变换。小波母函数根据参数?a,b?生成连续小波序列:
|????|d???|?|R??R??0?
??a,b??x??(3.3)
信号s?x?的连续小波变换为:
?x?b??a|a|??1??a?0
? WS?a,b???s?x???a,b??x?dx??s?x?,??a,b??x??
????(3.4)
式(3.4)中??a,b??x?为??a,b??x?的共轭复数。
?连续小波变换中的参数a,b以及x都是连续的变量,为了能更好的将小波算法移植到机器上,必须使用离散小波变换DWT(Discrete wavelet transform)。
mmTS为该首先对参数a和b离散化,定义a?a0为小波函数的尺度参数,b?na0尺度上的平移参数,得到离散小波序列
??m,n??x??(3.5)
在大多数的离散小波中,a0?2,TS?1,即:
??m,n??x??a0(3.6)
还有一种特殊的情况,只对尺度因子a做离散化处理并令a0?2,得到的小波函数称为二进小波:
?(m,b)?x??2?m/2??(3.7)
这就相当于尺度参数a取离散二进制数值am?2?m时的连续小波变换。 离散小波变换在信号细节的表现上不如连续小波变换,但具有计算量低的优点[7]。在连续的尺度参数和平移参数上计算小波系数的工作量非常大,并且会得
?x??b?m?2?m?Z
?m/2?m/2a0?x????m?nTS???a0?m,n?Z
?2?mx?n
??