好文档 - 专业文书写作范文服务资料分享网站

多通道用户界面设计技术综述

天下 分享 时间: 加入收藏 我要投稿 点赞

.

个合理的概率分布模型;另一个则是通过实际统计的方法去获得。为此,假设语音频谱分布为高斯分布,并在此假设下推导MMSE估计公式,然后讨论实际分布情况。另外,可以利用相邻帧间频率点信息的相关性,对当前帧频率点的频谱幅度值进行估计,这就是基于帧间频谱分布约束的MMSE估计方法。又因为人耳对声音强度的感受是与谱幅度的对数成正比的,因此在处理语音谱幅度时,采用对数失真准则更为适合一些,将上述MMSE估计式进行推广,得到频域分布约束下的短时对数谱的MMSE估计。短时谱幅度的MMSE估计在降噪和提高语音可懂度方面进行了折衷,适用信噪比的范围较广,但是计算量较大,而且语音频谱的先验分布获得在很大程度上要取决于统计结果的代表性、重现性等。 4. 自适应滤波法 以均方误差或方差最小为准则,对噪声信号进行最优估计,然后从带噪语音中减去噪声达到降噪,提高信噪比,增强语音的目的。当输入信号的统计特性未知,或者输入信号的统计特性变化时,自适应滤波器能够自动地迭代调节自身的滤波器参数,以满足某种准则的要求,从而实现最优滤波。因此,自适应滤波器具有“自我调节”和“跟踪”能力。此方法的关键是如何得到带噪语音中的噪声。在多声道采集系统中,两个话筒间要有一定的距离,因而实时采集的两路信号的噪声不同,而且还受到回声及其他可变衰减特性的影响。在用单声道系统来采集带噪语音时,必须在语音间歇期间利用采集到的噪声进行估值,如果噪声是非平稳的,会严重影响语音的增强效果,另一个缺点是增强后的语音中含有明显的“音乐噪声”。

5.隐马尔可夫模型法 可以采用基于状态空间的变换方法,对不同类别的语音和噪声信号建立不同的模型。HMM的各个状态可以对带噪信号、噪声信号所有不同的区域进行充分的建模,将带噪信号中的噪声信号部分去除就可得到语音的增强,甚至于在只有带噪信号的情况下,利用HMM对状态转移概率进行建模,将可能为噪声的信号部分滤除就可以做到语音增强。但是这种方法,在只有带噪信号的情况下要正确分类,准确估计噪声会有一定的误差。

2.7 其它方法

随着信号处理的理论和技术不断发展完善,涌现出许多的新方法,如小波变换[ 13~14 ] 、神经网络[ 15 ] 、听觉掩蔽[ 16 ] 、分形理论[ 17 ]等。 参考文献:

[ 1 ] 杨行峻,迟惠生,等. 语音信号数字处理[M ]. 北京:电子工业出版社, 1995. [ 2 ] 赵力. 语音信号处理[M ]. 北京: 机械工业出版社,2003.

[ 3 ] Gannot S, Burshtein D, Weinstein E. Iterative and se2quential Kalman filter2based speech enhancement algo2 rithms [ J ]. IEEE Trans Speech and Audio Process, 1998, 6(4) : 3732385.

[ 4 ] Kin J B, Lee K Y , Lee CW. On the app lications of theinteracting multip le model algorithm for enhancing noisy speech [ J ]. IEEE Trans Speech and Audio Process,

.

.

2000,8 (3) : 3492352.

[ 5 ] Y Ephraim, H L V Trees. A signal subspace app roach forspeech enhancement[ J ]. IEEE Trans. Speech and AudioProcessing, 1995, 3 (7) : 2512266.

[ 6 ] F Jabloun, B Champagne. A multi - microphone signalsubspace app roach for speech enhancement[A ]. In Proc. IEEE ICASSP01 [C ]. 2001. 2052208 .

[ 7 ] Boll S. Supp ression of acoustic noise in speech using spec2tral subtraction [ J ]. IEEE Trans on Acoustic Speech andSignal Processing, 1979, 27 (2) : 1132120. [ 8 ] Ningp ing Fan. Low distortion speech denoising using an a2dap tive parametric Wiener filter [A ]. IEEE InternationalConference on Acoustics, Speech and Signal Processing( ICASSP) [C ]. 2004, 1: 122309.

[ 9 ] Ephraim Y, Malah D. Speech enhancement using a mini2mum2mean square error short2time spectral amp litude esti2mator [ J ]. IEEE Transactions on Acoustics, Speech andSignal Processing, 1984, 32 (60) : 110921121.

[ 10 ] 韩纪庆,张磊,郑铁然. 语音信号处理[M ]. 北京:清华大学出版社, 2004年. [ 11 ] 高鹰,谢胜利. 一种变步长LMS自适应滤波算法及分析[ J ]. 电子学报, 2001, 29 (8) : 109421097.

[ 12 ] Jax P Vary P. Artificial bandwidth extension of speechsignals usingMMSE estimation based on a hidden Markov model [A ]. IEEE International Conference on Acoustics,Speech, and Signal Processing ( ICASSP) [ C ]. 2003. 6802683

[ 13 ] SMallat and W L Hwang. Singularity detection and p ro2cessing with wavelets[ J ]. IEEE Trans on Information The2ory, 1992, 38 (2) : 6172643 . [ 14 ] D L Donoho and IM Johnstone. Adap ting to unknownsmoothness via wavelet shrinkage [ J ]. Journal of the A2 merican StatisticalAssociation, 1995, 90: 120021224.

四、实验总结

通过此次实验,我很好地熟悉了图形用户界面的设计原则,也通过网上查资料了解了语音识别的多通道用户界面。

.

多通道用户界面设计技术综述

.个合理的概率分布模型;另一个则是通过实际统计的方法去获得。为此,假设语音频谱分布为高斯分布,并在此假设下推导MMSE估计公式,然后讨论实际分布情况。另外,可以利用相邻帧间频率点信息的相关性,对当前帧频率点的频谱幅度值进行估计,这就是基于帧间频谱分布约束的MMSE估计方法。又因为人耳对声音强度的感受是与谱幅度的对数成正比的,因此在处理语音谱幅度时,采用对数失真准则更为适合一些
推荐度:
点击下载文档文档为doc格式
6rqo561nut7yogl1itk20zdc523xwm00i5k
领取福利

微信扫码领取福利

微信扫码分享