维纳后置滤波DNN前端增强的远场语音识别
刘诚然; 宋潇潇; 屈丹; 杨绪魁
【期刊名称】《信息工程大学学报》 【年(卷),期】2019(020)004
【摘要】由于混响和噪声等因素影响,远距离场景下的语音识别性能较近场语音识别的性能仍有很大差距.为提高远场语音识别系统的性能,在后置滤波波束形成的基础上,提出结合深度神经网络与维纳后置滤波的前端增强远场语音识别方法.将维纳滤波嵌入神经网络对波束形成后的语音输出进行增强,抑制相关性噪声,最后利用TDNN-LSTM近场语音识别系统进行语音识别.实验在数据集CHiME-5上进行,结果表明,该方法对远场语音的识别结果优于传统的后置滤波方法,字错误率下降2.3%.
【总页数】6页(405-409,416)
【关键词】远场语音识别; 维纳后置滤波; 深度神经网络; 波束形成 【作者】刘诚然; 宋潇潇; 屈丹; 杨绪魁
【作者单位】信息工程大学 河南郑州 450001; 河南省信息中心 河南郑州 450003
【正文语种】中文 【中图分类】TP391.9 【相关文献】
1.基于环形麦克风阵列的远场语音识别系统 [J], 支艳利; 张云伟 2.适于远场语音识别的倒谱系数零均值化改进算法 [C], 姜薇; 徐柏龄 3.远场语音识别方法研究 [J], 王智国; 王海坤
4.基于DNN-HMM模型的语音识别的语音导航系统 [J], 赵永生; 徐海青; 吴立刚
5.基于多GPU并行框架的DNN语音识别研究 [J], 杨宁
以上内容为文献基本信息,获取文献全文请下载
维纳后置滤波DNN前端增强的远场语音识别
维纳后置滤波DNN前端增强的远场语音识别刘诚然;宋潇潇;屈丹;杨绪魁【期刊名称】《信息工程大学学报》【年(卷),期】2019(020)004【摘要】由于混响和噪声等因素影响,远距离场景下的语音识别性能较近场语音识别的性能仍有很大差距.为提高远场语音识别系统的性能,在后置滤波波束形成的基础上,提出结合深度神经网络与维纳后置滤
推荐度:
点击下载文档文档为doc格式