维纳后置滤波DNN前端增强的远场语音识别

论文摘要

由于混响和噪声等因素影响,远距离场景下的语音识别性能较近场语音识别的性能仍有很大差距。为提高远场语音识别系统的性能,在后置滤波波束形成的基础上,提出结合深度神经网络与维纳后置滤波的前端增强远场语音识别方法。将维纳滤波嵌入神经网络对波束形成后的语音输出进行增强,抑制相关性噪声,最后利用TDNN-LSTM近场语音识别系统进行语音识别。实验在数据集CHiME-5上进行,结果表明,该方法对远场语音的识别结果优于传统的后置滤波方法,字错误率下降2.3%。

论文目录

1 维纳后置滤波

2 结合优化DNN的维纳滤波

2.1 帧相关性联合优化目标函数

2.2 维纳后置滤波DNN优化神经网络

3 远场语音识别算法

4 实验设置

4.1 数据准备

4.2 参数设置

4.3 实验结果及分析

5 总结

文章来源

类型: 期刊论文

作者: 刘诚然,宋潇潇,屈丹,杨绪魁

关键词: 远场语音识别,维纳后置滤波,深度神经网络,波束形成

来源: 信息工程大学学报 2019年04期

年度: 2019

分类: 信息科技

专业: 电信技术,自动化技术

单位: 信息工程大学,河南省信息中心

基金: 国家自然科学基金资助项目(61673395)

分类号: TN912.3;TP18

页码: 405-409+416

总页数: 6

文件大小: 1531K

下载量: 43

维纳后置滤波DNN前端增强的远场语音识别

论文摘要

论文目录

文章来源

相关论文文献

猜你喜欢