论文摘要
由于混响和噪声等因素影响,远距离场景下的语音识别性能较近场语音识别的性能仍有很大差距。为提高远场语音识别系统的性能,在后置滤波波束形成的基础上,提出结合深度神经网络与维纳后置滤波的前端增强远场语音识别方法。将维纳滤波嵌入神经网络对波束形成后的语音输出进行增强,抑制相关性噪声,最后利用TDNN-LSTM近场语音识别系统进行语音识别。实验在数据集CHiME-5上进行,结果表明,该方法对远场语音的识别结果优于传统的后置滤波方法,字错误率下降2.3%。
论文目录
文章来源
类型: 期刊论文
作者: 刘诚然,宋潇潇,屈丹,杨绪魁
关键词: 远场语音识别,维纳后置滤波,深度神经网络,波束形成
来源: 信息工程大学学报 2019年04期
年度: 2019
分类: 信息科技
专业: 电信技术,自动化技术
单位: 信息工程大学,河南省信息中心
基金: 国家自然科学基金资助项目(61673395)
分类号: TN912.3;TP18
页码: 405-409+416
总页数: 6
文件大小: 1531K
下载量: 43