自动语音识别论文_梁慧

导读:本文包含了自动语音识别论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语音识别,英语,语音,音素,神经网络,递归,技术。

自动语音识别论文文献综述

梁慧[1](2019)在《嵌入式英语语音识别系统误差自动检测方法研究》一文中研究指出为了提高嵌入式英语语音识别系统发音误差自动检测能力,提出基于时频分析和关联信息熵特征提取的嵌入式英语语音识别系统发音误差自动检测方法。采用时频特征分解方法进行嵌入式英语语音识别系统英语发音信号的降噪处理,对降噪输出的英语发音信号进行特征分解和关联维特征配准,结合小波多层重构方法进行语音信号的重组,提取英语发音信号的关联信息熵特征,根据提取的语音信号的关联信息熵特征进行自动匹配,实现对嵌入式英语语音识别系统误差的自动识别。仿真结果表明,采用该方法进行嵌入式英语语音识别系统发音误差自动检测的准确性较好,对语音信号的分辨能力较好,提高了嵌入式英语语音识别系统的发音误差的检测性能。(本文来源于《自动化与仪器仪表》期刊2019年09期)

郑晓琼,汪晓,江海升,樊培培,张超[2](2019)在《基于RNN和WFST译码的自动语音识别研究》一文中研究指出文中利用Eesen框架声学建模简化了现有的自动语音识别(ASR),通过训练单个递归神经网络(RNN)来预测上下文无关的目标(音素或字符)。为了消除对预生成帧标签的需求,采用了连接时间分类(CTC)目标函数来推断语音和标签序列之间的对齐。同时,采用基于加权有限状态换能器(WFST)的广义译码方法,将词汇和语言模型有效地整合到CTC译码中。实验结果表明,与混合HMM/DNN模型相比,所提方法具有较低的误码率(WER),同时显着加快了译码速度。(本文来源于《信息技术》期刊2019年06期)

蒋竺芳[3](2019)在《端到端自动语音识别技术研究》一文中研究指出语言作为人们在人际交往中最主要的沟通途径,将来必然会成为人机交互与共融的重要桥梁。自动语音识别(ASR)可以表述为通过计算机将人类语音信号转录为书面形式的文字输出的过程,而早自20世纪70年代以来,自动语音识别问题就一直是机器学习界的一个重要研究课题。发展到现在,尽管传统的自动语音识别技术仍在被使用,但是解决了传统框架识别过程繁琐、难于优化等问题的基于深度神经网络的端到端模型在自动语音识别领域正逐渐成为研究热点与发展方向。在此背景下,本课题立足于深度神经网络结构框架,对端到端的语音识别技术进行研究。首先,分析当前两种主流端到端自动语音识别模型—CTC和基于注意力机制的模型,总结了二者存在的问题:1.CTC对输出单元之间作了相互独立性假设,但事实上这对上下文紧密相关的语音识别是并不合理的;2.注意力机制下允许不规则的输入输出对齐,但是通常语音识别却具有严格单调对应的输入输出。因此,本文提出了一种结合了CTC与注意力机制的端到端自动语音识别模型,并在开源英文语音数据集Librispeech识别任务上验证了模型的有效改进。其次,本文提出了一种新型编码-解码结构的端到端自动语音识别模型,基于循环神经网络的自适应映射模型(RAM)。RAM将语音识别任务看作序列到序列的映射问题,端到端地训练输入序列与目标序列对,引入“空白标签”达到输入与输出自适应对齐的目标,这点与CTC类似,但我们不再做输出独立性假设。再通过边缘化所有可能的空白标签来计算标签序列的概率。在Librispeech语音识别任务上的实验结果表明基于RAM的识别系统在没有额外语言模型的情况下,其识别性能相较于其他端到端模型是具有竞争力的。最后,针对普通话语音的发音特性,改进提出的新模型RAM以适用于普通话的语音识别,并在开源中文数据集AISHELL-1上验证了RAM模型在普通话语音识别任务上的有效性。此外,我们提出引入迁移学习方法,在大型英文数据集上预训练模型作为先验模型,再将他们移植至普通话的识别中,这不仅使训练更加高效,而且在性能上也获得了提升。(本文来源于《北京邮电大学》期刊2019-06-04)

卢丹萍,黄民恒[4](2019)在《基于指纹及语音识别技术的车库自动门改造方案》一文中研究指出现在车库卷帘门的升降控制主要依靠遥控器,设计了一种基于指纹识别及语音识别技术的车库卷帘门控制器,分别安装在车库门入口处及汽车内,实现了对车库门的无钥匙升降控制。该模块由控制器、指纹识别模块、语音识别模块、433M遥控编码及发射器组成。实践表明,此方案稳定可靠具有一定的推广价值。(本文来源于《科技视界》期刊2019年10期)

龙艳花,茅红伟,叶宏[5](2019)在《电视剧语音识别中的半监督自动语音分割算法》一文中研究指出针对具有大段连续文本标注、但无时间标签的电视剧语音提出了一种半监督自动语音分割算法。首先采用原始的标注文本构建一个有偏的语言模型,然后将该语言模型以一种半监督的方式用于电视剧语音识别中,最后利用自动语音识别的解码结果对传统的基于距离度量、模型分类以及基于音素识别的语音分割算法进行改进。在英国科幻电视剧"神秘博士"数据集合上的实验结果表明,提出的半监督自动语音分割算法能够取得明显优于传统语音分割算法的性能,不仅有效解决了电视剧语音识别中大段连续音频的自动分割问题,还能对相应的大段连续文本标注进行分段,保证分割后各语音段时间标签及其对应文本的准确性。(本文来源于《数据采集与处理》期刊2019年02期)

赵淼,蒋超,朱昱淇,冯青[6](2018)在《语音识别自动导购系统的云平台创建项目的开发》一文中研究指出本文介绍了语音识别自动导购系统的功能要求及其实现的大致原理,简述了基于语音识别自动导购系统在移动云平台的创建过程,最后对系统开发与新型平台的创建工作进行了相应的总结。(本文来源于《电子技术与软件工程》期刊2018年20期)

俞科峰[7](2018)在《自动语音识别技术在中国电信多媒体客服系统中的应用》一文中研究指出为更好地提升中国电信客户服务的体验感知,通过利用人工智能应用技术中的自动语音识别技术贯穿热线服务的全流程,研究通过语音识别(ASR)应用、自然语言理解(NLU)应用、语音合成(TTS)应用结合大数据分析应用,分析了通过人工智能技术的应用融合服务实践推动客户服务运营的智慧化,实验探讨自动语音识别技术应用于客户服务,从多维度提高服务质量,提升客户体验感知的实践。(本文来源于《移动通信》期刊2018年08期)

崔传金,马良,宋振祥[8](2018)在《基于语音识别技术的“黑广播”自动识别系统设计》一文中研究指出基于语音识别技术的"黑广播"自动识别系统采用先进的语音识别技术,多种因素综合判定广播属性,从广播频率特征和信号内容等层面对广播信号进行监测。系统主要优势是多路实时监测、智能化和自动化程度高、不占用现有设备和资源、功能扩展方便等,不仅能帮助无线电管理部门监管广播信号,也可以帮助广电系统查找非法广播内容。(本文来源于《数字通信世界》期刊2018年05期)

刘琳[9](2018)在《大学非英语专业音素教改与自动语音识别技术融合应用可行性》一文中研究指出文中以近些年自动语音识别技术在大学非英语专业音素教改中的融入为研究基础,通过分析目前大学非英语专业因素教改中存在的问题,探讨大学非英语专业因素教改中自动语音识别技术的应用优势并引入案例尝试分析如何提升自动语音识别技术在大学非英语专业音素教改中应用的有效性等。(本文来源于《课程教育研究》期刊2018年17期)

刘琳[10](2018)在《自动语音识别技术在非英语专业大学生英语音素教学中的应用研究》一文中研究指出基于自动语音识别技术的计算机辅助语音培训软件的研发,将语音音素教学向每个学习者提供及时反馈、个体化辅导的需求转变为现实。本研究选取一种以自动语音识别技术为基础的英语语音培训软件——MyET,实证验证其对提高非英语专业大学生音素水平的有效性,以为教学应用和同类软件的设计改进提供数据支持。(本文来源于《开封教育学院学报》期刊2018年04期)

自动语音识别论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

文中利用Eesen框架声学建模简化了现有的自动语音识别(ASR),通过训练单个递归神经网络(RNN)来预测上下文无关的目标(音素或字符)。为了消除对预生成帧标签的需求,采用了连接时间分类(CTC)目标函数来推断语音和标签序列之间的对齐。同时,采用基于加权有限状态换能器(WFST)的广义译码方法,将词汇和语言模型有效地整合到CTC译码中。实验结果表明,与混合HMM/DNN模型相比,所提方法具有较低的误码率(WER),同时显着加快了译码速度。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

自动语音识别论文参考文献

[1].梁慧.嵌入式英语语音识别系统误差自动检测方法研究[J].自动化与仪器仪表.2019

[2].郑晓琼,汪晓,江海升,樊培培,张超.基于RNN和WFST译码的自动语音识别研究[J].信息技术.2019

[3].蒋竺芳.端到端自动语音识别技术研究[D].北京邮电大学.2019

[4].卢丹萍,黄民恒.基于指纹及语音识别技术的车库自动门改造方案[J].科技视界.2019

[5].龙艳花,茅红伟,叶宏.电视剧语音识别中的半监督自动语音分割算法[J].数据采集与处理.2019

[6].赵淼,蒋超,朱昱淇,冯青.语音识别自动导购系统的云平台创建项目的开发[J].电子技术与软件工程.2018

[7].俞科峰.自动语音识别技术在中国电信多媒体客服系统中的应用[J].移动通信.2018

[8].崔传金,马良,宋振祥.基于语音识别技术的“黑广播”自动识别系统设计[J].数字通信世界.2018

[9].刘琳.大学非英语专业音素教改与自动语音识别技术融合应用可行性[J].课程教育研究.2018

[10].刘琳.自动语音识别技术在非英语专业大学生英语音素教学中的应用研究[J].开封教育学院学报.2018

论文知识图

十+平台的中文自动语音识别模拟...十十、Flash和微软自动语音识别拼音自动语音识别模拟图基于人类计算的Web系统的结构语言识别视频故事脚本Fig.3-5VideoStoryTrans...

标签:;  ;  ;  ;  ;  ;  ;  

自动语音识别论文_梁慧
下载Doc文档

猜你喜欢