语音引擎论文_曹云,陈宗利,袁璐

导读:本文包含了语音引擎论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语音,引擎,回声,看板,静音,缓存,中文。

语音引擎论文文献综述

曹云,陈宗利,袁璐[1](2019)在《基于语音引擎的工业设备状态信息化的实现》一文中研究指出在产品的生产与调试现场中,针对各类工业设备的使用及完成状况,以信息化的形式实现了设备所处状态的语音提醒和看板展示,方便操作人员知悉产品在设备中的进展程度,同时最大限度减少设备占用以及产品加工超时引起的损耗等情况。(本文来源于《电脑知识与技术》期刊2019年13期)

刘欢[2](2017)在《基于微软语音引擎的语音识别设计》一文中研究指出本设计是利用微软语音软件开发包Speech SDK,在VC++6.0的MFC平台下实现计算机语音识别的过程。通过对微软语音开发理论的学习与探索,了解MFC平台的开发与应用,掌握Microsoft Speech SDK(SAPI)在VC++6.0下的加载运行,设计出的在Windows系统下的人机交互语音识别系统。系统总体设计包含上位机设计和下位机设计,以上位机软件设计为主体设计部分,下位机部分作为功能扩展部分,其中下位机设计使用STC89C51单片机作为主控芯片。整个系统设计旨在为人们日常生活提供更多的便利。(本文来源于《电脑知识与技术》期刊2017年20期)

薛凯[3](2017)在《中文语音引擎EKHO在Raspberry pi上的应用实例》一文中研究指出Raspberry Pi是一款针对电脑业余爱好者、教师、小学生以及小型企业等用户的迷你电脑,预装Linux系统,体积仅信用卡大小,搭载ARM架构处理器,运算性能和智能手机相仿。树莓派Raspberry pi由于体积小,很快在物联网中得到广泛应用,并且支持linux操作系统内核,raspberry pi可以非常好的支持Python编程环境,由于Python脚本语言的灵活性,可以在需要语言播放等工程中有很好的应用。EKHO(余音)中文引擎是免费、开源的语音引擎,能够支持多平台的中文语音发音。(本文来源于《电脑迷》期刊2017年02期)

李杨[4](2013)在《利用TTS语音引擎设计英语听力练习软件》一文中研究指出本文详细介绍了英语听力练习软件的设计原理和功能代码,该软件在VFP环境下利用微软TTS语音引擎能轻易实现英语文本的流利朗读,并可选择声音类型、自由调节朗读的音量和语速,极大地提高了学生的听力学习效果。(本文来源于《中小学电教(下)》期刊2013年07期)

吴江锐[5](2013)在《WebRTC语音引擎中NetEQ技术的研究》一文中研究指出随着计算机网络的快速发展,VoIP电话业务也得到广泛应用。这种基于IP网络的语音通话技术提供了方便廉价的交流途径,给通信行业带来了翻天覆地的变化。但随之而来出现的话音质量问题的解决,也迫在眉睫。WebRTC语音引擎是目前最先进的语音引擎之一,其中包含了实现语音信号处理的NetEQ模块,此模块很好地解决了VoIP电话业务出现的延迟、抖动和丢包问题。但由于NetEQ是专利技术,没有开放相应的开发文档,因此需要对NetEQ进行详细分析研究,以便能够更好地应用于VoIP业务中。本文研究的核心内容是NetEQ集成的自适应抖动消除算法和语音包丢失隐藏算法。论文首先对NetEQ的体系结构及处理流程做了概括性的分析,并重点对NetEQ的控制模块-MCU的控制机制,以及信号处理模块-DSP对语音数据的处理方法做了详细的研究和性能分析。分析结果表明NetEQ在抖动消除和丢包隐藏方面的优势。最后,本文基于语音质量角度对NetEQ做了部分优化,开发了语音质量评估模块。论文基于E-Model语音质量预测模型及ITU的单端非侵入型评估算法P.563算法进行了语音质量评估模块的设计和开发,并用UML的时序图描述了模块的开发流程及方法。该模块的评估结果基本符合主观评价。(本文来源于《西安电子科技大学》期刊2013-03-01)

王亚辉[6](2013)在《基于WebRTC语音引擎的会议混音技术研究》一文中研究指出目前,IP电话会议系统正受到越来越多的关注,它的理想目标是借助于Internet的连通性,使所有与会者能够获得与参与现实会议无差别的用户体验。混音技术在IP电话会议系统中占据重要的地位,它能够解决会议中多人同时发言的问题。Google公司在2011年6月推出了WebRTC开源项目,它包括了一系列成熟的音视频通信技术。借助于WebRTC中的语音引擎,可以实现较为理想的单端语音通信。为将其应用于IP电话会议系统中,使语音引擎具备会议混音功能,必须对其进行修改。本文首先分析了混音的原理以及目前主流的混音算法,但混音技术还应包括混音策略。在对混音策略进行比较分析后,基于具体实现,提出将WebRTC语音引擎应用于集中式混音架构。为使WebRTC语音引擎能够适合于集中式混音架构,在对语音引擎各个模块的功能及其采用的技术进行研究后,本文详细分析了语音引擎采用的混音算法。它与传统的混音算法的不同之处在于,借助于静音检测技术,其将重点放在挑选非静音语音帧并对其进行迭加,而不是解决混音结果的溢出。随后在此基础上对语音引擎的结构以及混音算法进行改进,提出并实现了一种集中式混音架构。最后利用测试用例,对混音结果进行波形比较,确定了该集中式混音架构的实用性。(本文来源于《西安电子科技大学》期刊2013-02-01)

肖洪亮[7](2013)在《WebRTC语音引擎中分组缓存技术研究》一文中研究指出VoIP通信已经成为目前重要的和普遍的通信应用技术。随着移动互联网的发展,VoIP通信移动化已经成为了新的趋势,传统的VoIP面临着移动通信网带来的有别于有线网络的网络时延和抖动的问题。网络时延和抖动是影响VoIP语音质量的关键因素。为了消除时延抖动对语音质量的损伤,可以在接收端增设缓存区对具有时延抖动的数据分组进行缓存,从而消除抖动。但是,缓冲区同时却增加了整个通信过程的时延,尤其是在跨地域、跨运营商的3G网络上的VoIP通信,其时延抖动变化幅度较大,因此通过缓存造成的延迟也增大。选择合适的缓存大小和缓存控制算法成为新的挑战。面对新形势下的挑战,本文首先研究WebRTC语音引擎的缓存原理与缓存机制,并分析了WebRTC语音引擎应用在3G网络中时,在某些情况下语音延迟过大的原因。针对WebRTC语音引擎在3G网络存在的不足,提出了通过优化分组缓存机制来减小延迟问题的解决方案。此方案通过扩展静音检测技术的作用,根据通话时的语音活动状态和静默状态,将传统的静音检测技术根据辨识数据分组是否包含语音来提高编码效率,延展到在接收缓存过程根据分组是否包含语音采取不同的缓存策略,从而优化缓存时间并提高VoIP的服务质量。(本文来源于《西安电子科技大学》期刊2013-01-01)

王猛[8](2011)在《Instlink语音引擎的研究与实现》一文中研究指出目前VoIP越来越多的应用于全球IP互联的Internet环境中,并随着下一代网络体系的发展、全IP网络的逐渐应用获得更大的发展。而对于一个VoIP意义上的多方通信系统,语音业务作为其最传统的业务,也是最常用的业务,它的性能优劣是通信系统不可忽视的质量指标。低编码位率、鲁棒性好、适合无线环境的语音编码算法的重要性越来越明显。而且大多数的语音算法都有专利限制或者速率单一等问题,成为企业通信系统发展的制约因素。Speex是基于CELP的开源算法,集成窄带、宽带、超宽带的可变速率,能根据网络状况自适应的选择不同的语音编码速率,减少误帧和丢帧对话音的影响、以期获得尽量好的话音质量,但缺乏系统的语音引擎解决方案。本文首先介绍了关于语音编解码的基础知识,在对CELP关键算法原理分析的基础上,透彻研究了Speex语音编解码算法原理、算法所实现的特点、不同的编码模式及其体系的架构与其性能特点,对语音预处理的技术、Speex编码适应性、数据采集和原始编解码器的逻辑细节进行了系统的分析。在此基础上,结合Instlink多方通信系统,提出基于Speex编解码技术的语音引擎方案,实现其编码模块、解码模块、控制系统、混音模块,并在Instlink系统上运行。实现单端语音和会议语音功能。(本文来源于《西安电子科技大学》期刊2011-06-01)

陈亮蒿,李炜[9](2010)在《Windows平台下VoIP语音引擎的框架设计》一文中研究指出VoIP语音引擎,封装了语音编解码等一系列数据处理,可以快速集成至VoIP客户端,从而构成终端产品。基于Windows平台,本文主要讨论了录放音技术、回声消除技术,并对延迟抖动做了处理,以满足用户对语音质量的需求。(本文来源于《电信工程技术与标准化》期刊2010年10期)

谢晓钢,蔡骏,陈奇川,欧建林[10](2007)在《基于Speex语音引擎的VoIP系统设计与实现》一文中研究指出论述了一套基于Speex语音引擎和RTP的VoIP系统设计和开发,介绍了该系统服务器端和客户机端的软件实现。该系统具有点对点通信、算法延时小、丢包补偿和延时补偿性能好等特点,并具有多方通话功能。性能对比实验表明,该系统的通话质量优于几套流行的开源VoIP软件,能满足实际应用的要求。(本文来源于《计算机应用研究》期刊2007年12期)

语音引擎论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本设计是利用微软语音软件开发包Speech SDK,在VC++6.0的MFC平台下实现计算机语音识别的过程。通过对微软语音开发理论的学习与探索,了解MFC平台的开发与应用,掌握Microsoft Speech SDK(SAPI)在VC++6.0下的加载运行,设计出的在Windows系统下的人机交互语音识别系统。系统总体设计包含上位机设计和下位机设计,以上位机软件设计为主体设计部分,下位机部分作为功能扩展部分,其中下位机设计使用STC89C51单片机作为主控芯片。整个系统设计旨在为人们日常生活提供更多的便利。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语音引擎论文参考文献

[1].曹云,陈宗利,袁璐.基于语音引擎的工业设备状态信息化的实现[J].电脑知识与技术.2019

[2].刘欢.基于微软语音引擎的语音识别设计[J].电脑知识与技术.2017

[3].薛凯.中文语音引擎EKHO在Raspberrypi上的应用实例[J].电脑迷.2017

[4].李杨.利用TTS语音引擎设计英语听力练习软件[J].中小学电教(下).2013

[5].吴江锐.WebRTC语音引擎中NetEQ技术的研究[D].西安电子科技大学.2013

[6].王亚辉.基于WebRTC语音引擎的会议混音技术研究[D].西安电子科技大学.2013

[7].肖洪亮.WebRTC语音引擎中分组缓存技术研究[D].西安电子科技大学.2013

[8].王猛.Instlink语音引擎的研究与实现[D].西安电子科技大学.2011

[9].陈亮蒿,李炜.Windows平台下VoIP语音引擎的框架设计[J].电信工程技术与标准化.2010

[10].谢晓钢,蔡骏,陈奇川,欧建林.基于Speex语音引擎的VoIP系统设计与实现[J].计算机应用研究.2007

论文知识图

语音引擎工作工作流进近管制核心ATC指令的JSGF文法描述示例一6应用程序和语音引擎的通信关系系统数据流图语音生成驱动指令的框架图过程中转化的非确定有限自动机图4文法描述...

标签:;  ;  ;  ;  ;  ;  ;  

语音引擎论文_曹云,陈宗利,袁璐
下载Doc文档

猜你喜欢