导读:本文包含了语音特征论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语音,特征,官话,谱系,声学,基音,深度。
语音特征论文文献综述
郭卉,姜囡,任杰[1](2019)在《基于MFCC和GFCC混合特征的语音情感识别研究》一文中研究指出针对MFCC滤波器存在语音高频信号泄露的问题,为避免基于MFCC特征对语音进行情感识别时存在有效情感特征丢失的局限性,结合MFCC的高准确性和GFCC的强鲁棒性,提出了基于MFCC与GFCC混合特征训练CNN对语音进行情感识别的方法,有效提高了语音情感识别的准确率,改善了CNN模型的识别性能。实验结果表明,所设计的混合特征识别方法较传统识别方法识别率明显升高并达到了83%,实现了语言情感识别准确率的有效提升。(本文来源于《光电技术应用》期刊2019年06期)
王卫梅,王雁,贾海蓉[2](2019)在《Gammatone域特征在IRM-DBN语音增强中的有效性研究》一文中研究指出对于在噪声背景下的深度学习来说,好的特征提取能极大地提高语言增强的性能.研究在深度信念网络中,以目前性能最好的理想浮值掩蔽为学习目标,验证Gammatone域特征的语音增强效果优于其他域特征.首先,分别提取在不同噪声不同信噪比下的基于Gammatone域的语音特征,根据纯净语音和噪声计算得到初始理想浮值掩蔽;其次,采用深度信念网络作为学习模型,从训练带噪语音特征中学习得到估计的理想浮值掩蔽;最后,利用测试语音特征和估计的理想浮值掩蔽合成增强语音,分析所用特征的有效性.实验结果表明:基于Gammatone域的语音特征比其他域特征的各种性能评价指标值更高,明显提高了语音质量,增强效果更佳.(本文来源于《内蒙古大学学报(自然科学版)》期刊2019年06期)
陈太波,张翠芳[3](2019)在《多特征和SVM改进的语音关键词识别系统》一文中研究指出本文在HMM/Filler模型的基础上,通过对汉语的408个音节建立支持向量机(SVM)分类器提升了HMM系统的识别率,这408个SVM音节分类器有助于全面支持关键词的动态设定.针对SVM分类器训练数据的定长要求,本文通过对关键词特征帧进行等长化处理,使得对音节分类的SVM分类器得以训练.进一步,为了调节系统的融合性,本文提出概率融合公式,即通过设定融合参数λ来调整SVM分类器对HMM/Filler的作用程度.实验结果表明,当融合参数λ=0. 3时,SVM与HMM/Filler融合的关键词识别系统效果最佳,此时融合系统相对于HMM/Filler基线系统识别率有着6. 74%的提升,多特征训练的融合系统相对于单特征训练的HMM/Filler基线系统识别率提升近10%.(本文来源于《小型微型计算机系统》期刊2019年11期)
薛才德[4](2019)在《山西及其周边方言共有的一个语音特征》一文中研究指出文章通过比较北方官话各个代表点有关通梗臻叁摄见系合口叁等韵、臻摄精组合口叁等韵等的分合情况,认为可以据此将山西及周边的方言与其他北方官话划分开来。进一步来说,也就是可以将晋语与江淮官话划分开来。也许将通梗臻叁摄见系合口叁等韵、臻摄精组合口叁等韵等合为一个韵母可以作为晋语的一个区别性语音特征。(本文来源于《语言研究集刊》期刊2019年02期)
郭乐乐,曹辉,李涛[5](2019)在《有效特征参数分类正常与病理语音》一文中研究指出采用残差信号的特征参数——基音幅值(Pitch Amplitude, PA)和频谱平坦度(Spectral Flatness of the Residue Signal, SFR)与语音信号倒谱域特征参数——倒谱峰值突出(Cepstral Peak Prominence, CPP)来区分正常与病理语音,在萨尔布吕肯语音数据库中选择自然音调的正常与病理语音/a/进行仿真实验。统计结果表明,与正常语音相比,病理语音的PA较小,SFR更接近零,CPP也较小。结合其他传统特征参数分析对比,证明SFR、PA和CPP更能有效分类正常与病理语音。通过不同分类算法比较,得出支持向量机的分类准确率相对更高。(本文来源于《声学技术》期刊2019年05期)
李娟娟,王丹,李子晋[6](2019)在《基于深层声学特征的端到端语音分离》一文中研究指出提出基于深层声学特征的端到端单声道语音分离算法,传统声学特征提取方法需要经过傅里叶变换、离散余弦变换等操作,会造成语音能量损失以及长时间延迟.为了改善这些问题,提出了以语音信号的原始波形作为深度神经网络的输入,通过网络模型来学习语音信号的更深层次的声学特征,实现端到端的语音分离.客观评价实验说明,本文提出的分离算法不仅有效地提升了语音分离的性能,也减少了语音分离算法的时间延迟.(本文来源于《计算机系统应用》期刊2019年10期)
刘景天,姜囡[7](2019)在《基于混合特征的说话人语音分割聚类研究》一文中研究指出研究众多说话人语音中提取目标说话人语音的问题。为提高多说话人语音分割聚类的准确性,结合MFCC特征高准确性和GFCC特征强鲁棒性的特点,提出一种基于MFCC与GFCC混合特征的语音分割聚类算法,有效避免了含噪语音分割聚类鲁棒性较差等问题。针对迭加粉红噪声和工厂噪声的实验语音,分别基于常规算法和改进的分割聚类算法进行对比分析,结果表明,所提出的基于混合特征的语音分割聚类算法提取目标人语音的准确性更具优势。(本文来源于《光电技术应用》期刊2019年05期)
任杰,郭卉,姜囡[8](2019)在《不同情感的语音声学特征分析》一文中研究指出针对说话人情感因素对语音特征的影响进行研究分析,选择同一个人在生气、害怕、高兴、中性、惊讶、悲伤六种情感下语音的共振峰频率特征、共振峰走向特征、音节的过渡特征、基频曲线特征以及振幅曲线特征,分析比对不同情感的语音声学特征的相似性和差异性。分析结果表明,同一说话人在不同情感下的语音声学特征的共振峰走向特征相似度高,共振峰频率、基频曲线及振幅曲线特征存在非本质差异,是个体自身的差异。对不同情感的语音进行声学特征分析可以为语音情感识别奠定基础。(本文来源于《光电技术应用》期刊2019年05期)
杨璐铭,蓝常山,张学海[9](2019)在《年龄增长与语音特征变化初探》一文中研究指出采集4名成年人前后两次间隔19~26年的语音样本,输入语音工作站,分别对每个人前后时间段所发的相同音节的宽带声纹图谱进行分析比对。结果显示,同一人在所处不同年龄阶段所发生的相同音节能量分布状态表现前后一致,符合点的数量占绝对优势,均反映了同一人发生这些音节时的发音器官特点和发音习惯特点不变的稳定性。因此得出,一个人从壮年期至中年期发音习惯、语音本质特征不存在显着变化。(本文来源于《广东公安科技》期刊2019年03期)
周挺,杨荣[10](2019)在《多媒体网络语音音调数据特征智能识别方法》一文中研究指出利用传统方法对多媒体网络语音音调数据特征进行识别,存在识别准确性低,识别速度慢的问题。针对上述问题,提出一种新的多媒体网络语音音调数据特征智能识别方法。该方法分为叁部分:第一对输入的多媒体网络语音音调数据进行预处理,包括数据转换、预加重、分帧加窗和端点检测等4步;第二提取预处理数据特征参数,包括基音频率、共振峰、mel倒谱系数;第叁利用GMM-SVM模型在提取到的特征参数基础上进行智能识别。结果表明:利用本方法对多媒体网络语音音调数据特征进行智能识别,与基于人工神经网络的语音特征识别方法和基于蚁群算法特征选择的语音识别方法相比,平均正确识别率提高8.3%和12.4%,平均所用时间减少0.7 s和1.24 s,识别速度加快。(本文来源于《自动化与仪器仪表》期刊2019年09期)
语音特征论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
对于在噪声背景下的深度学习来说,好的特征提取能极大地提高语言增强的性能.研究在深度信念网络中,以目前性能最好的理想浮值掩蔽为学习目标,验证Gammatone域特征的语音增强效果优于其他域特征.首先,分别提取在不同噪声不同信噪比下的基于Gammatone域的语音特征,根据纯净语音和噪声计算得到初始理想浮值掩蔽;其次,采用深度信念网络作为学习模型,从训练带噪语音特征中学习得到估计的理想浮值掩蔽;最后,利用测试语音特征和估计的理想浮值掩蔽合成增强语音,分析所用特征的有效性.实验结果表明:基于Gammatone域的语音特征比其他域特征的各种性能评价指标值更高,明显提高了语音质量,增强效果更佳.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语音特征论文参考文献
[1].郭卉,姜囡,任杰.基于MFCC和GFCC混合特征的语音情感识别研究[J].光电技术应用.2019
[2].王卫梅,王雁,贾海蓉.Gammatone域特征在IRM-DBN语音增强中的有效性研究[J].内蒙古大学学报(自然科学版).2019
[3].陈太波,张翠芳.多特征和SVM改进的语音关键词识别系统[J].小型微型计算机系统.2019
[4].薛才德.山西及其周边方言共有的一个语音特征[J].语言研究集刊.2019
[5].郭乐乐,曹辉,李涛.有效特征参数分类正常与病理语音[J].声学技术.2019
[6].李娟娟,王丹,李子晋.基于深层声学特征的端到端语音分离[J].计算机系统应用.2019
[7].刘景天,姜囡.基于混合特征的说话人语音分割聚类研究[J].光电技术应用.2019
[8].任杰,郭卉,姜囡.不同情感的语音声学特征分析[J].光电技术应用.2019
[9].杨璐铭,蓝常山,张学海.年龄增长与语音特征变化初探[J].广东公安科技.2019
[10].周挺,杨荣.多媒体网络语音音调数据特征智能识别方法[J].自动化与仪器仪表.2019