语音质量评价论文-任美娜

语音质量评价论文-任美娜

导读:本文包含了语音质量评价论文开题报告文献综述及选题提纲参考文献,主要关键词:助听器,语音评价,聚类算法,MARS

语音质量评价论文文献综述

任美娜[1](2019)在《基于MARS的助听器语音质量评价方法研究》一文中研究指出随着老龄化社会的到来,听障人群数量越来越多。助听器作为改善听力的主要设备,其语音质量直接关系到听障患者的健康,因此准确合理地对助听器语音质量进行客观评价至关重要。如何依据医疗中积累的大数据,获取有效客观评价信息,具有重要的理论和实际价值。本课题提出了一种基于多元自适应回归样条法(Multivariate adaptive regression spline,MARS)的语音质量客观评价方法,并在此算法的基础上进行改进;设计聚类分析模型,基于MATLAB语言设计助听器语音质量客观评价平台;并通过仿真实验证明,本文所提出的MARS算法及改进的算法可以对助听器语音质量进行评价,改进的算法更准确。论文的主要研究工作如下:(1)搭建了助听器客观评估系统的测试平台,利用该平台建立助听器语音数据库。在时域和频域内研究语音信号的特征参数,设计并实现了助听器特征参数的提取。(2)提出采用MARS算法实现助听器的客观评估。该方法首先针对特征进行优选,然后建立助听器客观评价模型,给出客观评分。并提出一种考虑容错误差的算法准确率评价指标r,将其用于算法的效果验证,算法验证综合考虑其他叁个指标,结果表明算法有效。(3)针对传统的近邻传播聚类算法(AP)进行改进,提出了一种新的聚类算法—基于密度路径的半监督AP聚类算法(SMAP)。该算法首先对未知的样本数据进行半监督指导,其次基于密度路径,对传统的AP相似度“欧氏距离”进行改进,得出聚类模型。并通过分析实验仿真结果,总结算法性能评价指标,验证改进的算法有效可行,且准确度高。(4)在聚类分析的基础上,提出了一种基于MARS算法改进的助听器语音质量客观评价方法—SPMARS算法。该算法首先将语音数据聚类分成不同的类别,然后对不同类别数据分别进行MARS客观评价。通过仿真实验及算法评价指标,对改进算法进行验证,证实该算法可以准确地评价助听器语音质量。(本文来源于《华北电力大学(北京)》期刊2019-03-01)

张贵山[2](2019)在《基于深度学习的语音质量评价方法研究》一文中研究指出语音是人们信息交流中不可或缺的,语音质量直接决定了信息交流是否通畅,因此如何有效地对输出的语音质量进行评价是国内外研究者共同努力的目标。针对现有的无参考语音质量评价与主观评价结果相关性较低、无法满足市场需求的问题,本文对无参考的语音质量评价进行了研究。本文研究了一种栈式自动编码机(SAE)和BP神经网络相结合的语音质量评价方法。该方法由BP和SAE组成的深度神经网络实现。通过栈式自动编码机提取语音质量的本质特征,再将此特征通过BP神经网络与主观MOS分数进行映射。仿真结果表明,在集内和集外语种语音质量测试中,该方法与已有的ITU-T P.563和基于模糊有向图支持向量机(FDGSVM)的语音质量评价方法相比,降低了均方误差,提高了与主观评价的相关系数,但增加了评价时长。针对上述方法评价时间长的问题,本文采用精英选择和自适应步长改进的萤火虫算法融合到BP神经网络中去解决,研究了一种基于SAE和改进的BP神经网络相结合的语音质量评价新方法。该方法由SAE和改进的BP组成的深度神经网络实现。通过栈式自动编码机提取语音质量的本质特征,再将此特征通过改进的BP神经网络与主观MOS分数进行映射。仿真结果表明,该方法与SAE和BP相结合的语音质量评价方法相比,评价时长下降了67.30%,在集内语种的语音质量评价中,与主观评价的相关系数提高了16.57%,均方误差降低了10.06%,但是在集外语种的语音质量评价中,与主观评价的相关系数恶化了31.23%,均方误差恶化了22.85%。本方法适用于集内语种的语音质量评价,不适用于集外语种的语音质量评价。(本文来源于《哈尔滨理工大学》期刊2019-03-01)

王燃[3](2019)在《基于机器学习的VoLTE语音质量评价算法研究》一文中研究指出随着LTE系统的大规模商用和5G技术的不断发展,VoLTE(Voice over LTE,长期演进语音承载)的覆盖范围也在不断扩大,扩张速率不断加快,并在未来有可能全部取代窄带电话网络成为主流通信服务解决方案。在此背景下,如何灵活准确的评价VoLTE业务的用户满意程度日益成为运营商和研究人员所关注的重要问题。本论文研究VoLTE语音质量评价问题,主要工作及创新点如下:1.针对VoLTE语音的评价算法研究,本文建立了基于4G实网传输的VoLTE语料库,包含2万多条损伤样本,总时长超过60小时。为了模拟用户在实际通话中可能出现的多种场景,除最常见的通信质量较好的情况外,还设置了不同的损伤样本文件进行语音传输,损伤类型包括话音中断、单通、声音分贝变化等。得到损伤文件后与未损伤的语音文件进行对比并使用POLQA离线打分平台对损伤文件标注。2.提出了VoLTE语音质量的无参考评价NAVSQ(No-reference Assessment of VoLTE Speech Quality)算法。NAVSQ算法仅需要损伤信号即可进行评价,从损伤信号中提取44种语音特征参数进行VoLTE语音的量化描述,并使用GBDT(Gradient Boosting Decision Tree,梯度提升决策树)算法构建映射模型。与现有的无参考评价标准P.563算法相比,NAVSQ算法与测试样本的POLQA分数相关性可达0.95,RMSE为0.17,MAE为10.7%,误差较小,灵活性好,评价性能优于P.563。3.提出了VoLTE语音质量的全参考评价FAVSQ(Full-reference Assessment of VoLTE Speech Quality)算法。该算法与无参考算法的主要区别在于从参考信号和损伤信号的时域和频域提取了多种语音差异特征,作为对比信息输入模型,并使用GBDT决策树算法训练映射模型。通过与现有的全参考标准PESQ算法对比,FAVSQ算法对VoLTE语音的预测结果的相关性可达0.98,RMSE为0.57,MAE为9.1%,实现了更准确的VoLTE语音评价。(本文来源于《北京邮电大学》期刊2019-01-18)

杨明极,张贵山[4](2018)在《基于栈式自动编码机的语音质量评价方法》一文中研究指出针对现有的无参考语音质量评价与主观评价结果相关性较低、无法满足市场需求的问题,本文提出了一种基于栈式自动编码机(SAE)的无参考语音质量评价新方法.该方法由BP神经网络和SAE组成的深度神经网络实现.通过栈式自动编码机提取语音的本质特征,再将此特征通过BP神经网络与主观MOS分数进行映射.仿真结果表明,文中提出的算法与已有的ITUT P. 563和基于FSVM (模糊支持向量机)的语音质量评价方法相比,降低了均方误差,提高了与主观评价的相关系数.(本文来源于《小型微型计算机系统》期刊2018年10期)

王先冬[5](2018)在《VoLTE语音业务质量评价体系的研究和应用》一文中研究指出如今,移动通信技术支持的业务类型越来越丰富,然而,语音业务一直都是移动通信最基础的业务也是其优势所在。目前,我们正处在LTE系统大规模商用阶段,语音业务的承担载体已经从由电路域转变成了分组域。研究表明,VoLTE将是LTE系统中语音业务的主要解决方案。因此,如何提高VoLTE的用户体验以及语音业务质量是目前热门研究话题之一。论文依托于“教育部-中移动”科研基金项目,设计了VoLTE语音业务质量评价体系。其中协议解码方案保证了评价体系数据来源的准确度;提出了一种基于EWM(Entropy Weight Method,熵权法)与RNN(Random Neural Network,随机神经网络)的评价算法来对语音质量进行评价,满足了项目的准确、实时、客观评价的需求。本文的具体工作和成果如下:1.研究分析了LTE技术,VoLTE语音通信技术,协议解码技术以及神经网络等技术,设计了包括数据采集、消息解码、数据管理以及评价算法四个层次在内的评价体系。2.研究分析了VoLTE语音业务中KQI指标与KPI指标之间的关系,并且在协议解码的基础上建立了语音业务中KPI到KQI的映射模型,进而通过分析KPI对KQI进行预估。3.研究分析了VoLTE相关业务流程以及相关协议的消息结构,设计了RTP、RTCP、SIP等协议的解码流程与解码接口,并通过数据关联方案统计出相关参数,为准确地对VoLTE语音业务质量进行评价打下了基础。4.针对E-Model评价算法考虑参数少、不能满足项目提出的评价需求、复杂性较高等缺点,提出了一种基于熵权法与随机神经网络的客观评价算法,满足了准确、实时、客观评价的需求。最后,本体系在西南某小区测试运行,性能得到了验证,能够很好地对该地区的VoLTE语音业务质量进行评价。(本文来源于《重庆邮电大学》期刊2018-03-20)

管立斌[6](2017)在《LTE通信系统语音质量评价算法研究》一文中研究指出LTE移动通信系统是通过有效地语音通信系统实现的,从2G、2.5G、3G、4G逐步发展,实现信息传输速率水平的快速提升,信息频谱效率水平,网络容量、抗信道,抗干扰能力,网络兼容性都得到有效的提升。根据业务、技术实际的标准,移动通信网络兼容性受到有效的提升,业务、技术两个层面的通信系统快速发展。我国的LTE通信系统语音质量评价算法按照实际情况进行移动通信系统数据的分析,根据实际信息数据进行全面的融会分析,确定全球化信息LTE网络商业的有效运营过程。截止全球化的信息标准,合理的判断移动通信的主流发展地位,对宽带、频谱、效率、峰值数据等方面的各项内容进行合理的判断分析,确定通信语音业务实际的基础标准。移动通信的网络结构存在复杂的接口问题,需要采用合理的调度和管理方式,明确移动通信系统的语音质量标准,评估效果,通信体验方式等,不断提升运营设备商业服务质量的媒体业务发展管理效果。(本文来源于《决策探索(中)》期刊2017年11期)

杨英杰,赵万马,王冲[7](2017)在《引入包分析的E-Model语音质量评价模型改进》一文中研究指出为了能够更加准确地评价语音包丢失对基于IP的语音传输(voice over internet protocol,Vo IP)的语音质量的损伤,对ITU-T G.107建议书提出的语音质量预测模型E-Model中计算丢包与编码造成的损伤Ie-eff的方法作出改进,在综合考虑语音包的内部特性和存在突发连续丢包情况后,提出利用在固定语音长度下,语音实际损失时间Tloss来衡量语音包丢失造成的语音损伤。仿真结果表明,相比原有模型,改进后的模型得到的语音质量评分同主观语音质量评估方法(perceptual evaluation of speech quality,PESQ)评分相比,皮尔森相关系数平均提高了0.045 8,均方根误差平均降低了0.053 4,改进后的E-Model模型在评价语音质量时与PESQ更具有一致性,可以更为准确地预测Vo IP通信的语音质量。(本文来源于《重庆邮电大学学报(自然科学版)》期刊2017年02期)

康健[8](2017)在《音频质量评价和语音识别预处理技术的研究及实现》一文中研究指出近年来随着移动终端设备的普及,人们之间的语音交流越来越频繁,因此对于音频的质量也逐渐重视起来。由于在不同环境下产生的音频质量参差不齐,质量较差的音频会对人们的听觉感受造成较大的影响,所以准确地对音频质量进行评价并针对较差的音频进行有效地增强处理变得越来越重要。目前国内外针对音频质量评价和语音预处理等技术做了大量的研究工作,也有一些卓有成效的研究成果被提出。但针对音频质量评价的可行方案仍然比较少,而且没有一个标准的可行方案,相关研究成果也相对不足。在音频质量增强方面,国内外研究人员提出了一些解决方案,但是这些方案仍有比较大的局限性,只能在某些特定场景下应用,通用性较差。针对上述问题,本文做了以下研究工作:首先,对音频质量评价的目标和意义进行了介绍,其次,对现有的音频质量评价方案进行了深入的研究,分析了现有方案的原理和优缺点,然后对音频的主要应用场景进行了深入了解,最后在现有方案的基础上提出了一套比较有效的评价方案并介绍了相关计算方法。在对语音识别预处理技术的研究中,本文首先对语音增强技术中的着名方法进行了研究,详细地了解了这些方法的原理和优缺点,然后在此基础之上提出了一种基于Speex开源库的改进的短时谱估计语音增强方法。该方法在消除背景杂音的同时还可以有效避免电平噪声的出现,针对不同的音频应用场景,在客观识别率与人耳主观试听方面达到了一个比较理想的平衡,同时本系统可以自由设定降噪力度、人声增强的幅度等参数,提高了音频预处理系统的灵活性,相较于传统的语音降噪方法,在语音识别的准确率方面提升了 13%左右。(本文来源于《北京邮电大学》期刊2017-01-17)

王霞,马俊晖,王光艳,张艳[9](2017)在《面罩语音质量评价算法适用性研究》一文中研究指出针对语音编码的音质评价算法性能已十分明确,但对于面罩语音不一定适用。讨论了语音质量评价算法对空气语音与面罩语音在不同噪声环境下的适用性。采用主观意见得分和叁种客观评价测度对多种信噪比的带噪语音和增强语音进行评价,包括分段信噪比、改进的巴克谱失真(MBSD)和语音感知质量评价(PESQ),根据与主观评价的一致性判断客观评价方法的适用性。增强算法采用维纳滤波法和对数谱最小均方误差法(LSA-MMSE),噪声采用粉红噪声、海浪噪声。仿真结果表明,语音质量评价算法的适用性与语音类型、信噪比、背景噪声、增强算法种类有关。粉红噪声环境下,PESQ不适合评价经维纳滤波增强的空气语音;MBSD算法只适用于评价经LSA-MMSE增强的面罩语音。海浪噪声环境下,PESQ适用于评价面罩语音,MBSD不适合评价面罩语音。(本文来源于《计算机工程与应用》期刊2017年19期)

徐集优[10](2016)在《融合语音情感的英语发音质量评价研究及应用系统设计》一文中研究指出语音情感是语音信号中的重要信息,在语言习得“输入-输出”路径中,也是重要的输入和输出要素。英语朗读题发音质量计算机自动评价技术,虽然已经有许多成果,但目前的研究大多围绕音准、流利度、节奏、语调等指标,鲜有学者将语音情感作为其中的一个指标进行单独评价。情景化口语教学是一种趋势,在面向语料情感丰富的情景化口语朗读题发音质量评价时,现有的评价指标和方法,显然有局限性。语音情感自动识别技术,是语音信号处理与机器学习相结合的热门学科,在情感分类、语料库建立过程、特征提取、识别方法和成果应用等方面,都有可借鉴的成果。在这种背景下,本文将发音质量评价与语音情感相结合,对语音情感特征选择、语音情感发音质量评价方法、多指标融合的发音质量综合评价方法、应用系统设计等问题进行了研究,提出了一系列针对这些问题的应对方法。本文的主要研究工作包括:(1)分析了不同语音情感特征的贡献度。本文筛选了36个覆盖能量、基频、共振峰、基音尾部斜率和语速的语音信号数据,作为语音情感特征。使用主成分分析法,进行特征优化,提取了累计贡献率达到95%的前19个主成分,并计算各原始特征对主成分的线性贡献值。(2)设计语音情感发音质量评价方法。本文继承了目前比较成熟的基于后验概率的音准评价方法的思想,利用分类器的软分类特性,将识别问题转换为评分问题。支持向量机(SVM)作为是一种有效的语音情感识别方法,使用SVM的置信概率输出值,作为评价结果的度量。面对SVM核函数和参数选择难的问题,使用粒子群算法进行参数优化。考虑到语料评价数据不平衡现象,采用不充分抽样法,采用基于Bagging的多分类器均值作为评价结果。通过均值和方差数据分析,并使用单因素方差分析进行验证,证明本文的情感评价方法有效。(3)设计基于决策树的多指标融合的发音质量评价方法。传统的多元线性回归方法,不适用于本文的语料库和应用场景。本文提出决策树结构,与评分员的整体评分过程类似,使用ID3(Interactive Dicremiser version3)算法构建音准、节奏、语调、语速和情感5个指标的综合评价决策树。通过实验证明,本文的人机评价精确一致率为73.9%,相邻一致率为93.8%,人机评价结果的Pearson相关系数值为0.81,数据结果证明,本文的评价方法是可信的。(4)开发一套口语学习系统。学习者可以通过系统,模仿朗读电影配音,系统可以对学习者提交的录音,进行多个指标的评价。教师可以通过多元化的数据统计结果,了解学生口语水平,并对其实施个性化教学。(本文来源于《广东外语外贸大学》期刊2016-04-25)

语音质量评价论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

语音是人们信息交流中不可或缺的,语音质量直接决定了信息交流是否通畅,因此如何有效地对输出的语音质量进行评价是国内外研究者共同努力的目标。针对现有的无参考语音质量评价与主观评价结果相关性较低、无法满足市场需求的问题,本文对无参考的语音质量评价进行了研究。本文研究了一种栈式自动编码机(SAE)和BP神经网络相结合的语音质量评价方法。该方法由BP和SAE组成的深度神经网络实现。通过栈式自动编码机提取语音质量的本质特征,再将此特征通过BP神经网络与主观MOS分数进行映射。仿真结果表明,在集内和集外语种语音质量测试中,该方法与已有的ITU-T P.563和基于模糊有向图支持向量机(FDGSVM)的语音质量评价方法相比,降低了均方误差,提高了与主观评价的相关系数,但增加了评价时长。针对上述方法评价时间长的问题,本文采用精英选择和自适应步长改进的萤火虫算法融合到BP神经网络中去解决,研究了一种基于SAE和改进的BP神经网络相结合的语音质量评价新方法。该方法由SAE和改进的BP组成的深度神经网络实现。通过栈式自动编码机提取语音质量的本质特征,再将此特征通过改进的BP神经网络与主观MOS分数进行映射。仿真结果表明,该方法与SAE和BP相结合的语音质量评价方法相比,评价时长下降了67.30%,在集内语种的语音质量评价中,与主观评价的相关系数提高了16.57%,均方误差降低了10.06%,但是在集外语种的语音质量评价中,与主观评价的相关系数恶化了31.23%,均方误差恶化了22.85%。本方法适用于集内语种的语音质量评价,不适用于集外语种的语音质量评价。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语音质量评价论文参考文献

[1].任美娜.基于MARS的助听器语音质量评价方法研究[D].华北电力大学(北京).2019

[2].张贵山.基于深度学习的语音质量评价方法研究[D].哈尔滨理工大学.2019

[3].王燃.基于机器学习的VoLTE语音质量评价算法研究[D].北京邮电大学.2019

[4].杨明极,张贵山.基于栈式自动编码机的语音质量评价方法[J].小型微型计算机系统.2018

[5].王先冬.VoLTE语音业务质量评价体系的研究和应用[D].重庆邮电大学.2018

[6].管立斌.LTE通信系统语音质量评价算法研究[J].决策探索(中).2017

[7].杨英杰,赵万马,王冲.引入包分析的E-Model语音质量评价模型改进[J].重庆邮电大学学报(自然科学版).2017

[8].康健.音频质量评价和语音识别预处理技术的研究及实现[D].北京邮电大学.2017

[9].王霞,马俊晖,王光艳,张艳.面罩语音质量评价算法适用性研究[J].计算机工程与应用.2017

[10].徐集优.融合语音情感的英语发音质量评价研究及应用系统设计[D].广东外语外贸大学.2016

标签:;  ;  ;  ;  

语音质量评价论文-任美娜
下载Doc文档

猜你喜欢