导读:本文包含了说话人论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:说话,谱系,频谱,语音,擦音,卷积,包络。
说话人论文文献综述
茅正冲,王俊俊,黄舒伟[1](2019)在《基于PLDA信道补偿的说话人识别算法》一文中研究指出近年来,针对说话人识别算法普遍受到信道因素的干扰问题,研究者提出使用总变化因子分析的识别方法对语音信道进行补偿得到了很不错的效果,其中概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)因其表现优异而受到学者们的关注。然而,高斯PLDA模型中I-Vector并非符合标准正态分布。因此论文在特征域利用特征弯折算法对梅尔倒谱系数(MFCC)进行处理,以消除背景噪声以及线性信道的影响。然后在模型域对I-Vector进行非线性转换使其分布更适合用PLDA模型区分说话人,以提高说话人识别系统的识别率。实验结果表明,使用传统GMM/UBM的系统,在NIST SRE-2010评估数据集上使用所提议的技术获得了很好的效果。(本文来源于《计算机与数字工程》期刊2019年11期)
王铮,傅山[2](2019)在《基于改进身份向量提取的短语音说话人确认》一文中研究指出针对现有i-vector说话人确认系统在测试语音为短语音时性能下降的问题,对短语音i-vector估计的不确定性进行分析,改进了i-vector提取中Baum-Welch统计量的计算.该方法利用赋予权重的历史测试信息以及通用背景模型中的参数信息来增加用于短语音Baum-Welch统计量计算的说话人个性信息.将改进统计量用于i-vector提取,针对不同时长短语音的实验表明,新系统的性能优于当前i-vector系统,等错误率(EER)和检测代价函数最小值(min DCF)分别下降了13~19%和8~23%.(本文来源于《小型微型计算机系统》期刊2019年11期)
谭萍,邢玉娟[3](2019)在《面向说话人识别的甘肃临夏少数民族方言语音库的建设》一文中研究指出面向方言的说话人识别研究刚刚起步,因此建设一个用于说话人识别的、符合地域特色的方言语音库迫在眉睫.本文结合甘肃临夏回族自治州方言的特点,构建一个面向说话人识别的方言语音库.语音库包含普通话和方言音频资料,使用电脑和手机两种方式采集,所有语料内容涉及文化、教育、生活、情感、历史、新闻、评论等,录音者由来自临夏回族自治州的100人组成,共产生了语音语料2 400条,为基于甘肃少数民族方言的说话人识别研究奠定了基础.(本文来源于《兰州文理学院学报(自然科学版)》期刊2019年06期)
张翠玲,丁盼[4](2019)在《擦音LPC倒谱特征在法庭说话人识别中的应用》一文中研究指出为了探究擦音在法庭说话人识别中的应用价值,以汉语普通话擦音/s/为代表,对其LPC倒谱特征的说话人识别性能进行了分析测试。基于90位成年男性的两次非同时语音样本数据库,采用似然比框架的法庭证据强度评估方法,对/s/的LPC倒谱特征在不同语音信号频率范围和不同数据库规模条件下进行了说话人识别性能的测试评价。研究结果表明,擦音的LPC倒谱特征具有一定的话者区分价值,但是作为单一识别参数使用价值有限,应该与其他参数特征结合使用,以提高法庭说话人识别的准确性和可靠性。(本文来源于《中国刑警学院学报》期刊2019年05期)
黄猛,唐琳,王雅芬[5](2019)在《说话人识别技术综述》一文中研究指出当前说话人识别技术得到了长足的发展和广泛应用,在分析说话人识别基本原理的基础上,对说话人识别技术研究现状进行了总结,重点分析了当前主流的语音预处理、特征参数提取以及识别模型等方法,并对今后说话人识别技术的研究方向进行了展望。(本文来源于《第十叁届全国信号和智能信息处理与应用学术会议论文集》期刊2019-10-25)
刘景天,姜囡[6](2019)在《基于混合特征的说话人语音分割聚类研究》一文中研究指出研究众多说话人语音中提取目标说话人语音的问题。为提高多说话人语音分割聚类的准确性,结合MFCC特征高准确性和GFCC特征强鲁棒性的特点,提出一种基于MFCC与GFCC混合特征的语音分割聚类算法,有效避免了含噪语音分割聚类鲁棒性较差等问题。针对迭加粉红噪声和工厂噪声的实验语音,分别基于常规算法和改进的分割聚类算法进行对比分析,结果表明,所提出的基于混合特征的语音分割聚类算法提取目标人语音的准确性更具优势。(本文来源于《光电技术应用》期刊2019年05期)
谭良杰,刘亚丽[7](2019)在《噪声对跨语种说话人音色感知的影响》一文中研究指出0引言在全球化以及多民族、多文化相互交融的时代背景下,人们使用的语言通常不止一种。因此,跨语种的说话人识别逐渐成为研究的热点[1]。国内外对于跨语种说话人识别的研究已经有所收获,但是有关工作主要集中在通过改进算法从而提高识别准确性,对说话人相关的个性化特征以及不同传递条件下的说话人识别方面的研究较少,例如如何在噪声条件下提高说话人识别的鲁棒性等。(本文来源于《2019年全国声学大会论文集》期刊2019-09-21)
卜禹,陆璐璐[8](2019)在《基于深度学习及核典型相关分析的多特征融合说话人识别》一文中研究指出论文提出一种基于深度学习以及核典型相关分析(kernel canonical correlation analysis,CCA)的多特征融合说话人识别方法。针对说话人的音频和视频信息,利用深度信念网络和卷积神经网络这两种不同深度的神经网络对音频信息和视频信息分别并行处理,得到两种不同模态的生物特征向量。采用核典型相关分析方法对这两种非线性相关的特征向量进行特征级融合,使用它们的相关性判别函数抽取多个相关性顺次下降但又互不相关的典型变量对按照给定的特征级融合策略构成最后的判别特征,同时去除了冗余信息。最后生成的基于核典型关联分析的融合特征输入最近邻分类器,输出说话人识别结果。使用BANCA数据库对该方法进行实验,结果表明:该方法能显着提高说话人识别的准确率。(本文来源于《计算机与数字工程》期刊2019年09期)
古斌,郭武[9](2019)在《说话人确认中基于无监督聚类的得分规整》一文中研究指出在说话人确认任务中,得分规整可有效调整测试得分分布,使每个说话人的得分分布接近同一分布,从而提升系统整体性能。直接从开发集中获得针对待识别目标说话人的大量冒认者得分,利用无监督聚类手段对这些得分进行筛选,并采用混合高斯模型来拟合得分分布,挑选均值最大的高斯单元作为得分规整的参数并将其应用于说话人的得分规整。在NIST SRE 2016测试集上的测试结果表明,相对于其他得分规整算法,采用无监督聚类得分规整的方法可有效提升系统性能。(本文来源于《数据采集与处理》期刊2019年05期)
王文超,黎塔[10](2019)在《基于多时间尺度的深层说话人特征提取研究》一文中研究指出在说话人识别领域中,通过深度神经网络学习深层说话人特征的方法成为了研究热点。然而,针对人类听觉系统是如何处理声音信息的研究,却没有得到说话人识别研究人员足够的重视。这些生物学的研究表明,人类大脑是通过一种利用了多维时间尺度的处理模式对声音信息进行解析的。基于这些研究,本文提出了一种双通道神经网络模型,其中一条通道处理短时间尺度(即局部)特征,另一条处理长时间尺度(即全局)特征。两种局部特征融合形成可用于说话人识别的声纹特征,称之为t-vector。在RSR2015 Part3文本相关数据集上进行的检测说话人识别系统性能的实验结果表明,不同时间尺度的特征可以互补,并且融合的t-vector特征也优于i-vector和d-vector特征。(本文来源于《网络新媒体技术》期刊2019年05期)
说话人论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对现有i-vector说话人确认系统在测试语音为短语音时性能下降的问题,对短语音i-vector估计的不确定性进行分析,改进了i-vector提取中Baum-Welch统计量的计算.该方法利用赋予权重的历史测试信息以及通用背景模型中的参数信息来增加用于短语音Baum-Welch统计量计算的说话人个性信息.将改进统计量用于i-vector提取,针对不同时长短语音的实验表明,新系统的性能优于当前i-vector系统,等错误率(EER)和检测代价函数最小值(min DCF)分别下降了13~19%和8~23%.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
说话人论文参考文献
[1].茅正冲,王俊俊,黄舒伟.基于PLDA信道补偿的说话人识别算法[J].计算机与数字工程.2019
[2].王铮,傅山.基于改进身份向量提取的短语音说话人确认[J].小型微型计算机系统.2019
[3].谭萍,邢玉娟.面向说话人识别的甘肃临夏少数民族方言语音库的建设[J].兰州文理学院学报(自然科学版).2019
[4].张翠玲,丁盼.擦音LPC倒谱特征在法庭说话人识别中的应用[J].中国刑警学院学报.2019
[5].黄猛,唐琳,王雅芬.说话人识别技术综述[C].第十叁届全国信号和智能信息处理与应用学术会议论文集.2019
[6].刘景天,姜囡.基于混合特征的说话人语音分割聚类研究[J].光电技术应用.2019
[7].谭良杰,刘亚丽.噪声对跨语种说话人音色感知的影响[C].2019年全国声学大会论文集.2019
[8].卜禹,陆璐璐.基于深度学习及核典型相关分析的多特征融合说话人识别[J].计算机与数字工程.2019
[9].古斌,郭武.说话人确认中基于无监督聚类的得分规整[J].数据采集与处理.2019
[10].王文超,黎塔.基于多时间尺度的深层说话人特征提取研究[J].网络新媒体技术.2019