说话人分类论文开题报告文献综述

说话人分类论文开题报告文献综述

导读:本文包含了说话人分类论文开题报告文献综述、选题提纲参考文献,主要关键词:说话,向量,特征,稀疏,音素,神经网络,协方差。

说话人分类论文文献综述写法

闫杰,朱晓莲,谢磊,李鹏,梁家恩[1](2017)在《基于Bottleneck特征和i-vector的说话人年龄分类》一文中研究指出说话人年龄分类是语音处理中一个极具挑战性的任务,其关键在于如何提取具有判别性和鲁棒性的特征去构建分类器。近年来以DNN为代表的深度学习技术在语音识别等任务上的成功应用促使我们尝试使用神经网络去改进年龄分类系统。本文提出使用DNN提取Bottleneck特征去构建年龄分类系统的方法,同时结合Bottleneck特征和原始声学特征进行i-vector建模。在aGender语料库上的实验结果表明,该系统的总体分类正确率达到56.11%,比仅使用传统声学特征的系统相对提高18%。同时,随着BN特征维数的增加,整体分类正确率也会有进一步提高。(本文来源于《第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集》期刊2017-10-11)

马啸空,郭武[2](2016)在《采用音素分类的因子分析说话人识别方法》一文中研究指出提出一种利用深度神经网络和语音学知识进行文本无关的说话人识别的方法.采用深度神经网络(Deep Neural Netw ork,DNN)来进行有监督的因子分析建模方法是目前与文本无关说话人识别的研究热点,在此基础上挖掘了不同的音素对识别性能的影响.首先根据语音学知识对DNN的输出节点进行分类,在说话人建模过程中,根据不同的类别来提取不同的后验因子(i-vectors),然后采用拼接的方式得到一个高维的i-vector用于话者识别.在NIST SRE 2012的核心测试任务上,相对于无监督的全空间变量因子分析与基于DNN的因子分析方法,提出的算法都有不同程度的性能提升.综合来看,超过了目前已知的最佳系统性能.(本文来源于《小型微型计算机系统》期刊2016年09期)

邢玉娟,谭萍[3](2016)在《基于稀疏表示分类的说话人识别算法及其在智能考勤系统中的应用》一文中研究指出智能考勤系统在企业对员工的出勤考查中具有十分重要的作用。为了提高语音考勤系统的准确性,提出基于稀疏表示的说话人识别算法。该算法在通用背景模型的基础上提取说话人语音的高斯混合模型超向量,采用线性判别分析技术对超向量进行信道补偿和降维,再由低维超向量形成稀疏表示的过完备字典。根据话者测试语音在过完备字典上的重构误差,对话者的身份进行验证。实验结果表明,基于稀疏表示分类的语音考勤系统具有良好的性能。(本文来源于《工业仪表与自动化装置》期刊2016年02期)

胡青,刘本永[4](2016)在《基于卷积神经网络分类的说话人识别算法》一文中研究指出由于经典的说话人识别算法都是将特征提取和模式分类分开进行的,这导致特征的选取对分类影响很大,更增加了算法的复杂度。利用卷积神经网络(CNN)的结构优势,文章提出一种基于卷积神经网络分类的说话人识别算法。算法首先对原始语音信号计算语谱图,对获得的语谱图采用卷积神经网络进行分类,分类的结果即为类别。通过真实语音库和TIMIT库测试表明,本算法取得了较高的识别率,说明这是一种有效的说话人识别方法。(本文来源于《信息网络安全》期刊2016年04期)

谭萍,邢玉娟[5](2016)在《基于GMM超向量和Fisher-稀疏表示分类的说话人确认》一文中研究指出针对说话人确认识别率低且易受到信道干扰的问题,提出一种基于GMM超向量和Fisher判别准则的稀疏分类算法。该算法首先采用GMM通用背景模型生成说话人的GMM超向量,在超向量集上利用类内协方差归一化方法抑制信道的干扰信息,通过计算GMM超向量与整体训练样本集的Fisher判别比来选择更具区分度的语音特征向量,构建高判别性的稀疏性过完备字典。最后,在过完备字典上对语音GMM超向量进行重构,选择重构误差最小的类别作为目标说话人。仿真实验结果表明:Fisher判别准则在稀疏性过完备字典的构建过程中具有较好的特征选择优势,可以提高稀疏分类的准确性。(本文来源于《青海大学学报(自然科学版)》期刊2016年01期)

张燕[6](2015)在《语音画像中说话人分类特点研究:语篇信息视角》一文中研究指出语音画像在绑架案,电话诈骗,假报警等案件中起着提供嫌疑人特征,缩小侦查范围的重要作用。国内外关于语音画像参数的研究都相对较少。因此,本文的研究目的在于从语篇信息分析角度丰富语音画像的分析参数。本研究采用定性研究的方法。首先,借助Phil Rose提出的语音画像参数分类及杜金榜教授的语篇树状信息结构理论,提出论文框架。其次,通过语篇树状信息结构理论分析真实语料,得出一套可行的参数。最后再通过实验,并结合PRAAT语音分析仪器,验证参数的可靠性。研究结果显示,信息成分和信息点、信息结构和信息流等参数都是很有效的获取说话者生理、社会和个人特征的参数。但是,这些参数在真实语料中的有效性大于在模拟语料中的有效性。本研究从新的视角,即语篇信息理论的角度,为语音画像提出了一套可行的参数。它丰富了语音画像的参数,并拓展了语篇信息理论的实际应用。笔者希望此研究可帮助办案人员缩小侦查范围,锁定犯罪嫌疑人。同时,也为指控犯罪者提供相应的语言学证据,促进法律语言学在社会活动中的实际应用。(本文来源于《广东外语外贸大学》期刊2015-06-23)

邢玉娟,曹晓丽,谭萍,李恒杰[7](2016)在《基于WLDA和i-稀疏表示分类的说话人确认》一文中研究指出为了提高信道变化下说话人确认系统的识别率和鲁棒性,提出一种基于i-向量和加权线性判别分析的稀疏表示分类算法。首先借助于加权线性判别分析的信道补偿和降维性能,消除i-向量中信道干扰信息并降低i-向量的维数;紧接着在i-向量集上构建训练语音样本过完备字典矩阵,采用MAP算法求解测试语音在字典矩阵上的稀疏系数向量,最后利用稀疏系数向量重构测试语音样本,根据重构误差确定目标说话人。仿真实验结果验证了该算法的有效性和可行性。(本文来源于《计算机工程与应用》期刊2016年13期)

吴蔚澜,张卫强,刘巍巍,田垚,陈振锋[8](2014)在《说话人识别中基于音素分类的数据选择方法》一文中研究指出在说话人识别中,有效语音数据的选择是一个重要的预处理环节.常用的数据选择方法根据能量信息的强弱对有效数据进行提取,但在实际情况中能量的高低与语音数据并无必然联系.本文在对传统方法进行分析比较的同时引入语言学知识,提出基于辅音信息的有效数据选择方法.该方法通过对活动语音检测结果中音素识别结果进行分析,保留所有元音,对辅音进行筛选,去除无益于说话人识别的干扰辅音音素,从而实现对有效语音数据的选取.实验表明,应用该方法得到的说话人识别结果,明显优于传统的基于能量的数据选择算法,如基于G.723.1标准的活动语音检测算法和近期提出的基于交叉熵顺序统计滤波的端点检测算法.(本文来源于《中国科学院大学学报》期刊2014年05期)

赵海君,曹辉[9](2013)在《基于支持向量机的说话人的语音分类率研究》一文中研究指出本文研究训练样本数与测试样本数的分配情况对说话人的语音分类率的影响,采用将特征参数梅尔频率倒谱系数(MFCC)用在基于支持向量机(SVM)的平均影响值(MIV)降维方法中,对各维特征参数进行重要性排序,然后重新组合,将组合好的特征参数用SVM进行语音分类。通过仿真实验分析,训练样本数与测试样本数各一半时分类效果相对较好。(本文来源于《第叁届上海——西安声学学会学术会议论文集》期刊2013-11-01)

杨毅,陈国顺,鲍长春[10](2013)在《基于声学融合特征的说话人分类方法研究》一文中研究指出说话人分类系统的目的是将声音数据分段并按说话人进行分类。对每个说话人提取基于多距离麦克风的多时延特征,可以进一步提高说话人分类系统性能。但随着麦克风个数增加,多时延特征向量维数迅速增长。针对该问题,采用保留特征流形结构并降低计算代价的方法,提出一种基于多距离麦克风融合声学特征的多分量鉴别式保局投影算法,利用支持向量机分类器进行两说话人分类系统的训练和测试,实现会议场景下的说话人分类。实验结果证明,与传统DLPP等算法相比,该算法在大部分数据集上的分类性能较优,可将分类误差率降低至20%以下。(本文来源于《计算机工程》期刊2013年08期)

说话人分类论文开题报告范文

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

提出一种利用深度神经网络和语音学知识进行文本无关的说话人识别的方法.采用深度神经网络(Deep Neural Netw ork,DNN)来进行有监督的因子分析建模方法是目前与文本无关说话人识别的研究热点,在此基础上挖掘了不同的音素对识别性能的影响.首先根据语音学知识对DNN的输出节点进行分类,在说话人建模过程中,根据不同的类别来提取不同的后验因子(i-vectors),然后采用拼接的方式得到一个高维的i-vector用于话者识别.在NIST SRE 2012的核心测试任务上,相对于无监督的全空间变量因子分析与基于DNN的因子分析方法,提出的算法都有不同程度的性能提升.综合来看,超过了目前已知的最佳系统性能.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

说话人分类论文参考文献

[1].闫杰,朱晓莲,谢磊,李鹏,梁家恩.基于Bottleneck特征和i-vector的说话人年龄分类[C].第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集.2017

[2].马啸空,郭武.采用音素分类的因子分析说话人识别方法[J].小型微型计算机系统.2016

[3].邢玉娟,谭萍.基于稀疏表示分类的说话人识别算法及其在智能考勤系统中的应用[J].工业仪表与自动化装置.2016

[4].胡青,刘本永.基于卷积神经网络分类的说话人识别算法[J].信息网络安全.2016

[5].谭萍,邢玉娟.基于GMM超向量和Fisher-稀疏表示分类的说话人确认[J].青海大学学报(自然科学版).2016

[6].张燕.语音画像中说话人分类特点研究:语篇信息视角[D].广东外语外贸大学.2015

[7].邢玉娟,曹晓丽,谭萍,李恒杰.基于WLDA和i-稀疏表示分类的说话人确认[J].计算机工程与应用.2016

[8].吴蔚澜,张卫强,刘巍巍,田垚,陈振锋.说话人识别中基于音素分类的数据选择方法[J].中国科学院大学学报.2014

[9].赵海君,曹辉.基于支持向量机的说话人的语音分类率研究[C].第叁届上海——西安声学学会学术会议论文集.2013

[10].杨毅,陈国顺,鲍长春.基于声学融合特征的说话人分类方法研究[J].计算机工程.2013

标签:;  ;  ;  ;  ;  ;  ;  

说话人分类论文开题报告文献综述
下载Doc文档

猜你喜欢