说话人辨识论文_叶于林,杨波,莫建华,刘夏

导读:本文包含了说话人辨识论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:说话,模型,向量,高斯,耳蜗,极值,特征。

说话人辨识论文文献综述

叶于林,杨波,莫建华,刘夏[1](2017)在《基于说话人辨识的自上而下听觉显着性注意模型》一文中研究指出为体现听觉注意神经信息处理计算机制对听觉场景内容的自动分析与理解功能,本文基于人耳对频率变换的感知特性,结合深度信念网络的说话人辨识与听觉显着模型,提出了一种自上而下的听觉显着性注意提取模型.仿真结果表明:该模型具有可行性,同时在利用深度信念网络的说话人辨识技术中能够有效地凸显目标说话人的显着度.(本文来源于《计算机系统应用》期刊2017年07期)

刘雪燕,李明,袁宝玲[2](2015)在《基于CFCC-PCA的说话人辨识方法》一文中研究指出针对说话人训练和识别时间长、噪音环境下识别率低的问题,提出一种CFCC-PCA特征参数的说话人辨识方法。首先提取具有听觉特性的CFCC特征参数,然后对其进行PCA变换,找出具有分辨能力的参数,最后再用这些参数在云服务器中训练和识别说话人。实验表明:该方法可以提高说话人辨识的鲁棒性和识别率,云服务可提高系统实时性。(本文来源于《成都工业学院学报》期刊2015年02期)

李作强,高勇[3](2015)在《基于CFCC和相位信息的鲁棒性说话人辨识》一文中研究指出传统的说话人识别中,人们往往认为人耳对相位信息不敏感而忽略了相位信息对语音识别的影响。为了验证相位信息对说话人识别的影响,提出了一种提取相位特征参数的方法。分别在纯净语音和带噪语音条件下,基于高斯混合模型,通过将相位特征参数与耳蜗倒谱系数(CFCC)相结合,研究了相位信息对说话人辨识性能的影响。实验结果标明:相位信息在说话人识别中也有着重要的作用,将其应用于说话人辨识系统,可明显提高系统的识别率和鲁棒性。(本文来源于《计算机工程与应用》期刊2015年17期)

周国鑫,高勇[4](2014)在《基于GMM-UBM模型的说话人辨识研究》一文中研究指出为了进一步提高基于传统的GMM模型的说话人辨识的识别率,引入了GMM-UBM模型,并且在特征提取方面采用多种特征参数组合来代替单一特征参数,以提高有效特征维数来弥补特征样本的不足,同时在说话人辨识的端点检测部分,用基于MFCC相似度和谱熵的端点检测方法来代替传统的基于短时能量和过零点的方法,以解决其对含噪语音检测不准确而影响说话人辨识的问题。实验表明,与传统的GMM模型相比,GMM-UBM模型能够有效地提高说话人辨识的性能,并且使用组合特征参数和利用基于MFCC相似度和谱熵的端点检测方法都可以进一步提高说话人辨识的性能。(本文来源于《无线电工程》期刊2014年12期)

陈黎[5](2011)在《基于SVM和GMM的说话人辨识方法研究》一文中研究指出说话人识别是根据语音波形中反映说话人生理和行为特征的语音参数,自动识别出相应说话人的过程。它是语音信号处理的一个重要研究方向,作为一种生物认证技术,具有广泛的应用前景,促使越来越多的人对其进行研究。目前,基于闭集的说话人识别已经取得了比较好的进展,但是基于开集的说话人识别的识别性能还有待提高。开集和闭集是对测试说话人集的一种划分,当测试的说话人集合仅局限在训练集内时,称其为基于闭集的说话人识别;当测试的说话人集合没有训练集限制,任何话者,不论训练与否,均能作为测试集合中的一员,则称其为基于开集的说话人识别。基于开集的说话人识别,不同于闭集说话人识别的关键是开集说话人识别不仅要对测试话者是否是训练集内的话者进行判断,而且若是训练集内的话者,则还要对其进行识别,识别出其是集内的哪个话者。本文致力于对基于开集说话人识别的研究,提出了一种新的识别方法,即基于SVM和GMM的说话人辨识方法。说话人辨识是指对说话人进行分辨和识别,分辨测试话者是否是训练集内话者,若是训练集内话者则还要识别出其是训练集内的哪位话者。用到的模型是SVM-GMM模型,该模型是结合了支持向量机(SVM)和高斯混合(GMM)两种模型。支持向量机模型是以统计学习理论中VC维理论和结构风险最小原理为基础,根据有限的样本信息在模型的复杂性与学习能力之间寻求最佳折中,获得了较好的推广能力。大量的实验已经证实支持向量机有着优秀的分类能力,基于此,本研究将其选为第一步粗分类模型。而高斯混合模型是用多个高斯分布的线性组合,拟合说话人的特征分布。它能很好的描述说话人语音特征的内部的相似性。前人的研究也表明该模型是在说话人确认系统表现出良好的性能。故本研究选用高斯混合模型作为第二步精细的确认模型。在识别阶段,首先用支持向量机模型对测试的话者进行粗分类,然后再用高斯混合模型对分类结果进行确认,判断测试话者是否就是其在粗分类中所分到的类别。若是,则表明该测试话者就是其所分到类别所对应的话者;若否,则表明该测试话者是训练集外话者。本研究就是通过这种方法来实现对说话人进行分辨的。实验表明,本研究所提出的方法是有效的,能有效的提高对集外话者的分辨率。(本文来源于《武汉理工大学》期刊2011-04-01)

王欢良,韩纪庆,郑贵滨[6](2010)在《基于K-L散度模型聚类的快速说话人辨识方法》一文中研究指出在网络应用环境下,需要处理的音频数据和注册说话人急剧增加,传统说话人辨识方法难以满足实时性要求.文中提出采用K-L散度的说话人模型聚类方法,从而构造一个分级辨识模型,提高辨识效率.研究利用类辨识信息估计置信度的方法,可尽早有效排除集外说话人.实验结果显示,文中方法可使辨识速度平均提高3.2倍,而闭集辨识错误率平均只有0.9%的增加.采用类辨识置信度进一步提高开集辨识速度,并且在保持集内错误率不变的情况下,使集外错误率相对下降5.1%.(本文来源于《模式识别与人工智能》期刊2010年06期)

刘明辉,黄中伟,熊继平[7](2010)在《用于说话人辨识的评分规整》一文中研究指出在文本无关的说话人辨识中,为了提高系统在电话语音条件下的鲁棒性,提出了将说话人确认中常用的评分规整手段用于说话人辨识中,即对测试语音通过不同话者模型的评分分别进行评分规整,为测试语音选取最接近的话者模型作为系统识别输出,有效地提高了系统性能。在NIST’031spk数据库上的说话人辨识实验表明了评分规整技术对说话人辨识的有效性。(本文来源于《计算机工程与应用》期刊2010年12期)

范小春,邱政权[8](2010)在《基于HAAR小波的分级说话人辨识》一文中研究指出从线性预测(LP)残差信号中提出了一种新的特征提取方法,这种特征跟单个的说话人的声道密切相关。通过把HAAR小波变换运用于LP残差而获得了一个新的特征(HOCOR)。为了进一步提高系统的鲁棒性和辨识率,在采用分级说话人辨识的基础上,将基音周期的高斯概率密度对GMM分类器的似然度进行加权,形成新的似然度进行说话人辨识。试验结果显示,所提出系统的鲁棒性和辨识率都有所提高。(本文来源于《计算机工程与应用》期刊2010年11期)

刘雪燕,夏汉铸,袁宝玲[9](2010)在《基于新的MRSVM说话人辨识方法》一文中研究指出提出一个新的基于MRSVM的说话人辨识方法,首先对语音特征矢量进行LDA降维,得到具有区分力的特征矢量,然后对其进行模糊核聚类,根据样本选择算法,选择聚类边界的特征矢量作为支持向量训练支持向量机,在不影响识别率的情况下,大大减少了支持向量机的存储量和训练量。实验表明该方法具有较好的总体效果。(本文来源于《计算机工程与应用》期刊2010年05期)

骆瑞玲,李明,李睿[10](2010)在《改进的PSO在说话人辨识中的应用》一文中研究指出针对PSO算法容易陷于局部极值的缺点,提出了一种改进的PSO优化算法(IPSO)。该算法根据粒子进化速度对粒子个体极值进行自适应扰动,使粒子及时跳出局部极值点而继续优化,从而扩大粒子搜索范围。改进后的PSO算法加快了收敛速度,能够很好地调整算法的全局与局部搜索能力之间的平衡。同时,给出了应用IPSO算法训练支持向量机的方法,并将其应用于说话人辨识。改进后的PSO可以使SVM用较少的SV取得最优分类面,从而减少SVM的训练量,提高了说话人辨识速度。(本文来源于《计算机工程与应用》期刊2010年02期)

说话人辨识论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对说话人训练和识别时间长、噪音环境下识别率低的问题,提出一种CFCC-PCA特征参数的说话人辨识方法。首先提取具有听觉特性的CFCC特征参数,然后对其进行PCA变换,找出具有分辨能力的参数,最后再用这些参数在云服务器中训练和识别说话人。实验表明:该方法可以提高说话人辨识的鲁棒性和识别率,云服务可提高系统实时性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

说话人辨识论文参考文献

[1].叶于林,杨波,莫建华,刘夏.基于说话人辨识的自上而下听觉显着性注意模型[J].计算机系统应用.2017

[2].刘雪燕,李明,袁宝玲.基于CFCC-PCA的说话人辨识方法[J].成都工业学院学报.2015

[3].李作强,高勇.基于CFCC和相位信息的鲁棒性说话人辨识[J].计算机工程与应用.2015

[4].周国鑫,高勇.基于GMM-UBM模型的说话人辨识研究[J].无线电工程.2014

[5].陈黎.基于SVM和GMM的说话人辨识方法研究[D].武汉理工大学.2011

[6].王欢良,韩纪庆,郑贵滨.基于K-L散度模型聚类的快速说话人辨识方法[J].模式识别与人工智能.2010

[7].刘明辉,黄中伟,熊继平.用于说话人辨识的评分规整[J].计算机工程与应用.2010

[8].范小春,邱政权.基于HAAR小波的分级说话人辨识[J].计算机工程与应用.2010

[9].刘雪燕,夏汉铸,袁宝玲.基于新的MRSVM说话人辨识方法[J].计算机工程与应用.2010

[10].骆瑞玲,李明,李睿.改进的PSO在说话人辨识中的应用[J].计算机工程与应用.2010

论文知识图

说话人辨识系统框图噪声环境下的~...模型的说话人辨识系统结构框...联合去噪方案ABX主观评估结果不同识别方法的识别时间比较

标签:;  ;  ;  ;  ;  ;  ;  

说话人辨识论文_叶于林,杨波,莫建华,刘夏
下载Doc文档

猜你喜欢