非特定人手语识别论文-王雅

非特定人手语识别论文-王雅

导读:本文包含了非特定人手语识别论文开题报告文献综述及选题提纲参考文献,主要关键词:非特定人手语识别,隐Markov模型,遗传算法,MLLR算法

非特定人手语识别论文文献综述

王雅[1](2017)在《基于改进的HMM和自适应技术的非特定人手语识别的研究》一文中研究指出手语是听力和语言障碍群体沟通交流的一种语言。全世界共有2.3亿左右的聋哑人,作为社会弱势群体的聋哑人经常会遇到生活、工作、心理、教育、交流等很多方面的问题。尤其是交流问题,手语的普及程度较差,能够掌握手语的人数量很少,这就使得聋哑人的沟通交流存在很大阻碍。手语识别的研究自上世纪九十年代开始,它通过一定的计算机技术将手语以非操手语者可以理解的形式呈现出来,从而帮助聋哑人无障碍地表达和交流。该技术作为人机交互领域的研究内容之一,对语言交流障碍群体有着重要的现实意义。目前基于数字设备的手语识别准确率已经达到较高的水平,对特定人手语的识别也有了较好的性能,但是现有的手语识别系统在用户变换情况下的性能差强人意,远不能达到理想的性能要求。而非特定人手语识别恰恰是手语识别系统得以实际应用亟待解决的关键问题。个体之间手语数据的差异性和手语训练样本的匮乏是牵制非特定人手语识别系统性能的重要原因。为了解决以上问题,本文对手语识别中的关键算法进行了研究,并对现有算法进行了改进。主要研究工作有以下两个方面:(1)对基于隐Markov模型(Hidden Markov Model,HMM)的手语训练建模进行了研究,对HMM叁个基本问题的解决进行分析,并针对其中的训练问题常用到的Baum-Welch算法收敛于局部最优解的不足进行改进,引入自适应诱导进化遗传算法进行手语词的HMM参数训练,从而在给定的解空间中找到全局最优解。(2)针对非特定人手语识别中不同手语者个体间的差异性和手语训练数据的不充分这两个难点问题,本文提出了基于最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)算法和最大后验概率(Maximum a posteriority,MAP)算法的自适应手语识别框架,该方法优化了MLLR回归类的划分,并且提供给MAP更精准的初始模型,充分发挥了MLLR的快速性和MAP的渐进性。然后引入了最小分类误差(Minimum Classification Error,MCE)模型参数估计算法,以弥补模型参数自适应方法的局限性,进一步降低系统误识率。接着对该算法中计算量大的缺点进行了改进。实验结果表明,本文算法在非特定人手语识别中的性能要优于已有的自适应算法,该算法利用少量自适应数据便能使得非特定人手语识别达到良好的效果。(本文来源于《西安建筑科技大学》期刊2017-06-08)

倪训博,赵德斌,姜峰,程丹松[2](2010)在《Viterbi和DTW算法的关系分析——在非特定人手语识别中的应用》一文中研究指出在经典的模式识别理论中,Viterbi算法代表了统计概率的模式匹配算法,而DTW算法代表了模版匹配的模式匹配算法,它们之间是否存在关系至今尚无定论.为了找到这两种算法之间的关系,在"类别隶属度"是广义概率的假设前提下,应用模糊数学的理论在Viterbi算法与DTW算法之间建立起联系.首先,提出了利用模糊数学的贴近度把DTW算法的"距离"向Viterbi算法的"概率"转化的通用贴近度表达式,并对通用贴近度表达式给出了理论上的证明.其次,应用DTW的通用贴近度表达式重估HMM参数,建立DTW算法与Viterbi算法之间的模糊贴近度关系,并为此提出了δ-ε算法,得到基于数据帧的类似于HMM的参数重估形式.然后,为了确保建立DTW算法与Viterbi算法之间的模糊贴近度关系的正确性,以定理的形式给出了相应的证明.再次,通过设定的DTW贴近度表达式对HMM参数重估的过程中,发现了DTW贴近度的重估参数与HMM重估参数之间存在着的模糊关系,以定理的形式对这种模糊关系加以证明.最后,依据上述定理提出了Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法,以定理的形式对Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法的正确性加以证明,并将对Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法应用于非特定人手语的识别.实验表明,把DTW算法的路径搜索策略以概率的形式引进到Viterbi算法中,能够以削减候选词集的方式部分消除非特定人手语识别的误识,从而提高大词汇量情况的下非特定人手语识别的识别率和速度.(本文来源于《计算机研究与发展》期刊2010年02期)

倪训博,王克家,葛宏志,程丹松,耿铁珍[3](2009)在《非特定人手语识别统计模型的改进及应用》一文中研究指出目前,非特定人手语识别与特定人系统相比还有较大的差距.手语数据差异性使得非特定人手语识别中提取手语数据有效的共同特征非常困难,因而,手语数据差异性在一定程度上影响了非特定人手语识别的识别效果.本文从手语数据存在差异性这一角度入手,利用流形概念的学习和推理能力并在流形允许变化的范围内进行有效建模.在建模的过程中,从范函求极值的角度出发,给出了一个让人容易理解且直观化的推导过程.进而应用流形概念中的切向量来改进手语识别的统计模型(TV/HMM)并应用于大词汇量非特定人手语识别,以解决手语数据的差异性对大词汇量非特定人手语识别所造成的影响.实验表明,改进后的TV/HMM识别系统在大词汇量非注册的易混词集上识别率高明显.(本文来源于《哈尔滨工程大学学报》期刊2009年11期)

倪训博,程丹松,吕海峰,王克家,耿铁珍[4](2009)在《非特定人手语识别参数训练模型的改进及应用》一文中研究指出在手语识别研究中,非特定人手语识别参数训练的样本缺乏影响了非特定人手语识别的识别率.区分性训练可以很好地弥补由于训练样本的缺乏对识别系统所造成的影响,能够提高非特定人手语识别的识别率.对区分性训练(DT)所改进的HMM参数训练模型(DT/HMM)做了全新的推导,获得了与HMM相一致齐全的DT/HMM的参数模型.在特定人识别系统上应用可区分性训练的h准则获取了h参数,将该齐全的DT/HMM参数训练模型和h参数应用于大词汇量的非特定人手语识别当中,加入主观经验后的非注册易混词集EXP与MLE和EBW的非注册易混词集相比,平均识别率分别提高了10.65%和9.55%.(本文来源于《哈尔滨工程大学学报》期刊2009年09期)

徐蓉[5](2007)在《非特定人手语数据的流形结构分析与识别》一文中研究指出手语识别研究的目的是增进聋人与听力健康人之间无障碍的交流,提高计算机对人体语言的理解能力。非特定人手语识别是推动手语识别系统实用化所必须解决的问题。目前,非特定人手语识别与特定人手语识别性能相比还有较大的差距,其主要原因在于数据本身的差异性矛盾与训练样本的匮乏。数据差异性矛盾使得非特定人手语识别中提取手语数据有效的共同特征非常困难。在实际应用中,模型的表达能力与样本的缺乏之间的矛盾已经成为制约识别系统效果的瓶颈。为解决上述两方面的问题,本文将流形思想结合到传统的HMM手语模型中,主要的研究工作如下:1.通过Isomap算法直观展现手语数据的流形结构。同类数据集在几何上具有某种由内在不变性形成的嵌套流形结构,这种结构本身对应了单一的流形概念。Isomap方法是最常用的流形可视化算法,其对手语数据的处理结果证明了手语数据本身包含着流形结构,可将HMM模型中的状态类与流形概念对应起来,挖掘其内在的不变性。2.根据Isomap可视化结果,提出一种TV/HMM手语模型。利用流形概念具有一定学习和推理能力的优点,引入切向量来线性表达数据的可变性,对类内允许的变化程度进行有效建模,从而使分类器对某些不造成类别变化的数据变化不敏感,并且在训练集较小的情况下,通过对几何结构的描述,获得对数据个体差异的形式化描述。TV/HMM模型既加入了对特异性因素的处理,又弥补了训练数据不足造成的缺陷。3.实现了基于TV/HMM的手语词识别系统。系统利用最大似然估计从训练数据中学习切向量,确定最佳参数和迭代次数后,通过实验证明了TV/HMM模型相对于传统HMM模型的优越性。在训练集较小、不显着增加时间复杂度的情况下,TV/HMM模型对系统性能有很大的改善,可将非特定人的识别率由70.38%提高到72.44%,改善度达到6.96%;加入mean-shift类内向内生成的虚拟数据后,非特定人的识别率由70.56%提高到72.94%,改善度达到8.07%。(本文来源于《哈尔滨工业大学》期刊2007-07-01)

姜峰,高文,姚鸿勋,赵德斌,陈熙霖[6](2007)在《非特定人手语识别问题中的合成数据驱动方法》一文中研究指出针对手语识别研究中训练样本缺乏,提出了一种衍生数据的方法,有效地解决了动态多数据流手语训练用样本合成问题.利用mean-shift算法可以方便、快捷地得到密度函数梯度的变化方向,从而控制衍生的方向和强度.算法同时考虑到合成样本尽可能包含非特定人的信息及其有效性,对数据所实现的变形不会被识别系统的初始化过程逆转.合成数据驱动的效果受模型的容量、合成的强度与方向影响.在多种实验环境下对驱动效果进行评估,识别率有所提高,在某些例子中提高明显.(本文来源于《计算机研究与发展》期刊2007年05期)

姜峰,高文,王春立,姚鸿勋,赵德斌[7](2007)在《非特定人手语识别进展及关键问题研究思路》一文中研究指出非特定人手语识别是推动手语系统实用化所必须解决的问题.在非特定人手语识别研究中,训练数据的缺乏和非特定人手语数据的差异性矛盾给原有研究框架的有效性带来了挑战.提出了非特定人手语识别新的研究框架,并给出了解决问题的策略与思路.这些问题的解决将对中国手语识别及其他相关领域具有非常重要的意义.(本文来源于《软件学报》期刊2007年03期)

方高林,高文,王春立,陈益强[8](2002)在《基于SOFM/HMM模型的非特定人手语识别系统》一文中研究指出手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音 .目前最新发展水平的手语识别系统在实际应用中应该解决非特定人手语识别问题 .该文在分析非特定人手语识别特点——数据多且差异大、模型训练难收敛、对不同人数据的特征提取需求更迫切——的基础上 ,提出了 SOFM/ HMM模型 ,将自组织特征映射 (SOFM)很强的特征提取功能和隐马可夫模型 (HMM)良好的处理时间序列属性结合在一个新颖的框架下 ,并把该模型应用到非特定人中国手语识别中 .实验结果表明 ,SOFM/ HMM模型手语识别率比传统的 HMM模型提高近 5 % .(本文来源于《计算机学报》期刊2002年01期)

非特定人手语识别论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在经典的模式识别理论中,Viterbi算法代表了统计概率的模式匹配算法,而DTW算法代表了模版匹配的模式匹配算法,它们之间是否存在关系至今尚无定论.为了找到这两种算法之间的关系,在"类别隶属度"是广义概率的假设前提下,应用模糊数学的理论在Viterbi算法与DTW算法之间建立起联系.首先,提出了利用模糊数学的贴近度把DTW算法的"距离"向Viterbi算法的"概率"转化的通用贴近度表达式,并对通用贴近度表达式给出了理论上的证明.其次,应用DTW的通用贴近度表达式重估HMM参数,建立DTW算法与Viterbi算法之间的模糊贴近度关系,并为此提出了δ-ε算法,得到基于数据帧的类似于HMM的参数重估形式.然后,为了确保建立DTW算法与Viterbi算法之间的模糊贴近度关系的正确性,以定理的形式给出了相应的证明.再次,通过设定的DTW贴近度表达式对HMM参数重估的过程中,发现了DTW贴近度的重估参数与HMM重估参数之间存在着的模糊关系,以定理的形式对这种模糊关系加以证明.最后,依据上述定理提出了Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法,以定理的形式对Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法的正确性加以证明,并将对Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法应用于非特定人手语的识别.实验表明,把DTW算法的路径搜索策略以概率的形式引进到Viterbi算法中,能够以削减候选词集的方式部分消除非特定人手语识别的误识,从而提高大词汇量情况的下非特定人手语识别的识别率和速度.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

非特定人手语识别论文参考文献

[1].王雅.基于改进的HMM和自适应技术的非特定人手语识别的研究[D].西安建筑科技大学.2017

[2].倪训博,赵德斌,姜峰,程丹松.Viterbi和DTW算法的关系分析——在非特定人手语识别中的应用[J].计算机研究与发展.2010

[3].倪训博,王克家,葛宏志,程丹松,耿铁珍.非特定人手语识别统计模型的改进及应用[J].哈尔滨工程大学学报.2009

[4].倪训博,程丹松,吕海峰,王克家,耿铁珍.非特定人手语识别参数训练模型的改进及应用[J].哈尔滨工程大学学报.2009

[5].徐蓉.非特定人手语数据的流形结构分析与识别[D].哈尔滨工业大学.2007

[6].姜峰,高文,姚鸿勋,赵德斌,陈熙霖.非特定人手语识别问题中的合成数据驱动方法[J].计算机研究与发展.2007

[7].姜峰,高文,王春立,姚鸿勋,赵德斌.非特定人手语识别进展及关键问题研究思路[J].软件学报.2007

[8].方高林,高文,王春立,陈益强.基于SOFM/HMM模型的非特定人手语识别系统[J].计算机学报.2002

标签:;  ;  ;  ;  

非特定人手语识别论文-王雅
下载Doc文档

猜你喜欢