文本无关论文开题报告文献综述

文本无关论文开题报告文献综述

导读:本文包含了文本无关论文开题报告文献综述、选题提纲参考文献,主要关键词:特征,模型,文本,向量,浊音,音素,说话。

文本无关论文文献综述写法

陈国,刘亮亮,张再跃[1](2019)在《用户短文本无关语自动识别方法研究》一文中研究指出在用户短文本中,意思相同的句子有多种表述方式,这些句子中存在很多与句意无关的信息,称为无关语。针对一般方法无关语识别准确度不高的问题,论文提出了一种通过二阶隐马尔科夫模型来自动识别用户短文本中无关语的方法。本方法在建模过程中将词本身、词性以及词的相对位置作为特征来对隐马尔科夫模型进行扩充。实验结果表明,论文给出的用户短文本无关语识别方法可以避免对训练文本进行手工编写规则的限制,且在准确率和召回率方面均有一定程度的提高。(本文来源于《计算机与数字工程》期刊2019年07期)

全志楠,林家骏[2](2018)在《文本无关的小样本手写汉字笔迹鉴别方法》一文中研究指出针对已有的笔迹鉴别方法对笔迹版式要求比较严格,且在小样本数据情况下,鉴别性能水平较低的问题,提出了邻环结构特征方法。首先对笔迹轮廓图像随机采样,然后利用网格窗口提取笔迹的邻环结构特征,最后利用主成分分析和线性鉴别分析方法对特征降维,利用深度置信网络对特征进行训练和鉴别。本文方法与文本无关,简单易行,在手写笔迹字符数量平均为45个的小样本上仍能有效表征作者风格信息。在HIT-MW笔迹鉴别数据库上的测试结果表明,本文方法达到了与使用较大样本的其他笔迹鉴别方法相近的鉴别效果。(本文来源于《华东理工大学学报(自然科学版)》期刊2018年06期)

熊玉洁[3](2018)在《基于边缘共生特征与字对辅助的文本无关书写人识别》一文中研究指出书写人识别是生物特征识别和手写文档分析的研究热点之一,在金融、保险、公安、司法等诸多领域有广泛的应用需求,受到学术界和工业界的持续关注。文本无关书写人识别,是在不限定书写内容的情况下,通过计算机自动分析自然书写笔迹的书写风格来确认书写人的身份。尽管其相关研究已有二十多年的历史,但由于应用场景十分复杂,已有的文本无关书写人识别方法的性能尚不够理想,有待进一步研究。本文聚焦离线文本无关书写识别技术,研究文本无关笔迹特征提取、特征融合、字对相似度测量等关键问题,提出基于边缘共生特征的文本无关书写人识别方法,并针对中文高频词可能导致查询笔迹和参考笔迹中存在文本内容相同的字对,提出充分利用字对的辅助作用提高中文文本无关书写人识别性能的方法,通过实验验证了方法的有效性。本文的主要贡献和创新成果如下:1.提出一种蕴含笔画边缘方向和结构信息的边缘共生特征用于表达笔迹的书写风格。边缘共生特征以边缘像素为中心的一定尺寸的窗口作为处理区域,通过统计窗口内共生边缘像素对的出现频率来生成特征向量。该特征在多个公共数据库和竞赛数据集上都取得良好的识别准确率,特别是其在中文公共数据库上取得了优于已有方法的识别性能,表明本文所提出的边缘共生特征能够有效反映中文笔迹的书写风格差异。2.提出一种边缘共生特征与SIFT描述子直方图特征结合的文本无关书写人识别方法。SIFT描述子直方图从多尺度高斯差分图像中提取的关键点入手,记录关键点周围不同尺度下的纹理分布,并利用SIFT描述子码本计算笔迹图像中的SIFT描述子的分布直方图。与边缘共生特征相比,SIFT描述子直方图从更宏观的角度描述笔迹的书写风格,两者具有一定互补性,通过结合可以获得更好的性能。实验表明该方法对中英文书写人识别都有不错的效果,特别是面对多文种书写人识别问题时,在两个竞赛数据集上的实验均取得优于已有方法的结果。3.提出一种基于查询笔迹和参考笔迹中文本内容相同字对的笔迹相似度辅助下的中文书写人识别方法。在对查询笔迹图像和参考笔迹图像分别进行字符识别的基础上,对来自两幅笔迹的文本内容相同的字对图像,利用SIFT描述子计算其相似程度,并将其与基于边缘共生特征的文本无关书写识别方法相结合,在中文书写人识别中起辅助作用。在两个公共数据库上的实验表明字对辅助能有效提高中文书写人识别的准确率。4.提出一种基于位移场的字对相似度计算方法及其辅助下的中文书写人识别方法。从位移场的角度计算相似度,不依赖字符识别的结果可以直接检测内容相同的字对图像,并将这种基于位移场的字对相似度计算方法用于辅助基于边缘共生特征,应用于中文书写人识别。该方法在两个中文公共数据库上的实验都取得优于已有方法的结果,在英文公共数据库上的识别率也得到有效提高。本文提出的算法经过实验环境下的测试,并已在相关领域得到应用,例如基于边缘共生特征的文本无关书写人识别方法已经应用到作者所在实验室与公安部某研究所合作承担的国家科技支撑计划“基于**的抽拣器材研制”中,该项目获得了公安部科学技术叁等奖。(本文来源于《华东师范大学》期刊2018-05-01)

欧国振[4](2017)在《基于SVM的文本无关的说话人辨认技术研究》一文中研究指出语音是人类最有效的交流方式,因为其独特性使其成为说话人识别技术的基本依据。在说话人识别基本框架下,寻找一种区分性强的说话人个性特征以获得更高的系统性能是当前说话人识别领域的研究热点。模型选择和特征提取是说话人识别技术中重点考虑的问题,在确定了模型选择的条件下,说话人识别系统性能的好坏就主要决定于选取何种类型的特征参数。当今数字化时代,寻找一种优越的说话人个性特征具有很好的理论研究意义和现实意义。本文的研究目标是设计能够使说话人识别系统的识别性能提升或系统时间复杂度降低的语音特征。为此重点研究了GMM Supervector在说话人识别系统中的特性,并在此基础上提出了重组超矢量,结合支持向量机的特性分析重组超矢量的可行性;接着研究了近几年热门的深度学习,设计了一个深度神经网络来提取说话人语音的瓶颈特征。本文的主要工作和创新如下:(1)本文介绍了说话人识别的基本框架,主要包括语音预处理方法、特征提取方法和说话人识别模型。详细介绍了LPC、MFCC及它们的倒谱特征的提取过程,并分析它们的特性。除此之外,还介绍了模板匹配算法、隐马尔科夫模型法、矢量量化法、高斯混合模型法、支持向量机法以及深度神经网络法这几种经典的说话人识别方法。通过前期的研究发现,后叁种方法在说话人识别系统中表现相对更佳,所以本文对说话人识别的研究也是基于这叁种方法上的。(2)针对传统超矢量在说话人辨认系统中性能表现不够好的问题,本文提出了基于重组超矢量构建文本无关的GMM-SVM说话人辨认系统。重组超矢量充分利用各相邻高斯分量的均值矢量的高关联性,并且每个高斯分量的均值矢量携带足够的说话人个性信息。重组超矢量能充分反应说话人身份的内在细节,更使得系统可以充分利用SVM处理高维小数据性能优越的特点。实验结果表明,重组超矢量的GMM-SVM说话人辨认系统与传统的基于GMMSVM的说话人系统相比,有效的提高了说话人的辨别率,同时大幅度缩短了系统建模的时间。(3)针对传统特征参数不能挖掘语音信号深层次结构信息的问题,本文设计了一个深度神经网络来提取说话人语音的瓶颈特征,搭建基于DNN-SVM的说话人辨认系统。这种特征可以挖掘说话人的深度特性,具有不变性和高区分性的特点。实验结果表明,基于DNN-SVM的说话人辨认系统比基于SVM的说话人辨认系统的识别性能有了明显的提高。(本文来源于《南京邮电大学》期刊2017-10-26)

王跃[5](2017)在《基于I-VECTOR的与文本无关的说话人识别研究》一文中研究指出说话人识别作为生物识别的一种,因其使用便捷性、非交互式等优势逐渐被人们接受和使用,并成为生物识别领域的研究热点。与文本无关的说话人识别是从语音信号中提取出能反映个人特征的信息,来完成对话者身份的辨认和确认。近年来,随着说话人识别技术的发展,说话人识别逐渐走向社会应用,但实际使用时,由于实际环境的影响、语音采集设备的多样性以及话者语音的长短等影响,说话人识别在识别精度上还存在一些问题。本文针对在实际使用时,测试话者的短语音导致识别精度不高以及环境失配等问题,从补偿的角度,研究了高斯模型、i-vector模型以及高斯线性鉴别性分析(GPLDA)模型。首先,本文对说话人识别的模型进行了介绍,探讨了说话人识别的预处理和特征提取,利用美尔频率倒谱系数提取话者的特征,针对训练和测试语音不足的问题,构建了GMM-UBM模型,对其原理和建模进行了相关的阐述,并分析了该系统的优缺点,通过实验验证了模型的混合度选取,研究了反映说话人动态和静态特征的美尔频率差分特征对说话人识别的影响,通过实验分析了该系统的性能。其次,针对GMM-UBM跨信道性能差的特点,在因子分析的基础上,利用身份认证矢量i-vector构建了基于i-vector的说话人确认系统。针对信道失配等问题,利用线性鉴别性分析和类内协方差归一化等补偿手段对系统进行补偿,并分析各补偿方式对系统的影响。同时利用实验分析了i-vector维数对说话人识别系统的影响,并选取了合适的特征维数。最后,针对目前与文本无关的说话人识别,基于不定长短语音的说话人确认的识别精度低等问题,本文采用高斯线性鉴别行分析(GPLDA)模型,针对将i-vector转化到PLDA模型时,对i-vector进行长度归一化,导致对长度归一化后的i-vector的后端协方差不能进行精确计算,影响系统的鲁棒性。本文提出利用全变量空间的列向量归一化来代替对i-vector的长度归一化,并对提出的方法进行验证和实验,结果表明该方法可以提高系统的鲁棒性,且识别率没有降低。(本文来源于《兰州理工大学》期刊2017-06-09)

杨瑞瑞[6](2017)在《基于文本无关的声纹识别算法的研究及实现》一文中研究指出随着互联网技术的迅猛发展,网络逐渐覆盖到了社会生活的各个角落。在互联网环境中,传统的身份认证方法面临巨大的挑战,越来越无法适应实际应用环境的需求。在所有的身份认证方法中,生物特征身份识别技术是一种基于人类特有的生理和后天特性进行的身份识别技术,因其独特的优势而在实际中得到了广泛的应用。在所有生物特征身份识别技术中,与文本无关的声纹确认技术被认为是最具实用性的生物特征身份识别技术之一,该技术通过目标说话人的语音对说话人的身份进行确认,是语音识别研究的一个重要分支。在实际应用环境中,受到采集设备、传输线路等多种因素的影响,最终得到的有效语音数据非常有限,进而使得系统的识别性能和执行效率很难达到理想的识别效果。因此,本文主要基于文本无关的短语音声纹确认方法进行研究。在声纹确认系统中,系统的识别率和计算复杂度是衡量系统性能的重要指标。传统的UBM-MAP-GMM模型架构在一定程度上解决了测试语音与训练语音失配的情况,系统识别性能也比较理想,然而在实际应用中,面对短语音问题,该模型的运算量需求较大,系统鲁棒性较差。因此,本文从减少系统计算量、提高识别率等多个角度出发对声纹识别算法进行了研究,具体有以下几个方面:1.分析了模型训练中模型初始值对EM算法的影响,针对传统K-means算法随机选择初始聚类中心可能导致算法局部收敛的缺陷,提出了基于密度和距离的初始聚类中心选择算法,对K-means算法进行了改进,并且通过实验证明了算法。2.探讨分析了UBM-MAP-GMM模型架构,针对其计算量大、个人声纹模型GMM服从同一模型结构及部分高斯分量对识别结果的影响,提出了基于UBM-CM-MAP-GMM模型架构的声纹确认方法。实验证明,该方法使得算法在识别时间、等错误率方面都有一定的改善。3.在UBM-CM-MAP-GMM模型架构中,对声纹模型GMM的混合度的取值进行研究,实验数据显示当GMM混合度为UBM的一半时效果最好。4.在UBM-CM-MAP-GMM模型架构上实现了短语音声纹确认软件,并对软件的识别效率进行了实验分析与验证,相比于传统的UBM-MAP-GMM模型架构,改进算法使得计算量和等错误率都一定程度的降低。(本文来源于《电子科技大学》期刊2017-03-28)

倪冬琴[7](2016)在《基于特征子空间量化的文本无关说话人年龄识别》一文中研究指出说话人年龄识别是指通过语音信号分析,识别出说话人的年龄特征。随着人机语音交互技术的研究不断深入,其应用也越来越广泛,对交互的自然度要求也随之提高。说话人年龄识别技术可以使得系统在人机交互过程中正确了解说话人的年龄特征,从而自适应地提供合理的交互方式,例如合适的音量、语速、语调、语气等。该技术可以广泛应用于自动语音信息查询、健康护理、娱乐场合等领域。本文提出一种特征子空间量化(FSSQ,Feature Subspace Quantization)方案进行文本无关的说话人年龄识别,主要思想是通过对同一年龄段说话人语音的声学特征空间基于聚类技术进行子空间划分并对子空间进行量化来减小模式类的分布散度,提高总体识别精度。同一年龄段说话人的语音信号首先提取梅尔倒谱参数(MFCC),然后采用K-Means算法对特征矢量进行聚类,完成特征子空间划分,进一步采用LBG算法对每一子空间进行量化,形成量化码本,每一年龄段的语音最终表示为一组量化码本。年龄识别基于最小平均码本距离进行判决分类。实验结果表明,提出的特征子空间量化说话人年龄识别方法相对矢量量化(VQ)和高斯混合模型(GMM)等典型方法具有更好的识别性能,总体集内和集外识别率分别达到了89.8%和58.6%。(本文来源于《苏州大学》期刊2016-10-01)

郭建敏,王晅[8](2016)在《与文本无关的单训练样本说话人识别》一文中研究指出针对现有的说话人识别方法对环境噪声较为敏感的问题,提出了一种与文本无关的单训练样本说话人识别方法。该方法能够提取语音时频谱的局部特征,此特征不仅对白噪声、高斯噪声、粉红噪声有很强的鲁棒性,而且能够充分反映说话人的基本发声特性。针对该局部特征的基本特点,给出了适合该局部特征的贝叶斯决策方法。对英文与汉语语音数据库的仿真实验表明,该识别方法可以实现单训练样本下的说话人识别,识别精度明显高于现有的Mel频率倒谱系数(MFCC)与线性预测编码(LPCC)语音特征,而且对白噪声等各类环境噪声有较高的鲁棒性。(本文来源于《陕西师范大学学报(自然科学版)》期刊2016年05期)

薛帅强[9](2016)在《基于文本无关的说话人识别技术的研究》一文中研究指出在实际生活中,身份认证应用在各个领域,身份认证的方法有很多种,比如指纹、虹膜、人脸等等,声纹识别也是其中一种,又叫说话人识别,是通过说话人的声音辨识出说话者身份。说话人识别又分为与文本相关的和与文本无关的,本文主要研究与文本无关的说话人识别技术,因为其更具有使用价值,并且提升空间比较大。通过对其关键技术的研究,以提高系统识别性能。本文在现有与文本无关的说话人识别技术的基础上,结合语音学、音韵学及其语音信号的特征,研究基于文本无关的说话人识别关键技术。主要的研究内容包括以下几个方面:清浊音划分。在对语音信号排除静音信号基础上,针对过零率划分清浊音方法,在处理振幅均值不在零点的信号时失效的问题,提出了有效翻转率方法;又针对清、浊音有效翻转率相似部分,运用频谱振幅均值方法区分清浊音。基音周期检测。在对语音信号静音、清音、浊音划分的基础上,针对语音信号周期特征明显段分布随机性问题,提出改进的LVAMDF(变长度平均幅度差函数法)及综合多因素基音检测算法,该算法对语音信号进行周期特征明显段和周期特征不明显段的聚类划分,同时,获取周期特征明显语音段的所有基音周期的起止端点,针对少数基音周期划分倍频或半频问题,提出识别、修正方法,其识别、修正率极高。与文本无关的说话人识别系统。根据与文本无关的说话人识别系统原理,运用matlab和C++混合编程,完成说话人识别系统和系统测试,系统的等错误率可达0.4762%。基于音素分类的说话人识别系统理论研究。在TIMIT语料库的音素标注基础上,运用混淆矩阵原理,研究了不同说话人不同发音特征的相似性和差异性,从而以强调差异性避开相似性的方法提高系统性能。该部分完成了部分理论研究和部分功能实现。本文提高了系统2处关键技术的性能,完成了与文本无关的说话人识别系统的功能,最后提出了系统识别原理的改进方案。由于工作量较大,改进方案还需完善和验证,系统性能还需要从音素识别、特征提取和系统原理方面进一步提升。(本文来源于《西南科技大学》期刊2016-05-30)

方天红[10](2016)在《与文本无关的打印文件机源认证研究》一文中研究指出随着激光打印机的普遍应用,打印文件在人们日常生活和工作中占据了越来越重要的地位,随之与打印文件相关的民事纠纷、刑事案件等变得越来越多。公共信息安全这一特殊领域要求提供可靠的打印文件检验手段来鉴定问题文件的打印机来源,即机源认证。现有的打印文件检验方法在一些方面取得了很大的进步,但依然存在许多未有效解决的关键问题。本文研究和总结了现有打印文件机源认证技术,分析了打印文件检验中面临的难点,针对打印文件检验中的一些问题,提出了对应的解决方案,主要的工作及创新点有:1.升级换代现有的图像采集系统。现有设计开发的“图像整体高倍显微放大系统”在采集如A4纸张这样的大幅打印文件时,需要人工辅助采集,时间长且强度大。为了减小工作强度和尽可能避免人为操作失误带来的采集错误,升级换代了图像采集仪器,设计了大幅高倍显微放大图像采集系统。2.研究基于GLCM和DWT特征选择的打印文件机源认证方法。分析了激光打印机的内部结构及对打印字符的影响,在理论上建立激光打印机硒鼓转动速度与行扫描线打印间隔的关系模型,从而确定共生方向仅取水平和垂直方向。同时,为了综合考虑字符图像的空间域和时频域特性,将GLCM和DWT统计纹理特征进行组合,并对组合的统计纹理特征进行二次特征选择。特征初选使用ReliefF算法,第二次特征选择运用SVM-RFE算法。在叁种不同样本集上的实验结果表明,GLCM和DWT统计纹理特征在相同字情况下的分类鉴别是有效的,且对组合的GLCM和DWT特征进行特征选择,有利于提高打印文件的分类识别性能。3.研究基于多尺度LBP的打印文件鉴别方法。针对检材与样本之间无相同内容时的打印文件机源认证问题,提出了一种基于高斯金字塔图像分解的多尺度改进LBP打印文件鉴别算法。局部二进制模式是一种图像统计直方图特征,其受字符结构的影响不大,改进后的LBP特征更有效的提取了字符图像的局部结构的纹理差异。利用多尺度技术可以获取图像不同分辨率和不同粗细尺度下的信息,更有效的提取图像的特征,提高基于不同字的打印文件的分类鉴别性能。4.研究基于稀疏表示的打印文件机源认证方法。为了进一步提高打印文件机源认证的分类准确率,提出了一种基于GPD_CLBP特征和FDDL字典学习算法的打印文件认证方法。其运用字典学习算法,对字符图像的GPD_CLBP特征进行学习和分类。在英文和中文字符样本集上的实验结果表明,GFDDL算法只需相对较少的样本数据信息,取得相对更高的鉴别准确率。5.研究基于信息挖掘的打印文件机源认证。建立了打印文件字符纹理特征的单因子分析模型,验证了打印机纹理因素的显着性,理论上证明不同打印机的纹理特征存在显着性差异,纹理特征可以作为打印文件机源认证的依据。同时,对不同打印机打印的不同字符样本集,建立了纹理因素和字符因素的两因子方差分析模型,分析了纹理因素和字符因素对打印字符纹理特征的影响。利用两因子方差分析模型挖掘图像特征中的字符因子,消除字符因子的鉴别干扰,通过信息融合提高了鉴别性能,当两份打印文件中没有相同字符且整体字符数量较少时,也可获得良好的鉴别性能。本文通过对打印文件机源认证问题的深入分析,提出了有效的计算机打印文件检验方案,并对其中的问题进行深入的研究与探讨,取得较好的打印文件机源认证准确率。本论文的研究工作使计算机打印文件机源认证技术向实用化迈出了坚实的一步,对保护打印文件信息安全和维持社会秩序稳定具有重要的意义。(本文来源于《武汉大学》期刊2016-05-01)

文本无关论文开题报告范文

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对已有的笔迹鉴别方法对笔迹版式要求比较严格,且在小样本数据情况下,鉴别性能水平较低的问题,提出了邻环结构特征方法。首先对笔迹轮廓图像随机采样,然后利用网格窗口提取笔迹的邻环结构特征,最后利用主成分分析和线性鉴别分析方法对特征降维,利用深度置信网络对特征进行训练和鉴别。本文方法与文本无关,简单易行,在手写笔迹字符数量平均为45个的小样本上仍能有效表征作者风格信息。在HIT-MW笔迹鉴别数据库上的测试结果表明,本文方法达到了与使用较大样本的其他笔迹鉴别方法相近的鉴别效果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

文本无关论文参考文献

[1].陈国,刘亮亮,张再跃.用户短文本无关语自动识别方法研究[J].计算机与数字工程.2019

[2].全志楠,林家骏.文本无关的小样本手写汉字笔迹鉴别方法[J].华东理工大学学报(自然科学版).2018

[3].熊玉洁.基于边缘共生特征与字对辅助的文本无关书写人识别[D].华东师范大学.2018

[4].欧国振.基于SVM的文本无关的说话人辨认技术研究[D].南京邮电大学.2017

[5].王跃.基于I-VECTOR的与文本无关的说话人识别研究[D].兰州理工大学.2017

[6].杨瑞瑞.基于文本无关的声纹识别算法的研究及实现[D].电子科技大学.2017

[7].倪冬琴.基于特征子空间量化的文本无关说话人年龄识别[D].苏州大学.2016

[8].郭建敏,王晅.与文本无关的单训练样本说话人识别[J].陕西师范大学学报(自然科学版).2016

[9].薛帅强.基于文本无关的说话人识别技术的研究[D].西南科技大学.2016

[10].方天红.与文本无关的打印文件机源认证研究[D].武汉大学.2016

标签:;  ;  ;  ;  ;  ;  ;  

文本无关论文开题报告文献综述
下载Doc文档

猜你喜欢