特征层融合论文-钟明静,卢涵宇,李丹杨,兰海翔,侯汝冲

特征层融合论文-钟明静,卢涵宇,李丹杨,兰海翔,侯汝冲

导读:本文包含了特征层融合论文开题报告文献综述及选题提纲参考文献,主要关键词:表情识别,特征层融合,PCA,BP神经网络

特征层融合论文文献综述

钟明静,卢涵宇,李丹杨,兰海翔,侯汝冲[1](2019)在《基于特征层融合与BP神经网络的人脸表情识别研究》一文中研究指出针对图像处理中人脸表情识别率不高的问题,提出了一种基于特征层融合和神经网络的人脸表情识别方法。利用PCA对原图像进行特征降维处理得到维数较低的表情图像特征,再从粗到细策略对特征进行融合,最后采用神经网络的BP反向传播算法对训练集和验证集经多次迭代后训练好人脸表情模型。将收集到的表情数据进行实验仿真对比表明:本文提出方法与常用的分类算法相比,人脸表情识别率在本文提到的表情数据库上取得更好的效果。(本文来源于《广西大学学报(自然科学版)》期刊2019年05期)

李杰[2](2019)在《基于FCN和特征层融合的场景文本检测研究》一文中研究指出场景图像中的文字所表达的直接含义对于理解场景内容尤为关键,越来越多的智能应用都使用到场景中的文字信息。但受不同字体、任意排列方向以及复杂背景、光照等因素影响,现有的文本检测方法都具有很多局限性。相比传统机器学习算法,深度学习算法能够学习文本的深度特征,具有更加出色的性能。本文结合分段链接的思想并分别采用位置回归与语义分割的方法设计实现了以下两个文本检测模型:(1)基于特征层融合的表征增强模型。分段链接模型的分层结构包含文本的语义信息不足导致对小文本检测效果比较差,通过加入特征层融合结构解决了该问题。首先使用转置卷积对特征层上采样然后按照自后向前的顺序进行逐层融合。融合特征层既保留了高分辨率的细节特征又加入了强化的全局特征,可以为定位文本提供更准确的位置与边界信息。利用融合特征层检测的F值相比分段链接模型在数据集ICDAR2015,MSRA-TD500分别提高了 1.9%,1.6%。针对加入特征层融合结构后网络加深造成误差传递困难,可能导致网络性能降低的问题,设计了基于残差网络的预测结构。利用跳跃连接结构降低了网络的训练难度,在ICDAR 2015仅用50%的迭代次数即可达到原先的训练损失,并且F值提高1.0%。分段链接模型使用单个矩形定位弯曲文本存在较大误差,因此提出基于旋转角度的片段分组策略。通过将弯曲文本进行分段表示并使用单个矩形对各段文本分别标定有效降低了定位误差。(2)基于语义分割的候选文本过滤模型。针对表征增强模型存在较多背景误检的问题,设计了语义分割结构。利用全卷积神经网络(FCN)获得文本显着图并使用连通分量分析提取有效文本区域,通过过滤候选框内文本区域占比低于阚值的文本有效消除了部分误检,在ICDAR 2015的准确率提高了 5.0%。针对训练过程中语义分割损失向大文本倾斜,导致对小文本判别准确性比较差的问题,设计了文本平衡策略。通过为每个文本实例分配相同的权重平衡了模型对不同尺寸的文本的正确分类性能,增强了模型对小文本的判别能力,在MSRA-TD500的F值提高了 1.0%。对比最新算法在不同数据集的表现,候选文本过滤模型在ICDAR 2013的F值比借助实例分割检测场景文本算法(PixelLink)提高了1 1%。最后结合特征层融合与语义分割实现了 Web端的场景文本检测系统,该系统支持单词和文本行两种定位粒度,可以对部分现实场景中的文本实现准确定位。(本文来源于《北京交通大学》期刊2019-05-01)

修玉环[3](2019)在《手写中文文本视觉信息与语言信息特征层融合的深度网络模型研究》一文中研究指出手写中文文本识别是计算机视觉和模式识别领域的研究热点和难点之一,深度学习的兴起为手写中文文本识别提供了新的研究方法。大多数现有的基于深度学习的方法首先利用视觉信息训练识别模型,然后将识别模型的结果与语言模型相结合,即在决策层融合视觉信息与语言信息。本文从在特征层融合视觉信息与语言信息的角度出发,采用深度学习方法和强化学习方法构建深度网络模型,解决手写中文文本识别问题。旨在通过具有丰富语义信息的多模态联合表达,来提高模型的识别性能。本文的主要工作包括:(1)研究了基于注意力机制的编码解码模型在手写中文文本识别中的应用,将字符级别视觉信息与语言信息的特征层融合模块嵌入基于长短期记忆神经网络的解码模块,构建基于字符级别特征层融合的手写中文文本识别模型。具体地,由于视觉信息与语言信息之间存在着表达形式和语义层次的差异,为了对每个字符的多模态联合表达进行有效地学习,本文探索了叁种字符级别视觉信息与语言信息的特征层融合方法,分别是基于向量加和、向量拼接和门机制的方法。实验结果表明了在特征层融合视觉信息与语言信息的有效性,验证了采用基于门机制的方法相比于其他两种方法能够取得更好的识别效果。(2)在字符级别视觉信息与语言信息的特征层融合方法的基础上,进一步采用卷积神经网络对基于长短期记忆神经网络的解码模块预测出的历史文本片段进行视觉信息与语言信息的特征层融合,构建基于多级别特征层融合的手写中文文本识别模型。通过对历史文本片段进行有效地建模,解决解码模块面临的梯度消失、曝光偏差和无法捕获文本序列中的层次结构信息的问题。实验结果表明,该模型与现有最先进的模型性能相当,与基于字符级别特征层融合的手写中文文本识别模型相比在字符级别的准确率上相对提高了3.34%。(3)探索了利用强化学习来优化手写中文文本识别模型的方法,根据测试阶段的评估指标来引导模型学习更好的序列决策过程,构建基于深度强化学习的手写中文文本识别模型。具体地,采用策略梯度方法,将测试阶段的评估指标作为奖励,通过最大化期望奖励来对基于多级别特征层融合的手写中文文本识别模型的参数进行调优。通过强化学习的方法,进一步解决了编码解码模型面临的曝光偏差和损失评估不匹配的问题。实验结果表明,强化学习可以有效地提高模型的识别性能。(本文来源于《华东师范大学》期刊2019-03-01)

吴双,王杰,俞雅茹,涂斌,郑晓[4](2017)在《基于拉曼和近红外光谱特征层融合的食用油MUFA和PUFA含量检测》一文中研究指出针对食用油中单不饱和脂肪酸(MUFA)和多不饱和脂肪酸(PUFA)含量的快速检测问题,研究探索应用拉曼(Raman)和近红外(NIR)光谱以及特征层数据的融合,结合化学计量学分析,建立食用油MUFA和PUFA含量预测模型。重点研究各种预处理算法对模型预测能力的影响。应用竞争性自适应重加权采样(CARS)提取Raman和NIR光谱的特征波长,应用网格搜索(GS)算法选取支持向量机回归(SVR)模型的参数组合(C,g)值,分别建立基于拉曼和近红外光谱的特征波段的SVR预测模型;建立基于特征层的多源光谱融合的SVR预测模型。试验表明,基于特征层融合建立的Raman-NIR-SVR模型能够实现食用油MUFA和PUFA含量的快速预测,且预测效果更优。其中预测MUFA含量的SG15-ALS-Nor-CARS-MSC-CARSSVR模型的预测集决定系数R2为0.977 3,与单光谱中最优含量预测模型相比增加了2.43%;而预测PUFA含量的MA11-air PLS-Nor-CARS-MSC-CARS-SVR模型的预测集R2为0.993 0,比较最优单光谱数据建立的SVR模型增加了2.57%。结果表明,采用特征层融合方法建立的含量预测模型的综合性能优于基于单光谱数据建立的模型。(本文来源于《中国粮油学报》期刊2017年11期)

程晓[5](2017)在《基于特征层融合的多模态情感识别研究》一文中研究指出情感识别作为情感计算领域中的重要分支,在人工智能、人机交互等许多方面都具有广阔的应用前景。不同模态的情感识别可以优势互补,不断提高识别系统的精度,以促进产生更高质量、更加和谐的人机交互系统,使人类生活变得更加智能便捷。本文主要研究基于面部情感特征、语音情感特征、姿态情感特征以及生理信号相关情感特征的情感识别系统,具体包括:提取不同模态的情感特征、对提取的不同模态的情感特征进行融合以及最后的分类识别。论文的主要工作如下:(1)对数据库中的样本提取不同模态的特征,包括:使用二维Gabor滤波器提取面部表情样本的Gabor特征;使用OPENSMILE对包含情感的语音样本提取其综合的语音情感特征(包括:振幅、基频、共振峰等);使用Harris角点检测姿态情感样本中的兴趣点进而提取其时空特征。(2)提出一种基于遗传算法的特征层融合方法,并将该方法与基于主成分分析的特征层融合方法、基于核典型相关分析的特征层融合方法、基于核矩阵融合的特征层融合方法进行比较,实验结果表明,论文提出的方法具有更好的融合效果。(3)将通过不同方法得到的融合特征输入支持向量机(SVM)进行分类识别,实现多模态情感识别,得到多模态的情感识别结果,将多模态的情感识别结果与单一模态的情感识别结果进行比较,实验结果表明,从识别结果的角度来看,使用适当融合方法的多模态情感识别结果要比单模态情感识别结果有明显提高。(本文来源于《南京邮电大学》期刊2017-10-26)

苗迪[6](2017)在《基于特征层与分数层的多模态生物特征融合》一文中研究指出生物特征识别在人类的生产活动中,起到了越来越重要的作用。同时,随着生物特征识别越来越广泛的应用,单模态生物特征识别不足以满足实际使用中的诸多需求这一问题越发地突显出来。而多模态生物特征融合方法能够通过集成多个生物模态的信息,来缓解单模态生物特征识别系统在使用中所遇到的障碍。在最近的十几年里,多模态生物特征识别取得了迅猛的发展,然而仍有部分关键问题有待得到进一步解决,例如提取多模态互补信息、缓解噪声影响以及利用深层次信息等问题。本文基于多模态生物特征的特征层与分数层数据,从上述实际问题出发,探索能够有效缓解上述问题的融合方法和策略,同时建立方便、准确、高效的多模态生物特征识别系统。本文中,主要工作和贡献如下:·在高通量的场景下,以提取多模态生物特征之间的互补信息为目的,本文提出了一种基于稀疏线性规划的异质特征选择模型。基于该模型的融合方法能够提取多模态互补信息、去除冗余信息、降低所使用的异质特征维度并且减少所需的计算以及存储消耗,进而实现快速、准确地对用户身份进行识别。该模型具有所选特征稀疏、泛化能力强等诸多优良特性。由于该融合方法能够充分提取特征之间的互补性、去除冗余性,因此该方法能够在保证融合后识别性能提升的前提下,降低计算复杂度以及融合的时间消耗。·针对远距离生物特征识别系统中,由于环境噪声的干扰,致使融合后识别性能下降的问题,我们提出了一种对噪声鲁棒的融合模型。在生物特征识别系统中,噪声的干扰往往在获取数据环节最为强烈,并且会影响后续流程,如特征提取、特征比对等流程,进而影响最终融合的识别结果。本文针对噪声对分数层数据产生的影响,提出了一种基于对噪声充分估计的鲁棒线性规划模型,最大限度的在分数层面上消除了噪声的影响。该方法采用特征的线性组合模式,因此消除噪声影响的同时,还保证了算法的效率,保证了系统的实用性。该方法可以在系统的保守性与鲁棒性之间取得较好的平衡。本文提出了针对新型鲁棒线性规划模型的快速数学求解方法,将高度非线性模型转化为线性规划模型进行求解,使得求解过程更加简便高效。同时本文还从概率的角度对所提出的模型进行了阐述,计算出了该模型最优解情况下分类错误率的上确界,具有较为深刻的物理意义。·在特征数量有限的情况下,提出了一种能够从比对分数中抽取隐含信息的分段线性分类器融合方法。用户的生物特征信息在生物特征识别系统中,经由特征采集、特征提取、特征比对等模块时,虽然所操作的数据具有了规范化、可操作性强等特点,但是其所承载的用户生物特征信息随着数据处理而减少。而且生物特征比对分数与决策值之间的关系是高度非线性的,但是在通过比对分数计算得出决策值时,大部分系统都是采用简单的线性融合分类器来模拟该高度非线性的关系,这进一步导致了更多细节信息的丢失。为了恢复这些隐藏在分数层中的用户生物特征信息,本文提出了一种分段线性分类器融合框架。该方法受到"非线性是绝对的,线性是相对的"观点启发,通过对特征空间离散化的方法,自适应地学习得到比对分数与决策值之间的非线性函数关系。本方法可看作是将低维分数映射到高维空间的映射函数,因此也可以从核函数的角度,作为一种自适应的核函数映射方法。本文还对分段线性分类器融合框架下叁种性能优异的融合分类器进行了分析与说明,并指出了其分别所擅长的实际应用中的问题。由于人类的脸部区域生物模态丰富,同时便于采集,而且在实际使用中能够与用户良好的交互,较多的多模态生物特征融合系统采用对人脸、虹膜、眼周等生物模态进行融合,不仅提升系统的准确性,还提高系统的易用性。因此,本文中也采用对人脸区域的生物模态进行融合,来验证本文中所提出的方法的有效性,从实际需求出发,建立便捷、准确的多模态生物特征识别融合系统。综上,本文对现有多模态生物特征融合工作中存在的问题进行了分析和研究,针对不同问题提出了具有创新性的解决方法,工作具有开创性的意义,推动了多模态融合识别的进一步发展。(本文来源于《中国科学技术大学》期刊2017-05-01)

王星,王志鹏,呙鹏程,周东青,杜文红[7](2016)在《应用D-S证据理论的雷达工作模式特征层融合识别》一文中研究指出日趋复杂的战场电磁环境对雷达工作模式识别提出了更高的要求,针对传统单平台工作模式识别方法的局限性,提出了一种在多平台协同背景下基于Dempster-Shafer(D-S)证据理论的雷达工作模式特征层融合识别算法。该算法运用隶属度函数获得基本信任赋值,根据Dempster合成规则,首先对多平台侦收的同一参数数据进行多平台参数内融合,然后进行参数间融合获得合成信任度,最后依据工作模式判定规则识别雷达工作模式。通过仿真实验,多平台融合识别算法的识别率较单平台识别方法平均提高了27%,实验结果说明融合识别方法有效地提高了识别性能。(本文来源于《空军工程大学学报(自然科学版)》期刊2016年04期)

张秀文[8](2016)在《多源特征层融合故障诊断方法在电力电子电路中的应用》一文中研究指出科学技术和社会的不断发展和融合,带来了人们对大型设备的多源化需求,随着这些设备的使用和推广,不仅为人们的生活和工作带来了诸多便利,也为人们带来了有关设备故障的安全隐患。为尽可能减少安全事故的发生,保障人们的生产和生活安全,人们在不断研究和发展故障诊断技术。多源特征层融合故障诊断是相对较为智能和高效的故障诊断方法,随着应用的不断发展与推广,在故障诊断领域占据着越来越重要的位置。本文通过对电力电子电路中运用多源特征层融合故障诊断方法的研究,希望能真正促进电力电子电路中安全系数的提升,为相关工作研究提供参考。(本文来源于《电子制作》期刊2016年09期)

余鲲,杨俊杰,楼志斌,魏春娟[9](2016)在《输电线路覆冰状态下信息融合模型特征层的分类方法研究》一文中研究指出以输电线路覆冰的状态监测为背景,研究此背景下信息融合模型特征层的分类方法。探讨分析了BP神经网络和支持向量机解决问题的可行性,在实验室条件下用两种算法实现了信息融合模型特征层的分类并作了比较总结。(本文来源于《仪表技术》期刊2016年02期)

尚朝轩,王品,韩壮志,彭刚[10](2016)在《基于类决策树分类的特征层融合识别算法》一文中研究指出针对雷达组网量测数据不确定性大、信息不完备等特点,基于决策树分类算法的思想,创建类决策树的概念,提出一种基于类决策树分类的特征层融合识别算法.所给出的算法无需训练样本,采用边构造边分类的方式,选取信息增益最大的属性作为分类属性对量测数据进行分类,实现了对目标的识别.该算法能够处理含有空缺值的量测数据,充分利用量测数据的特征信息.仿真实验结果表明,类决策树分类算法是一种简单有效的特征层融合识别算法.(本文来源于《控制与决策》期刊2016年06期)

特征层融合论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

场景图像中的文字所表达的直接含义对于理解场景内容尤为关键,越来越多的智能应用都使用到场景中的文字信息。但受不同字体、任意排列方向以及复杂背景、光照等因素影响,现有的文本检测方法都具有很多局限性。相比传统机器学习算法,深度学习算法能够学习文本的深度特征,具有更加出色的性能。本文结合分段链接的思想并分别采用位置回归与语义分割的方法设计实现了以下两个文本检测模型:(1)基于特征层融合的表征增强模型。分段链接模型的分层结构包含文本的语义信息不足导致对小文本检测效果比较差,通过加入特征层融合结构解决了该问题。首先使用转置卷积对特征层上采样然后按照自后向前的顺序进行逐层融合。融合特征层既保留了高分辨率的细节特征又加入了强化的全局特征,可以为定位文本提供更准确的位置与边界信息。利用融合特征层检测的F值相比分段链接模型在数据集ICDAR2015,MSRA-TD500分别提高了 1.9%,1.6%。针对加入特征层融合结构后网络加深造成误差传递困难,可能导致网络性能降低的问题,设计了基于残差网络的预测结构。利用跳跃连接结构降低了网络的训练难度,在ICDAR 2015仅用50%的迭代次数即可达到原先的训练损失,并且F值提高1.0%。分段链接模型使用单个矩形定位弯曲文本存在较大误差,因此提出基于旋转角度的片段分组策略。通过将弯曲文本进行分段表示并使用单个矩形对各段文本分别标定有效降低了定位误差。(2)基于语义分割的候选文本过滤模型。针对表征增强模型存在较多背景误检的问题,设计了语义分割结构。利用全卷积神经网络(FCN)获得文本显着图并使用连通分量分析提取有效文本区域,通过过滤候选框内文本区域占比低于阚值的文本有效消除了部分误检,在ICDAR 2015的准确率提高了 5.0%。针对训练过程中语义分割损失向大文本倾斜,导致对小文本判别准确性比较差的问题,设计了文本平衡策略。通过为每个文本实例分配相同的权重平衡了模型对不同尺寸的文本的正确分类性能,增强了模型对小文本的判别能力,在MSRA-TD500的F值提高了 1.0%。对比最新算法在不同数据集的表现,候选文本过滤模型在ICDAR 2013的F值比借助实例分割检测场景文本算法(PixelLink)提高了1 1%。最后结合特征层融合与语义分割实现了 Web端的场景文本检测系统,该系统支持单词和文本行两种定位粒度,可以对部分现实场景中的文本实现准确定位。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

特征层融合论文参考文献

[1].钟明静,卢涵宇,李丹杨,兰海翔,侯汝冲.基于特征层融合与BP神经网络的人脸表情识别研究[J].广西大学学报(自然科学版).2019

[2].李杰.基于FCN和特征层融合的场景文本检测研究[D].北京交通大学.2019

[3].修玉环.手写中文文本视觉信息与语言信息特征层融合的深度网络模型研究[D].华东师范大学.2019

[4].吴双,王杰,俞雅茹,涂斌,郑晓.基于拉曼和近红外光谱特征层融合的食用油MUFA和PUFA含量检测[J].中国粮油学报.2017

[5].程晓.基于特征层融合的多模态情感识别研究[D].南京邮电大学.2017

[6].苗迪.基于特征层与分数层的多模态生物特征融合[D].中国科学技术大学.2017

[7].王星,王志鹏,呙鹏程,周东青,杜文红.应用D-S证据理论的雷达工作模式特征层融合识别[J].空军工程大学学报(自然科学版).2016

[8].张秀文.多源特征层融合故障诊断方法在电力电子电路中的应用[J].电子制作.2016

[9].余鲲,杨俊杰,楼志斌,魏春娟.输电线路覆冰状态下信息融合模型特征层的分类方法研究[J].仪表技术.2016

[10].尚朝轩,王品,韩壮志,彭刚.基于类决策树分类的特征层融合识别算法[J].控制与决策.2016

标签:;  ;  ;  ;  

特征层融合论文-钟明静,卢涵宇,李丹杨,兰海翔,侯汝冲
下载Doc文档

猜你喜欢