导读:本文包含了训练数据集论文开题报告文献综述及选题提纲参考文献,主要关键词:表情识别,自然表情数据集,预训练,深度卷积神经网络
训练数据集论文文献综述
彭先霖,张海曦,胡琦瑶,温超[1](2019)在《基于自发表情数据集预训练的多任务深度网络表情识别方法》一文中研究指出为了更好地将现有深度卷积神经网络应用于表情识别,提出将构建自然表情图像集预训练和多任务深度学习相结合的方法;首先,利用社交网络图像构建一个自发人脸表情数据集,对现有深度卷积神经网络进行预训练;然后,以双层树分类器替换输出层的平面softmax分类器,构建深度多任务人脸表情识别模型;在CK+数据集和Oulu-Caisa数据集上的验证实验表明,提出方法的准确率较深度卷积神经网络vgg-face和Inception V3方法平均提高了3.1%,较基于多任务深度卷积神经网络方法平均提高了0.7%。(本文来源于《计算机测量与控制》期刊2019年07期)
鄢文苗,任东,黄应平,熊彪,董方敏[2](2019)在《基于SVM土壤重金属污染评价的训练数据集构建》一文中研究指出支持向量机(support vector machine,SVM)用于土壤重金属污染评价时,其训练数据集的构建对模型准确性影响重大。本文对依据土壤环境质量国家标准生成数据集的方法(国标法)进行改进,提出实际测量数据集生成方法(实测法),并在实测法样本中添加国标法样本扩大训练数据集,进一步提高模型分类准确率。结果表明:对同一组实测样本进行分类,国标法模型准确率(53. 33%)低于实测法模型准确率(75. 56%);扩大后的数据集训练所得模型与实测法模型相比,分类60个实测样本时,准确率由88. 33%提高至98. 33%,分类45个实测样本时,准确率由75. 56%提高至82. 22%。(本文来源于《武汉大学学报(理学版)》期刊2019年03期)
李国和,张腾,吴卫江,洪云峰,周晓明[3](2019)在《面向机器学习的训练数据集均衡化方法》一文中研究指出为提高机器学习算法对于不均衡数据的建模效果,提出一种均衡化预处理方法。采用iForest形成每个样本在样本空间中的分布特征评估值,基于负类(多数类)样本的分布特征评估值定义概率分布;根据样本的概率分布,通过轮盘转算法选取负类样本;通过K-means方法形成若干负类样本聚类中心,以聚类中心为最终负类选取样本,实现正负类样本的均衡化。整个过程构成均衡化方法iForest-RM。iForest-RM与其它采样方法在Adaboost模型上的实验对比结果表明,iForest-RM具有更好的均衡化能力,更好获取样本空间分布特性,可有效应用于地震相识别。(本文来源于《计算机工程与设计》期刊2019年03期)
张智军,王倩,席岩,王磊[4](2017)在《面向媒体融合的深度学习训练数据集研究》一文中研究指出深度模型结构复杂,对其进行优化需要庞大的数据量和计算资源,训练数据库的规模和质量直接影响模型的效果。本文介绍了进行深度学习研究时常用的图像、logo、视频和音频等4类数据库,分别从数据库图像数目、类别、大小、训练/测试集划分和视觉任务等方面进行了阐述,并进行了总结。(本文来源于《广播电视信息》期刊2017年10期)
高婧[5](2016)在《汉语动词论元结构训练和语义特征数据集研究》一文中研究指出言语治疗的最终目的是改善的患者的交流能力。交流能力的改善体现为患者可以自由产出句子,而动词在句子中起关键作用,因此需要探索失语症患者的动词训练方法,而在训练过程中又涉及如何给予患者合适的提示来促进其动词命名能力的提高,因此本研究旨在为言语治疗提供新的训练方法,主要目标是通过建立动词语义特征数据集和动词论元结构训练流程,探讨动词论元结构训练效果及不同论元的语义特征分布情况。通过训练失语症患者的动词论元结构,一方面可以提高训练动词的命名能力,另一方面可以改善患者句子产出能力,同时训练后患者的工作记忆好转。本研究在前期研究的基础上,将先前建立的汉语词汇语义特征分型方案应用于动词语义特征分析,建立动词语义特征数据集。通过上述工作,本研究为言语认知治疗提供了素材选择和训练方法流程规范。本研究的创新之处在于,把语言学的理论应用于临床言语治疗,并且规范了汉语动词论元结构训练流程。本研究的理论价值在于,将汉语词汇语义特征分析研究扩展至动词。本研究的应用价值在于,建立的汉语动词语义数据集为言语认知治疗提供了素材。(本文来源于《南京医科大学》期刊2016-05-01)
曾志强,廖备水,高济[6](2009)在《面向超大数据集的SVM近似训练算法》一文中研究指出标准SVM学习算法运行所需的时间和空间复杂度分别为O(l3)和O(l2),l为训练样本的数量,因此不适用于对超大数据集进行训练。提出一种基于近似解的SVM训练算法:Approximate Vector Machine(AVM)。AVM采用增量学习的策略来寻找近似最优分类超平面,并且在迭代过程中采用热启动及抽样技巧来加快训练速度。理论分析表明,该算法的计算复杂度与训练样本的数量无关,因此具有良好的时间与空间扩展性。在超大数据集上的实验结果表明,该算法在极大提高训练速度的同时,仍然保持了原始分类器的泛化性能,并且训练完毕具有较少的支持向量,因此结果分类器具有更快的分类速度。(本文来源于《计算机科学》期刊2009年11期)
曾联明,吴湘滨,刘鹏[7](2009)在《利用粒子群算法缩减大规模数据集SVM训练样本》一文中研究指出对于大规模SVM训练样本数据,在分类前采用粒子群算法进行样本缩减,每一个粒子的维对应一个样本状态,通过更新粒子的速度和位置信息,调整训练样本的状态,引导粒子向分类最优的样本状态组合方向移动,去除样本中对分类不起作用的非支持向量和冗余的支持向量所对应的样本,生成新的缩减样本,进行分类训练,从而达到提高训练效率的目的。基于大规模遥感图像数据集的分类实验表明,此方法在确保不降低分类精度的前提下减少了分类时间。(本文来源于《计算机科学》期刊2009年09期)
罗瑜,易文德,王丹琛,何大可[8](2007)在《大规模数据集下支持向量机训练样本的缩减策略》一文中研究指出大量数据下支持向量机的训练算法是SVM研究的一个重要方向和焦点。该文从分析SVM训练的问题的实质和难点出发,提出一种在训练前先求出类别质心,去除非支持向量对应的样本,从而达到缩小样本集的方法。该方法在不损失分类正确率的情况下具有更快的收敛速度,并从空间几何上解释了支持向量机的原理。仿真实验证明了该方法的可行性和有效性。(本文来源于《计算机科学》期刊2007年10期)
陈栋梁,王浩,姚宏亮[9](2007)在《一种支持向量机大规模数据集训练算法》一文中研究指出支持向量机训练中样本集过大将会导致训练过程非常缓慢问题,本文研究支持向量机训练中样本集分布的几何特征,在不影响分类性能的前提下,提出一种适合大样本集训练的Quasi Choosing算法,该算法能剔除大部分与训练结果无关的样本,可有效加快训练速度。(本文来源于《中国仪器仪表学会第九届青年学术会议论文集》期刊2007-10-01)
单莘,朱永宣,郭军[10](2006)在《一种大数据集上的非线性PSVM训练方法》一文中研究指出PSVM作为一种新型SVM方法,避免了求解二次规划问题,具有更快的计算速度,但对于大规模数据集,采用传统方法求解非线性PSVM面临大矩阵求逆的困难。文章基于共轭梯度法结合低秩估计提出了一个大数据集上的非线性PSVM训练方法NPSVM-LD,通过多次迭代的矩阵乘积运算避免了对大矩阵的求逆。在UCI数据集上的实验表明,该方法能够在应用非线性核函数条件下,使PSVM有效处理规模在10000以内的训练集的情况。(本文来源于《微电子学与计算机》期刊2006年07期)
训练数据集论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
支持向量机(support vector machine,SVM)用于土壤重金属污染评价时,其训练数据集的构建对模型准确性影响重大。本文对依据土壤环境质量国家标准生成数据集的方法(国标法)进行改进,提出实际测量数据集生成方法(实测法),并在实测法样本中添加国标法样本扩大训练数据集,进一步提高模型分类准确率。结果表明:对同一组实测样本进行分类,国标法模型准确率(53. 33%)低于实测法模型准确率(75. 56%);扩大后的数据集训练所得模型与实测法模型相比,分类60个实测样本时,准确率由88. 33%提高至98. 33%,分类45个实测样本时,准确率由75. 56%提高至82. 22%。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
训练数据集论文参考文献
[1].彭先霖,张海曦,胡琦瑶,温超.基于自发表情数据集预训练的多任务深度网络表情识别方法[J].计算机测量与控制.2019
[2].鄢文苗,任东,黄应平,熊彪,董方敏.基于SVM土壤重金属污染评价的训练数据集构建[J].武汉大学学报(理学版).2019
[3].李国和,张腾,吴卫江,洪云峰,周晓明.面向机器学习的训练数据集均衡化方法[J].计算机工程与设计.2019
[4].张智军,王倩,席岩,王磊.面向媒体融合的深度学习训练数据集研究[J].广播电视信息.2017
[5].高婧.汉语动词论元结构训练和语义特征数据集研究[D].南京医科大学.2016
[6].曾志强,廖备水,高济.面向超大数据集的SVM近似训练算法[J].计算机科学.2009
[7].曾联明,吴湘滨,刘鹏.利用粒子群算法缩减大规模数据集SVM训练样本[J].计算机科学.2009
[8].罗瑜,易文德,王丹琛,何大可.大规模数据集下支持向量机训练样本的缩减策略[J].计算机科学.2007
[9].陈栋梁,王浩,姚宏亮.一种支持向量机大规模数据集训练算法[C].中国仪器仪表学会第九届青年学术会议论文集.2007
[10].单莘,朱永宣,郭军.一种大数据集上的非线性PSVM训练方法[J].微电子学与计算机.2006