导读:本文包含了数据归约论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:数据,属性,数据挖掘,粗糙,指标,子集,工作流。
数据归约论文文献综述
杨君石[1](2015)在《基于WEKA的主成分分析聚类的数据归约方法》一文中研究指出使用特征归约和值归约技术对数据进行预处理,可简化数据描述,提高数据挖掘算法的性能,本文讨论适用于独立学院学生成绩数据的数据归约方案,并使用WEKA平台实施以主成分分析法实现的特征归约和以k均值聚类实现的值归约方法。(本文来源于《福建电脑》期刊2015年08期)
康睿智,郝文宁[2](2016)在《数据归约效果评估方法研究》一文中研究指出数据归约效果的评估结果反映了归约后数据集的质量,同时也是相关算法及归约流程的选择、优化的依据。针对目前数据归约效果评估指标体系不完善、指标适用性弱以及效果评估方法缺乏针对性等问题,研究提出能够综合反映数据集归约前后的平均信息量减少程度、统计特征差异程度与数据量减小程度等叁个方面的评估指标及其计算方法,上述指标可为数据归约方案的效果评估提供定量依据。(本文来源于《计算机工程与应用》期刊2016年15期)
冯蕴天,张宏军,郝文宁[3](2014)在《基于元挖掘的数据归约工作流优化》一文中研究指出传统的数据归约工作流是依靠领域专家进行选择而产生的,这种选择工作流的方法虽然可靠性高,但效率很低。针对这种情况,提出1种基于元挖掘的工作流优化方法。利用元挖掘的思想进行数据归约实验,产生元数据,用户可依据元数据进行数据归约工作,得到基于数据集特征的工作流优化选择规则。实验结果表明,该方法能够自动给用户推荐恰当的、适用性强的数据归约工作流,满足用户的期望并且提高数据归约任务的执行效能。(本文来源于《系统仿真学报》期刊2014年10期)
杨栋[4](2013)在《基于粗糙集的数据归约算法研究》一文中研究指出在信息瞬息变幻的当今社会,如何从海量的知识库中挖掘隐含的、有价值的信息,已成为目前数据挖掘领域研究的热点和难点。粗糙集理论是一种有效处理不确定性和不精确性问题的数学工具,目前已被普遍的应用在医学诊断、模式识别等领域。粗糙集理论的核心问题之一是属性约简,它是数据归约的一种形式,其基本思想是在保持信息系统的分类能力不变的前提下,删除不必要的属性,减少数据的维度。为寻求高效的属性约简算法,论文对经典粗糙集模型和扩展粗糙集模型下的约简算法进行了研究,在分析了基于互信息和一致性准则属性约简算法的不足的基础上,完成了下列主要工作:(1)为了解决经典正区域求核算法的低效性,论文提出了一种简化正区域的新求核算法,实验结果表明,新算法的运行速度更快。(2)对基于一致性准则的属性约简算法效率进行了研究。从对象一致性的角度,重新定义了属性的重要度及核的计算方法,在此基础上,提出了一种改进一致性准则的属性约简算法。选取合适的一致性参数ε和数据集进行实验,证明了改进一致性准则属性约简算法的运行速度更快。(3)粗糙集在心血管疾病诊断中的应用研究。论文分析了心血管数据的基本特征,阐述了心血管数据的预处理方法,利用基于互信息和一致性准则的属性约简算法处理了心血管诊断实例,实验结果验证了基于粗糙集属性约简算法的有效性。(本文来源于《重庆理工大学》期刊2013-04-08)
林珠,邢延[5](2009)在《适用于时间序列分类的数据归约方法》一文中研究指出数据归约是一种数据前处理技术,能够有效地提高数据分类的效果。本文以单变量时序数据为主要研究对象,提出并实现了一种基于聚类的数据归约方法。该方法的基本思想是对时序数据的时间维度进行聚类,再对聚类结果进行分类。实验表明,该方法在有效地降低数据量的同时能够提高分类准确率,从而达到数据归约的目的。(本文来源于《2009年中国智能自动化会议论文集(第二分册)》期刊2009-09-27)
周晓洁,白杨,孙艳华,孙恩昌,张延华[6](2009)在《基于数据归约和面向属性归纳的网络流量分析系统》一文中研究指出为了满足网络流量分析系统对海量数据快速查询和提取的要求,主要应用数据挖掘技术中的数据归约和面向属性归纳方法,对采集到的海量数据进行了相关的前期处理,主要包括数据归约和数据泛化,使得前端系统与后台数据库间的数据交互得以高效便捷地完成。最后,利用某运营商提供的奥运专网数据对所设计的系统进行了实际测试,测试结果表明,系统运行稳定,效果良好。(本文来源于《中国电子科学研究院学报》期刊2009年04期)
刘云霞,贺晋兵[7](2009)在《数据归约中基于因子分析的属性选择方法》一文中研究指出属性子集的选择是数据归约的重要内容。文章提出了一种基于因子分析的无监督属性选择的方法。通过该方法选出的属性子集能够最好地覆盖数据的自然分类。在统计模拟中,这种方法也得到了很好的效果。(本文来源于《统计与决策》期刊2009年07期)
刘云霞[8](2007)在《数据归约的统计方法研究及应用》一文中研究指出数据归约是数据挖掘过程的关键环节,因此对数据归约技术的研究具有重要的意义。当前已有的数据归约方法多偏重于有监督学习,而无监督情形下归约方法的研究还相对不够丰富。鉴于这种情况,本论文的重点内容是尝试对无监督数据归约的统计方法及其应用进行研究。在本论文第一章中,首先阐述了选题的研究背景和研究意义。之后,在概述相关背景知识和总结国内外数据归约研究方法现状的基础上,明确了本论文的研究内容及创新之处。数据归约两项重要的基础工作--缺失值填补和异常值探测是第二章探讨的内容。在本章,根据对统计学中常用的各种缺失值填补和异常值探测方法的分析,总结出了一些适合数据挖掘使用的方法。此外,通过将几种异常值探测方法应用在某地区移动通讯用户缴费数据库上,对手机用户的消费行为进行了实证分析。数据归约包括元组的归约和属性的归约。本文在第叁章探讨了元组归约的两种主要方法--连续属性离散化和概念分层。在对当前的离散化方法和概念分层中面向属性归纳方法综述的基础上,提出了两种从独立性角度考虑的连续属性离散化方法,分别是基于可辨识矩阵的离散化方法和基于似然比假设检验的离散化方法。并通过在Iris样本集上对这两种方法进行模拟,验证了它们的有效性。属性重要性排序以及属性的提取和属性子集的选择是属性归约的两类方法。本文在第四章探讨了属性重要性的排序问题。数据挖掘中目前常见的排序问题是有监督属性的排序,本章首先对它们作了介绍和比较。然后在无监督属性重要性的排序方面,提出了单向有序列联资料的属性排序方法-改进秩和法和基于因子分析的无监督属性排序方法,这两种方法分别在一份调查问卷的列联资料和全国居民人均消费支出样本集的模拟中,取得了较为满意的结果。第五章探讨的是属性的提取和属性子集的选择问题。首先对目前在数据挖掘中用于属性线性提取的几种统计学和其他学科的方法作了介绍和评价。然后是本章的重点内容-属性子集的选择,在对属性子集选择的基本知识及目前已有的研究成果详细阐述和分析之后,提出了逐步向前的无监督属性选择方法,并通过实例验证了该方法的有效性。第六章对全文的主要工作进行了总结,并指出了有待进一步改进和完善的地方。本文的创新之处主要有以下四个方面:(1)提出了分别基于可辨识矩阵和基于似然比假设检验的两种连续属性离散化方法。(2)提出了单向有序列联资料属性排序的方法--改进秩和法。(3)提出了基于因子分析的无监督属性重要性的排序方法。(4)提出了逐步向前的无监督属性选择方法。(本文来源于《厦门大学》期刊2007-03-01)
李玲娟,梁玉龙,王汝传[9](2006)在《数据归约技术及其在IDS中的应用研究》一文中研究指出目前,数据挖掘技术已被广泛用于入侵检测系统(IDS)中以提高入侵检测系统的检测效率。文中以提高IDS中的数据挖掘效率为目标来研究数据归约技术,从特征归约、样本归约和特征值归约3个方面对数据归约技术进行了探讨,并对数据归约技术在入侵检测系统中的应用进行了实验,对实验结果进行了分析。(本文来源于《南京邮电大学学报(自然科学版)》期刊2006年06期)
谷建军,王洪国,丁艳辉[10](2006)在《粗糙集理论及其在数据归约中的应用》一文中研究指出数据预处理在数据挖掘中占有重要地位,传统的数据归约方法都有其局限性。本文介绍了粗糙集的相关概念及数据预处理的一些知识,并利用区分矩阵求粗糙集中核的思想,提出了一种知识归约的方法,为进一步的数据挖掘做准备。(本文来源于《信息技术与信息化》期刊2006年03期)
数据归约论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
数据归约效果的评估结果反映了归约后数据集的质量,同时也是相关算法及归约流程的选择、优化的依据。针对目前数据归约效果评估指标体系不完善、指标适用性弱以及效果评估方法缺乏针对性等问题,研究提出能够综合反映数据集归约前后的平均信息量减少程度、统计特征差异程度与数据量减小程度等叁个方面的评估指标及其计算方法,上述指标可为数据归约方案的效果评估提供定量依据。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据归约论文参考文献
[1].杨君石.基于WEKA的主成分分析聚类的数据归约方法[J].福建电脑.2015
[2].康睿智,郝文宁.数据归约效果评估方法研究[J].计算机工程与应用.2016
[3].冯蕴天,张宏军,郝文宁.基于元挖掘的数据归约工作流优化[J].系统仿真学报.2014
[4].杨栋.基于粗糙集的数据归约算法研究[D].重庆理工大学.2013
[5].林珠,邢延.适用于时间序列分类的数据归约方法[C].2009年中国智能自动化会议论文集(第二分册).2009
[6].周晓洁,白杨,孙艳华,孙恩昌,张延华.基于数据归约和面向属性归纳的网络流量分析系统[J].中国电子科学研究院学报.2009
[7].刘云霞,贺晋兵.数据归约中基于因子分析的属性选择方法[J].统计与决策.2009
[8].刘云霞.数据归约的统计方法研究及应用[D].厦门大学.2007
[9].李玲娟,梁玉龙,王汝传.数据归约技术及其在IDS中的应用研究[J].南京邮电大学学报(自然科学版).2006
[10].谷建军,王洪国,丁艳辉.粗糙集理论及其在数据归约中的应用[J].信息技术与信息化.2006