导读:本文包含了负项目论文开题报告文献综述、选题提纲参考文献,主要关键词:频繁,规则,项目,模式,兴趣,一般化。
负项目论文文献综述写法
张玉芳,王灿,熊忠阳[1](2008)在《一种改进的含负项目关联规则挖掘算法》一文中研究指出在含负项目的一般化关联规则的挖掘中,由于负项目的引入使得频繁项集的搜索空间变得更加巨大,而同时挖掘出的关联规则数量也随之增大,但其中很多规则对用户来说是不感兴趣的,而且可能包含一些冗余和错误的规则。因此提出了最大支持度的概念,用来约束频繁项集的挖掘,排除没有意义的关联规则同时也提高了挖掘的效率。在挖掘中对正负项目分别采用不同的最小支持度,使得挖掘更加灵活。并通过实验证明改进是行之有效的。(本文来源于《计算机工程与应用》期刊2008年20期)
王灿[2](2008)在《含负项目的关联规则挖掘算法研究》一文中研究指出近年来,随着计算机技术的发展、数据管理技术的成功应用、企业内部信息化程度的不断提高,各个应用领域的数据库中都积累了海量的数据。利用数据挖掘技术能够从大规模的数据中获取正确的、有趣的、潜在有价值的知识。而关联规则挖掘则是其中一个重要的研究方法,具有重要的理论价值和广泛的应用前景。当前,传统的正关联规则的挖掘受到了相当的关注,对于包含负项目的关联规则却并未给予足够的重视。然而在很多领域中,只挖掘出传统的关联规则往往是不够的,需要对数据项的否定项进行挖掘。因此有必要研究事物负属性之间的关联关系。现有的挖掘含负项目的关联规则算法为数不多,而且多是基于Apriori思想的迭代算法,需要对数据集进行多次扫描,同时生成大量的候选频繁项集。针对这些不足论文提出一种基于频繁模式树的频繁项集挖掘算法。算法借用FP-growth算法中频繁模式树这种压缩存储事务的数据结构,因此具有无需多次扫描数据库,不用生成大量候选项集的优点。除此之外,算法对频繁模式树中每个节点增加一个位串来存储该项目的前缀项目,以避免在模式扩展的时候频繁的遍历子树。实验表明,论文提出的算法比现有的同类挖掘算法具有更好的效率。另外,在含负项目的关联规则挖掘中,由于负项目的引入使得频繁项集的搜索空间变得更加巨大,而同时挖掘出的负关联规则数量也随之增大。但其中很多规则对用户来说是不感兴趣的,而且可能包含一些冗余和错误的规则。因此在传统的“支持度——置信度——兴趣度”评价标准之上,引入了最大支持度的概念,在生成频繁项集阶段就将没有意义的项集排除掉,以使得挖掘结果更有意义。实验结果表明,论文提出的改进算法是正确有效的。(本文来源于《重庆大学》期刊2008-04-01)
张玉芳,彭燕,刘君,陈铭灏[3](2006)在《一种含负项目的一般化关联规则挖掘算法》一文中研究指出传统的关联规则是形如A B反映正项目之间关联关系的蕴涵式,它无法反映出数据之间隐藏的负关联关系。在表达式中引入负项目,将这种传统的关联规则扩展成包含正、负项目的一般化关联规则。介绍了一般化关联规则的概念及其相关性质定理,并加以证明,提出了一种基于频繁模式树的挖掘混合正、负项目的一般化关联规则的MGPNFP算法,对其性能进行了分析,并比较了MGPNFP算法比现有的挖掘含负项目关联规则的算法所具有的优势。(本文来源于《计算机工程与设计》期刊2006年20期)
彭燕[4](2006)在《含负项目的一般化关联规则算法研究》一文中研究指出近年来,随着计算机和互联网的普及以及数据库技术的发展,各个应用领域的数据库中都积累了海量的数据,通过数据挖掘分析和理解这些数据,揭示其中隐藏的有用信息成为当前最为活跃的研究领域之一。其中关联规则挖掘是数据挖掘的一个重要模式,具有重要的理论价值和广泛的应用前景。关联规则就数据项之间的相关性来说,可以有正负关联规则之分。当前,正关联规则的挖掘受到了广泛的关注,而对于包含负属性或负项目的关联规则并未给予足够的重视。然而在很多应用领域中,事物的否定因素也是非常重要的信息来源,因此有必要研究事物负属性之间的关联关系。论文基于传统的正关联规则和对新兴的负关联规则定义的修改,提出了含负项目的一般化关联规则。现有的挖掘负关联规则以及含负项目的关联规则算法为数不多,而且本质上都是基于Apriori思想的迭代算法,需要对数据集进行多次扫描,同时生成大量的候选频繁项集。论文提出一种新的挖掘含负项目的频繁项集算法,即基于频繁模式树的算法。该算法借用FP_growth算法中频繁模式树这种压缩存储事务的数据结构,通过频繁模式树进行模式扩展,挖掘含负项目的频繁项集。由于该算法的基本思想类似于FP_growth算法,因此具有无需多次扫描数据库,不用生成大量候选项集的优点。除此之外,该算法与直接使用FP_growth算法挖掘含负项目的频繁项集算法相比,无需对原始数据库进行负项目的扩展,也不用再构造并销毁额外的数据结构,只需在原始的频繁模式树上修改,在时间和空间的开销上都具有一定的优势。实验表明,论文提出的算法比现有的同类挖掘算法和直接FP_growth算法具有更好的效率。另外,论文在借鉴Apriroi性质的基础上,提出了一个置信度性质,并引入了兴趣度作为关联规则的第叁个测度参数。论文基于置信度性质和兴趣度阈值,并借用Apriori算法,从挖掘出的含负项目的频繁项集中提取出含负项目的一般化关联规则。论文另外对含负项目的一般化关联规则的矛盾性进行了讨论。实验结果表明,论文提出的改进算法是正确有效的。(本文来源于《重庆大学》期刊2006-04-20)
负项目论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近年来,随着计算机技术的发展、数据管理技术的成功应用、企业内部信息化程度的不断提高,各个应用领域的数据库中都积累了海量的数据。利用数据挖掘技术能够从大规模的数据中获取正确的、有趣的、潜在有价值的知识。而关联规则挖掘则是其中一个重要的研究方法,具有重要的理论价值和广泛的应用前景。当前,传统的正关联规则的挖掘受到了相当的关注,对于包含负项目的关联规则却并未给予足够的重视。然而在很多领域中,只挖掘出传统的关联规则往往是不够的,需要对数据项的否定项进行挖掘。因此有必要研究事物负属性之间的关联关系。现有的挖掘含负项目的关联规则算法为数不多,而且多是基于Apriori思想的迭代算法,需要对数据集进行多次扫描,同时生成大量的候选频繁项集。针对这些不足论文提出一种基于频繁模式树的频繁项集挖掘算法。算法借用FP-growth算法中频繁模式树这种压缩存储事务的数据结构,因此具有无需多次扫描数据库,不用生成大量候选项集的优点。除此之外,算法对频繁模式树中每个节点增加一个位串来存储该项目的前缀项目,以避免在模式扩展的时候频繁的遍历子树。实验表明,论文提出的算法比现有的同类挖掘算法具有更好的效率。另外,在含负项目的关联规则挖掘中,由于负项目的引入使得频繁项集的搜索空间变得更加巨大,而同时挖掘出的负关联规则数量也随之增大。但其中很多规则对用户来说是不感兴趣的,而且可能包含一些冗余和错误的规则。因此在传统的“支持度——置信度——兴趣度”评价标准之上,引入了最大支持度的概念,在生成频繁项集阶段就将没有意义的项集排除掉,以使得挖掘结果更有意义。实验结果表明,论文提出的改进算法是正确有效的。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
负项目论文参考文献
[1].张玉芳,王灿,熊忠阳.一种改进的含负项目关联规则挖掘算法[J].计算机工程与应用.2008
[2].王灿.含负项目的关联规则挖掘算法研究[D].重庆大学.2008
[3].张玉芳,彭燕,刘君,陈铭灏.一种含负项目的一般化关联规则挖掘算法[J].计算机工程与设计.2006
[4].彭燕.含负项目的一般化关联规则算法研究[D].重庆大学.2006