导读:本文包含了相联规则论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:规则,数据挖掘,算法,频繁,频度,增量,对比度。
相联规则论文文献综述
赵海,陈燕,张德干,张晓丹[1](2004)在《相联规则的粗熵挖掘方法及其在肇事逃逸侦破中的应用》一文中研究指出针对传统数据挖掘算法在处理包含不确定性因素的多源信息场景中存在的因掺杂额外的人为因素而导致误差的缺陷,提出了一种基于粗糙熵的相联规则的挖掘方法,并给出了该方法的评析途径·将研究的方法应用于公安系统的交通肇事逃逸案的侦破中,从历史数据中挖掘出了相联规则,为公安系统对交通肇事逃逸案的侦破提供了一种高效和实用的手段·应用范例验证了该方法的有效性·(本文来源于《东北大学学报》期刊2004年10期)
臧雪柏,李雄飞,全勃,李军[2](2003)在《挖掘相联规则的并行算法研究》一文中研究指出在研究多段支持度数据挖掘算法的基础上提出并行挖掘相联规则的算法 .给出了在并行条件下以负载平衡为目的的种子项集的划分的贪心算法策略 .基于多段支持度特征 ,为减少各个处理机之间的制约 ,提出按事务长度进行数据集划分的方案 ,并具体实现了多段支持度的并行算法 .实验结果表明该算法具有很高的效率 .特别是在双CPU情况下 ,并行算法的效率接近顺序算法的两倍 .如果把算法修正和推广到群集环境下 ,会更一步增加相联规则的实用性 .(本文来源于《小型微型计算机系统》期刊2003年12期)
李雄飞,苑森淼,王爱军,郇丹丹[3](2002)在《基于项目属性的相联规则提取》一文中研究指出相联规则是数据库知识发现领域的重要方法之一 ,用于发现满足用户指定最小支持度和最小信任度阈值的规则 .其中 ,最小支持度阈值确定了研究数据集的规模 ,最小信任度阈值用来衡量一个规则可靠性 .在通常的支持度 /信任度框架下 ,用户只能给出一对最小支持度和最小信任度阈值 ,因此 ,对于所有数据项均采用统一标准处理 .但是 ,实际数据库中的数据项目具有各自的特点 ,该文旨在根据项目的属性特征 ,通过模糊综合评判 ,决定项目合理的最小支持度阈值 ,进而确定各个项目的支持度区间 ,达到在一次数据挖掘中同时发现频繁规则和稀有规则的目的 .由于基于最小信任度的规则提取具有冗余性 ,文中提出规则前件和后件的重要程度对比的思想 ,借助主观判断去除冗余规则 ,从而挖掘出尽可能接近自然的完全规则 .(本文来源于《计算机学报》期刊2002年12期)
李雄飞,臧雪柏,刘光远,苑森淼[4](2002)在《相联规则增量算法研究》一文中研究指出相联规则模型可以用于在海量数据库中发现有价值的知识 ,各种求解相联规则的算法都需要较大的计算量 .随着时间推移 ,数据库中的数据也随之发生变化 .由于原先发现的规则已经过时 ,需要重新在数据集中挖掘规则 .本文通过向数据库中不追加数据的方法研究孕育在数据库中的相联规则变化情况 .在借鉴 FUP等算法的基础上 ,充分利用前次挖掘中获得的有关信息 ,提出用于再次挖掘的相联规则增量算法 Super FU P.该算法核心思想是更多地注重新增数据集 ,有效利用前次挖掘信息 ,仅仅对整个数据库扫描一次就能达到求解更新相联规则的目的 ,提高了相联规则增量算法的效率 .(本文来源于《小型微型计算机系统》期刊2002年11期)
王曙光,施小英[5](2002)在《一种改进的相联规则提取算法》一文中研究指出相联规则的提取是数据挖掘的一个重要方面。Apriori算法是提取相联规则的经典算法,效率较高。AprioriPro算法是对Apriori算法的改进,它利用大项集生成过程中的中间结果对数据库进行过滤,从而加快候选项集的计数速度,提高了整个算法的效率。该文在AprioriPro算法的基础上,首先对其基本理论进行扩展并加以证明,提出了AprioriPro2算法。该算法相对于AprioriPro算法能更多地去掉数据库中的无效元组,从而进一步提高了算法的效率。(本文来源于《计算机工程与应用》期刊2002年15期)
李雄飞,刘光远,郭励焕,苑森淼,侯天伦[6](2002)在《二次挖掘相联规则算法》一文中研究指出通过研究、分析FUP等算法 ,提出用于二次挖掘相联规则的算法SuperFUP。该算法更多关注的是新增数据 ,只对整个数据库扫描一次就能在变更的数据中发现相联规则 ,从而提高了算法效率。(本文来源于《吉林工业大学学报(工学版)》期刊2002年02期)
张梅峰,张尧,张建伟,张素智[7](2001)在《挖掘有效相联规则的算法探讨》一文中研究指出:Apriori算法是从大型数据库中挖掘相联规则的有效工具 ,但在实用中还存在以下 2个问题 :1 )有可能挖掘出一条支持度和置信度均很高 ,但却是无兴趣的 ,甚至是虚假的相联规则 ;2 )挖掘相联规则算法不能产生带有否定项的规则 .鉴于此 ,对 Apriori算法作了如下改进 :引入兴趣度的第叁个度量值——相关支持度阈值 ,并在原始项集中增加否定项 .改进后的算法较好地解决了上述 2个问题(本文来源于《郑州轻工业学院学报》期刊2001年01期)
俞珏民[8](2000)在《基于项-事务关联数据库的相联规则挖掘算法的研究》一文中研究指出挖掘大型事务数据库中的相联规则是数据挖掘研究的重要问题之一。该问题自1993年被Agrawal等提出以来,一直受到广泛关注与重视。由于相联规则挖掘涉及的事务数据库都非常大,提出有效的挖掘算法成了研究的热点。 传统的相联规则挖掘算法都是直接在事务数据库上进行。尽管业已提出了一些改进I/O性能的方法,但这些方法大多都需要反复扫描事务数据库。这就造成了大量I/O开销,从而影响了相联规则挖掘的效率。 本文提出了一种根本上不同于以往相联规则挖掘算法的新方法。首先,将事务数据库转换成项-事务关联数据库,之后相联规则的挖掘就直接在转换后的项-事务关联数据库上进行。由于项-事务关联数据库以项(集)为索引键,其记录包含涉及该项(集)的事务代码的集合。这样,只需要对频繁(k-1)-项集的事务代码集进行交运算,就可以容易地求得频繁k-项集的支持度。此外,在产生频繁k-项集时,同时产生项-事务关联数据库D_k。D_k中仅包含频繁k-项集及其关联的事务代码集合。当求频繁(k+1)-项集时,只需扫描小得多的D_k。这相当于进行大量剪枝,大大降低了I/O开销。 本文的主要工作如下: 1.给出了将事务数据库转换成项-事务关联数据库的有效算 法。 2.提出了基于项-事务关联数据库的单层相联规则和多层相联 规则挖掘算法。 3.讨论了相联规则的增量式挖掘,并给出相应算法。 4.讨论了当最小支持度改变时,挖掘满足新的兴趣度限制的 相联规则挖掘的有效方法。(本文来源于《郑州大学》期刊2000-05-26)
李雄飞,苑森淼,董立岩[9](2000)在《基于相联规则的数据挖掘理论》一文中研究指出通过对KDD中基于相联规则的经典数据挖掘算法的讨论,提出构造测试平台的思想,旨在借助测试指标进一步指导和规范数据挖掘算法。在采用测试数据方面,阐明基于测试指标的人造数据比模拟现实世界的人造数据更适合于做为测试平台的数据集的思想。指出对Apriori等经典算法的改进途径。由于二次挖掘可以用前次挖掘出的知识作指导,从而提高了数据挖掘效率,因此,二次挖掘算法将成为今后KDD领域中研究的热点。(本文来源于《吉林工业大学自然科学学报》期刊2000年02期)
崔立新,苑森淼,赵春喜[10](2000)在《约束性相联规则发现方法及算法》一文中研究指出文中研究了在大型事务数据库中发现有约束条件的相联规则问题 ,提出了有效实现约束性相联规则发现的两种方法 :过滤数据库算法 Filtering和频繁项集生成算法 Separate.这两种可以同时并用的方法比已有算法运算效率有显着提高 .(本文来源于《计算机学报》期刊2000年02期)
相联规则论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在研究多段支持度数据挖掘算法的基础上提出并行挖掘相联规则的算法 .给出了在并行条件下以负载平衡为目的的种子项集的划分的贪心算法策略 .基于多段支持度特征 ,为减少各个处理机之间的制约 ,提出按事务长度进行数据集划分的方案 ,并具体实现了多段支持度的并行算法 .实验结果表明该算法具有很高的效率 .特别是在双CPU情况下 ,并行算法的效率接近顺序算法的两倍 .如果把算法修正和推广到群集环境下 ,会更一步增加相联规则的实用性 .
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
相联规则论文参考文献
[1].赵海,陈燕,张德干,张晓丹.相联规则的粗熵挖掘方法及其在肇事逃逸侦破中的应用[J].东北大学学报.2004
[2].臧雪柏,李雄飞,全勃,李军.挖掘相联规则的并行算法研究[J].小型微型计算机系统.2003
[3].李雄飞,苑森淼,王爱军,郇丹丹.基于项目属性的相联规则提取[J].计算机学报.2002
[4].李雄飞,臧雪柏,刘光远,苑森淼.相联规则增量算法研究[J].小型微型计算机系统.2002
[5].王曙光,施小英.一种改进的相联规则提取算法[J].计算机工程与应用.2002
[6].李雄飞,刘光远,郭励焕,苑森淼,侯天伦.二次挖掘相联规则算法[J].吉林工业大学学报(工学版).2002
[7].张梅峰,张尧,张建伟,张素智.挖掘有效相联规则的算法探讨[J].郑州轻工业学院学报.2001
[8].俞珏民.基于项-事务关联数据库的相联规则挖掘算法的研究[D].郑州大学.2000
[9].李雄飞,苑森淼,董立岩.基于相联规则的数据挖掘理论[J].吉林工业大学自然科学学报.2000
[10].崔立新,苑森淼,赵春喜.约束性相联规则发现方法及算法[J].计算机学报.2000