导读:本文包含了高效关联规则挖掘算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:规则,数据挖掘,高效,频繁,矩阵,洛夫,米尔。
高效关联规则挖掘算法论文文献综述
潘俊辉,张强,王辉,王浩畅[1](2019)在《一种基于压缩矩阵的高效关联规则挖掘算法》一文中研究指出论文针对改进后的关联规则挖掘算法——基于矩阵的Apriori算法所存在的不足,在此算法的基础上对其进行了进一步的改进,给出了一种基于压缩矩阵的高效关联规则挖掘方法CMEAR算法。该方法通过对矩阵的压缩,改进矩阵的存储方式及对项目集进行排序等多种方式实现关联规则的挖掘。最后通过实验将该方法与传统Apriori算法以及基于矩阵的Apriori算法进行了对比分析,实验结果表明基于压缩矩阵的高效关联规则挖掘方法使算法在时间性能上有很大的提高。(本文来源于《计算机与数字工程》期刊2019年11期)
张健[2](2017)在《关联规则中频繁与高效用项集挖掘算法研究》一文中研究指出关联规则最早是挖掘频繁项集,以支持度为度量,挖掘数据库中频繁出现的项集模式。考虑到数据库中每个项目在事务中可以出现多次,并且不同项目可以有不同的权重,频繁项集被扩展到高效用项集挖掘,高效用项集挖掘能使用用户期望的效用度量方式挖掘出更符合用户需求的结果。本文主要围绕关联规则中的频繁项集挖掘算法与高效用项集挖掘算法的时间效率提升展开,具体内容包括以下2个方面:1)基于事务约简和2-项集支持度矩阵快速剪枝的Apriori改进算法。首先自定义了保存频繁1-项集的数据结构,计算候选项集支持度时,依据这个自定义的数据结构决定扫描的事务,之后引入事务约简优化,进一步对数据库中项目和事务进行约简,提出改进的MR-Apriori算法。随后,定义一种2-项集支持度矩阵,对候选项集进行快速剪枝,提出了改进后的MP-Apriori算法。再次,结合MR-Apriori和MP-Apriori算法改进策略,提出了改进的MRP-Apriori算法。最后,在mushroom和T10I4D100K进行实验,结果表明:改进的MRApriori算法和改进的MP-Apriori算法,运行时间都比原Apriori算法减少,而结合这两种改进策略的MRP-Apriori算法运行时间最短,从而最终验证了叁种算法改进的时间效率。2)基于数组伪投影和事务合并的频繁高效用项集挖掘算法。在分析了单独考虑支持度或效用值的缺陷后,本文提出一种基于数组伪投影数据结构、递归构造前缀项集的投影数据库挖掘频繁高效用项集的算法。算法将支持度和效用值这两种度量手段同时考虑,挖掘数据库中那些出现次数频繁且效用值高的项目集合。为减小算法的搜索空间,提出了局部效用剪枝和子树效用剪枝两种剪枝方案,基于算法模型和上述剪枝方案提出FUIM-P算法。随后,观察到数据库中有许多可以合并的事务,根据FUIM-P算法的特点,将这种合并被扩展到投影数据库,引入了事务(投影事务)合并技术。同时,提出了一种自定义排序规则,以在线性时间内找到满足可以快速合并的条件的事务,提出最终的FUIM-MP算法。最后在mushroom、chess和accident数据集上进行实验,结果表明:FUIM-P算法的运行时间相比对比的FHIMA-ALL算法缩短,而加入了事务(投影事务)合并技术的FUIM-MP算法则较前两者时间效率有非常大的提升;另外,实验中mushroom、chess和accident数据集中大量可合并事务(投影事务)数目也很好地证明了事务(投影事务)合并提高算法运行时间的有效性。(本文来源于《华侨大学》期刊2017-05-13)
徐春,李广原[3](2016)在《一种高效的增量更新约束关联规则挖掘算法的研究》一文中研究指出约束关联规则挖掘是根据用户提出的各种约束条件从交易数据库中挖掘出用户感兴趣的关联规则。该文针对目前提出的诸多约束关联挖掘算法只适应于静态数据库的情况,且挖掘出的约束关联规则存在效率低等缺点,提出一种基于倒排索引树的增量更新约束关联规则挖掘算法UPC-IITree,该算法将树型结构与倒排索引相结合,以实现无需扫描原始数据库和不产生候选项集的情况下,解决原始DB新增数据集时能高效地维护满足用户给定约束条件的关联规则。通过实验与其他相关算法进行对比,实验结果表明,UPC-IITree算法减少了算法的执行时间,节约了内存空间,提高了挖掘效率。(本文来源于《广西师范学院学报(自然科学版)》期刊2016年02期)
赵学健,孙知信,袁源[4](2016)在《基于预判筛选的高效关联规则挖掘算法》一文中研究指出关联规则分析作为数据挖掘的主要手段之一,在发现海量事务数据中隐含的有价值信息方面具有重要的作用。该文针对Apriori算法的固有缺陷,提出了AWP(Apriori With Prejudging)算法。该算法在Apriori算法连接、剪枝的基础上,添加了预判筛选的步骤,使用先验概率对候选频繁k项集集合进行缩减优化,并且引入阻尼因子和补偿因子对预判筛选产生的误差进行修正,简化了挖掘频繁项集的操作过程。实验证明AWP算法能够有效减少扫描数据库的次数,降低算法的运行时间。(本文来源于《电子与信息学报》期刊2016年07期)
刘晓蔚[5](2015)在《基于等价类规则树的高效关联规则挖掘算法》一文中研究指出传统的类关联规则挖掘方法在挖掘完整的规则数据集时往往需要消耗很长的时间。为了解决这个问题,提出一种高效的基于等价类规则树的类关联规则挖掘算法。首先,通过分析等价类规则树挖掘类关联规则算法存在的耗时问题,设计一个树结构存储数据集的频繁项集;接着,基于这棵树推导出一些修正树上节点和减少节点信息计算量的定理;最后,利用这些定理得到一个有效的适用于挖掘类关联规则的算法。实验结果表明,与其他较为先进的基于等价类规则树的关联规则挖掘算法相比,所提算法更加高效。(本文来源于《计算机应用与软件》期刊2015年01期)
陈艺[6](2014)在《基于高效关联规则挖掘算法的智能评卷模型研究》一文中研究指出考试评分标准的公平性和公正性一直深受关注,其能否保证阅卷人员在阅卷过程中所运用的评分标准达到一致性和稳定性,并有效控制阅卷过程中的误差,是一个迫切需要解决的问题.本文根据网上阅卷系统环境,将一种高效的关联规则挖掘算法,即Hopfield神经网络技术运用到该系统中,并采用柯尔莫戈洛夫—斯米尔懦夫检验方法来检验输出结果,从而及时发现并调整阅卷人员的工作和休息状态,提升了阅卷过程的质量和效率,进而保证阅卷过程的公平公正性.(本文来源于《赤峰学院学报(自然科学版)》期刊2014年12期)
冯璐妹,赵建宁[7](2013)在《基于Apriori的高效关联规则挖掘算法在教育考试系统中的应用研究》一文中研究指出从历史考试数据中提出有用的信息具有重要的意义。使用关联规则挖掘是有效的手段之一。然而,传统的Apriori关联规则挖掘算法存在不足之处。为此,本文应用一种改进的、基于Apriori的关联规则挖掘算法,在高考考试数据上进行了尝试,得出了有益的结果。为进一步构建针对教育考试的实际数据挖掘应用系统奠定了基础。(本文来源于《软件》期刊2013年07期)
冯楠,吴翔晖,彭燕,庄丽丽,王荣[8](2012)在《一种高效并行关联规则挖掘算法在专利数据库的应用》一文中研究指出针对Apriori算法在专利数据库挖掘时因数量巨大而存在的低效问题,提出一种利用集群的并行关联规则挖掘算法APPAA(AdvancedPruning Parallel Apriori Algorithm)。通过仿真实验表明,APPAA算法比传统的Apriori算法在时间上缩短了85%左右。同时该方法具有良好的并行性和可扩展性,可以有效地提高专利数据库服务水平。(本文来源于《数字技术与应用》期刊2012年11期)
王娟勤,李书琴[9](2011)在《一种高效关联规则挖掘算法》一文中研究指出为了提高关联规则挖掘算法处理数据库的效率,在研究AprioriTid算法的基础上提出一种高效的关联规则挖掘算法AprioriTidD,在计算数据库中的频繁项集时依靠有效的裁剪减少无效项集的产生,并且可减少产生候选项集,从而有效地提高算法的效率.选取程序模拟超市购物产生的3个试验数据集,应用AprioriTidD算法对该数据集进行了关联规则挖掘,结果表明,运用AprioriTidD算法可以有效缩小Tid表,减少相关的计算量,提高数据挖掘的效率.(本文来源于《湖南科技大学学报(自然科学版)》期刊2011年04期)
朱红萍,巩青歌[10](2011)在《一种关联规则挖掘的高效更新算法》一文中研究指出针对关联规则挖掘中的高效更新问题,对增量和负增量问题进行了讨论,提出当最小支持度发生变化时可归结为数据库发生变化的情形进行讨论。采用十字链表来分别存储原数据库DB和变化数据库db中,各频繁项集及其支持度s1和s2,通过对s1,s2及最小支持度s0的比较分析,判断项集是否为频繁项集,减少了扫描数据库的次数,提高了更新后的挖掘效率。并通过仿真实验,证明了算法的高效性。(本文来源于《电子科技》期刊2011年10期)
高效关联规则挖掘算法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
关联规则最早是挖掘频繁项集,以支持度为度量,挖掘数据库中频繁出现的项集模式。考虑到数据库中每个项目在事务中可以出现多次,并且不同项目可以有不同的权重,频繁项集被扩展到高效用项集挖掘,高效用项集挖掘能使用用户期望的效用度量方式挖掘出更符合用户需求的结果。本文主要围绕关联规则中的频繁项集挖掘算法与高效用项集挖掘算法的时间效率提升展开,具体内容包括以下2个方面:1)基于事务约简和2-项集支持度矩阵快速剪枝的Apriori改进算法。首先自定义了保存频繁1-项集的数据结构,计算候选项集支持度时,依据这个自定义的数据结构决定扫描的事务,之后引入事务约简优化,进一步对数据库中项目和事务进行约简,提出改进的MR-Apriori算法。随后,定义一种2-项集支持度矩阵,对候选项集进行快速剪枝,提出了改进后的MP-Apriori算法。再次,结合MR-Apriori和MP-Apriori算法改进策略,提出了改进的MRP-Apriori算法。最后,在mushroom和T10I4D100K进行实验,结果表明:改进的MRApriori算法和改进的MP-Apriori算法,运行时间都比原Apriori算法减少,而结合这两种改进策略的MRP-Apriori算法运行时间最短,从而最终验证了叁种算法改进的时间效率。2)基于数组伪投影和事务合并的频繁高效用项集挖掘算法。在分析了单独考虑支持度或效用值的缺陷后,本文提出一种基于数组伪投影数据结构、递归构造前缀项集的投影数据库挖掘频繁高效用项集的算法。算法将支持度和效用值这两种度量手段同时考虑,挖掘数据库中那些出现次数频繁且效用值高的项目集合。为减小算法的搜索空间,提出了局部效用剪枝和子树效用剪枝两种剪枝方案,基于算法模型和上述剪枝方案提出FUIM-P算法。随后,观察到数据库中有许多可以合并的事务,根据FUIM-P算法的特点,将这种合并被扩展到投影数据库,引入了事务(投影事务)合并技术。同时,提出了一种自定义排序规则,以在线性时间内找到满足可以快速合并的条件的事务,提出最终的FUIM-MP算法。最后在mushroom、chess和accident数据集上进行实验,结果表明:FUIM-P算法的运行时间相比对比的FHIMA-ALL算法缩短,而加入了事务(投影事务)合并技术的FUIM-MP算法则较前两者时间效率有非常大的提升;另外,实验中mushroom、chess和accident数据集中大量可合并事务(投影事务)数目也很好地证明了事务(投影事务)合并提高算法运行时间的有效性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
高效关联规则挖掘算法论文参考文献
[1].潘俊辉,张强,王辉,王浩畅.一种基于压缩矩阵的高效关联规则挖掘算法[J].计算机与数字工程.2019
[2].张健.关联规则中频繁与高效用项集挖掘算法研究[D].华侨大学.2017
[3].徐春,李广原.一种高效的增量更新约束关联规则挖掘算法的研究[J].广西师范学院学报(自然科学版).2016
[4].赵学健,孙知信,袁源.基于预判筛选的高效关联规则挖掘算法[J].电子与信息学报.2016
[5].刘晓蔚.基于等价类规则树的高效关联规则挖掘算法[J].计算机应用与软件.2015
[6].陈艺.基于高效关联规则挖掘算法的智能评卷模型研究[J].赤峰学院学报(自然科学版).2014
[7].冯璐妹,赵建宁.基于Apriori的高效关联规则挖掘算法在教育考试系统中的应用研究[J].软件.2013
[8].冯楠,吴翔晖,彭燕,庄丽丽,王荣.一种高效并行关联规则挖掘算法在专利数据库的应用[J].数字技术与应用.2012
[9].王娟勤,李书琴.一种高效关联规则挖掘算法[J].湖南科技大学学报(自然科学版).2011
[10].朱红萍,巩青歌.一种关联规则挖掘的高效更新算法[J].电子科技.2011