频繁项目集论文开题报告文献综述

频繁项目集论文开题报告文献综述

导读:本文包含了频繁项目集论文开题报告文献综述、选题提纲参考文献,主要关键词:频繁,项目,规则,模式,数据挖掘,阈值,集数。

频繁项目集论文文献综述写法

曾俊义[1](2019)在《二分搜索算法在全局频繁项目集求解中的应用》一文中研究指出为了解决常规算法在全局频繁项目求解中,存在求解准确率与求解速率较低的不足,提出二分搜索算法在全局频繁项目集求解中的应用。依托全局频繁项目集的确定,利用频繁项目k和全局隶属度函数x的计算,实现候选项目集的生成,优化全局频繁项目集求解体系;根据数据的动态求解,实现全局频繁项目集的更新计算,完成二分搜索算法在全局频繁项目集求解中的应用,实验数据表明,提出的全局频繁项目集求解方法,较传统求解方法具有较高的求解准确率和求解速率,适合于全局频繁项目集的求解。(本文来源于《现代计算机》期刊2019年19期)

赵群礼,郭玉堂,史君华[2](2018)在《基于改进频繁模式树的最大频繁项目集更新挖掘算法》一文中研究指出在挖掘最大频繁项目集的过程中,通过改变最小支持度阈值可以挖掘更有用的最大频繁项目集,为此提出了一种最大频繁项目集更新挖掘算法UAMMFI(Updating Algorithm for Mining Maximal Frequent Itemsets)。算法基于改进后的频繁模式树结构,在更新挖掘过程中,不需产生候选项目集和条件模式树,并且充分利用先前已挖掘的最大频繁项目集中包含的信息,快速更新挖掘出最小支持度阈值变化后的最大频繁项目集。实验结果表明,算法能够高效更新挖掘最大频繁项目集。(本文来源于《井冈山大学学报(自然科学版)》期刊2018年04期)

黄黎明[3](2018)在《基于Apriori和FP-TREE的频繁项目集挖掘算法》一文中研究指出随着信息技术的日益进步,积累的数据量也在飞速增加。这导致了海量的数据存储在数据库,数据仓库和其他存储库中。因此,数据挖掘开始越来越引起人们的重视,而分析数据库以提取有用或以前未知的模式和规则,称之为关联规则挖掘。在数据挖掘中,关联规则挖掘成为描述性技术的重要任务之一,可以将其定义为从大量数据集中发现有意义的模式。而挖掘频繁项目集是关联规则挖掘的基础。因此,本文研究问题就是研究如何快速挖掘频繁项目集。本文首先介绍了过去几十年来已提出的许多经典频繁项目集挖掘算法,包括基于水平布局的技术,基于垂直布局的技术和基于矩阵布局的技术,为提出性能和功能更优的频繁项目集挖掘算法作好理论准备。但是为了挖掘频繁模式,目前大多数技术都需要遭受多次重复数据库扫描,候选集生成(Apriori算法),内存消耗问题(FP-tree算法)以及更多问题的困扰。正如在零售行业中,许多事务数据库包含多次相同的事务集合,为了应用这个想法,针对Apriori算法和FP-tree算法的缺陷,本文中我们提出了一种新技术,它结合了当前的Apriori(改进的Apriori)和FP-tree技术以保证比经典的apriori算法更好的性能,新方法首先利用改进的Apriori算法寻找最大频繁项目集,然后仅考虑数据库中的包含1项集但不包括在最大频繁项目集中的频繁元素的那些事务来修剪数据库,并基于修剪的数据库构造FP-tree,并通过实践证明,在购物篮数据集中新方法无论是在时间和内存消耗方面都要优于Apriori算法和FP-tree算法。(本文来源于《南华大学》期刊2018-05-01)

尹治华,张大鹏,谭明,王新生[4](2017)在《一种改进的基于FP-Tree的高效挖掘最大频繁项目集算法》一文中研究指出为了解决最大频繁项目集算法DMFIA(discover maximum frequent itemsets algorithm)在挖掘候选项目集维数较大而最大频繁项目集维数较小的情况下产生大量候选项目集的问题,提出一种改进的基于FP-Tree(frequent pattern tree)的最大频繁项目集挖掘的FP-EMFIA算法;该算法在挖掘过程中根据项目头表,采用自上而下和自下而上的双向搜索策略,并通过条件模式基中的频繁项目和较小维数的非频繁项目集对候选项目集进行降维和剪枝,以减少候选项目集的数量,加速对候选集计数的操作。在经典数据集mushroom、chess和connect上的实验结果表明,FP-EMFIA算法在支持度较小时的时间效率优于DMFIA、IDMFIA(improved algorithm of DMFIA)和BDRFI(algorithm for mining frequent itemsets based on decreasing dimensionality reduction of frequent itemsets)算法的,说明FP-EMFIA算法在候选项目集维数较大时有相对优势。(本文来源于《济南大学学报(自然科学版)》期刊2017年02期)

孙鸿艳,吉根林[5](2016)在《一种新的基于FP_Growth的频繁项目集并行挖掘算法》一文中研究指出频繁项目集挖掘用于发现项目之间的关联规则.为了高效求解面向大数据的频繁项目集,本文提出一种新的基于FP_Growth的频繁项目集并行挖掘算法NPFP_Growth(New Parallel algorithm based on FP_Growth),该算法对频繁模式树的存储结构进行改进,基于Map/Reduce并行计算模型,利用HDFS实现数据存储,在各自计算节点上构造局部频繁模式树,求解该局部频繁模式树中每个分支的最长全局频繁项目集;对于全局非频繁项目集,计算其支持数,发送至相应计算节点进行支持度统计,从而以较为简单的算法实现频繁项目集并行挖掘.实验表明,NPFP_Growth算法具有较高的计算效率和良好的可伸缩性.(本文来源于《南京师大学报(自然科学版)》期刊2016年04期)

李文,徐慧[6](2016)在《基于频繁项目集的震前遥感异常信息挖掘》一文中研究指出已有研究表明地震活动区域红外遥感数据存在异常。本文针对遥感数据提出一种数据挖掘方法,运用频繁项集挖掘地震区域数据的异常特征,然后进行地震预测,同时选取非震数据进行反向验证。使用大气红外探测器(AIRS)2006~2013年的数据进行分析,根据大量实验,初步得出大气红外探测器数据可用于地震预测,地震预测最佳前兆时间为30天,前兆区域为边长2°正方形,预测的准确率最高可达81.8%,误报率为5.6%。(本文来源于《计算机与现代化》期刊2016年08期)

尹治华[7](2016)在《基于频繁模式树的最大频繁项目集挖掘算法研究》一文中研究指出随着互联网技术的快速发展,数据挖掘领域受到了越来越多的关注。关联规则一直是该领域的研究热点,主要是为了发现数据之间的关联以及有趣的模式。挖掘最大频繁项目集作为关联规则的一个重要的研究内容,它不仅已经涵盖了所有的频繁项目集,而且某些数据挖掘应用仅需挖掘最大频繁项目集,因此挖掘最大频繁项目集意义重大。本文从叁方面对最大频繁项目集挖掘算法进行研究,分别是对候选项目集降维的研究,超集检测方法的研究以及增量式更新算法的研究。首先,为了解决算法DMFIA(Discover Maximum Frequent Itemsets Algorithm)中初始候选项目集维数较高且挖掘较短最大频繁项目集效率低下的问题,提出了一种改进的基于频繁模式树FP-Tree(Frequent Pattern Tree)的最大频繁项目集挖掘算法FP-EMFIA(Algorithm for Efficiently Mining Maximum Frequent Itemsets Based on FP-Tree)。该算法采用自上而下和自下而上的双向搜索策略,并对条件模式基中项目的计数特点进行了分析,将一定包含或一定不包含在最大频繁项目集中的项目进行过滤,从而降低候选项目集的初始值维数。并利用挖掘出的较短的非频繁项目集对候选项目集进行剪枝,从而提高算法的效率。其次,为了解决最大频繁项目集挖掘算法中超集检测次数过多的问题,提出了一种基于索引链表的超集检测算法IL-SC(Superset Checking Algorithm Based on Index List)。该算法采用索引链表的存储结构,使得最大频繁项目集的存储变得有序化,减少不必要的超集检测操作,从而提高超集检测的效率。最后,在FP-EMFIA的基础上,提出了一种增量式更新算法FP-EUMFIA(Update Maximum Frequent Itemsets Algorithm Based on FP-EMFIA),以便高效利用之前挖掘出的结果。这样,能够大幅度降低初始候选项目集的维数,整体上提高算法的执行效率。(本文来源于《燕山大学》期刊2016-05-01)

陈向华,刘可昂[8](2015)在《基于FP-Tree的最大频繁项目集挖掘算法》一文中研究指出挖掘最大频繁项目集是关联规则挖掘中的关键问题,基于Apriori产生候选项目集需要付出很高的代价,尤其是在存在大量强模式或长模式的时候.提出一种基于频繁模式树(FP-Tree)的最大频繁项目集挖掘算MFIP-Miner(maximum frequent itemsets pattern miner),其挖掘过程无需产生候选项集,从而提高挖掘效率。(本文来源于《软件》期刊2015年12期)

张志宏,兰静[9](2015)在《海量加密军用数据下的频繁项目集挖掘仿真》一文中研究指出军用加密数据为了达到保密的目的,人为设定了较多的加密规则,打破了数据之间常规的关联性。在进行军用数据挖掘建立关联规则时,由于数据关联规则被人为隐藏,递归生成关联条件模式树的过程中,传统的FP-tree算法挖掘算法,由于加密数据的关联复杂性,会递归生成大量条件模式树,导致后期挖掘过程占用了大量的挖掘算法资源,挖掘效率较低。提出基于改进FP-tree的海量加密军用数据下频繁项目集挖掘算法,依据海量加密军用数据下频繁项目集挖掘原理,在FP-tree算法的基础上,依据预剪枝策略减少挖掘节点,通过单向有序FP-tree防止每次存储当前挖掘出的频繁项目集之前都需要超集检验,建立项目表格,避免递归生成条件模式树浪费资源。将提出的改进FP-tree算法应用到海量加密军用数据下频繁项目集的挖掘中,获取的实验结果说明,改进FP-tree算法在提高加密军用数据频繁项目集挖掘速度及准确率方面具有较高的优越性。(本文来源于《计算机仿真》期刊2015年05期)

方刚,王佳乐,应宏,汤小斌[10](2014)在《基于粒度计算的频繁闭项目集挖掘》一文中研究指出针对现有频繁闭项目集挖掘算法存在的不足,提出了一种基于粒度计算的频繁闭项目集挖掘算法。通过混合进制数的变化来生成候选项目集,避免使用了复杂的数据结构,减少了内存和CPU的开销;利用粒度计算的分而治之思想来计算频繁闭项目集的支持度,避免了多次重复扫描数据库,减少了计算复杂度和I/O开销。实验结果表明该算法比经典的频繁闭项目集挖掘算法快速而有效。(本文来源于《计算机工程与应用》期刊2014年20期)

频繁项目集论文开题报告范文

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在挖掘最大频繁项目集的过程中,通过改变最小支持度阈值可以挖掘更有用的最大频繁项目集,为此提出了一种最大频繁项目集更新挖掘算法UAMMFI(Updating Algorithm for Mining Maximal Frequent Itemsets)。算法基于改进后的频繁模式树结构,在更新挖掘过程中,不需产生候选项目集和条件模式树,并且充分利用先前已挖掘的最大频繁项目集中包含的信息,快速更新挖掘出最小支持度阈值变化后的最大频繁项目集。实验结果表明,算法能够高效更新挖掘最大频繁项目集。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

频繁项目集论文参考文献

[1].曾俊义.二分搜索算法在全局频繁项目集求解中的应用[J].现代计算机.2019

[2].赵群礼,郭玉堂,史君华.基于改进频繁模式树的最大频繁项目集更新挖掘算法[J].井冈山大学学报(自然科学版).2018

[3].黄黎明.基于Apriori和FP-TREE的频繁项目集挖掘算法[D].南华大学.2018

[4].尹治华,张大鹏,谭明,王新生.一种改进的基于FP-Tree的高效挖掘最大频繁项目集算法[J].济南大学学报(自然科学版).2017

[5].孙鸿艳,吉根林.一种新的基于FP_Growth的频繁项目集并行挖掘算法[J].南京师大学报(自然科学版).2016

[6].李文,徐慧.基于频繁项目集的震前遥感异常信息挖掘[J].计算机与现代化.2016

[7].尹治华.基于频繁模式树的最大频繁项目集挖掘算法研究[D].燕山大学.2016

[8].陈向华,刘可昂.基于FP-Tree的最大频繁项目集挖掘算法[J].软件.2015

[9].张志宏,兰静.海量加密军用数据下的频繁项目集挖掘仿真[J].计算机仿真.2015

[10].方刚,王佳乐,应宏,汤小斌.基于粒度计算的频繁闭项目集挖掘[J].计算机工程与应用.2014

标签:;  ;  ;  ;  ;  ;  ;  

频繁项目集论文开题报告文献综述
下载Doc文档

猜你喜欢