增量更新挖掘论文-徐春,李广原

增量更新挖掘论文-徐春,李广原

导读:本文包含了增量更新挖掘论文开题报告文献综述及选题提纲参考文献,主要关键词:增量更新挖掘,倒排索引,约束频繁项集,关联规则

增量更新挖掘论文文献综述

徐春,李广原[1](2016)在《一种高效的增量更新约束关联规则挖掘算法的研究》一文中研究指出约束关联规则挖掘是根据用户提出的各种约束条件从交易数据库中挖掘出用户感兴趣的关联规则。该文针对目前提出的诸多约束关联挖掘算法只适应于静态数据库的情况,且挖掘出的约束关联规则存在效率低等缺点,提出一种基于倒排索引树的增量更新约束关联规则挖掘算法UPC-IITree,该算法将树型结构与倒排索引相结合,以实现无需扫描原始数据库和不产生候选项集的情况下,解决原始DB新增数据集时能高效地维护满足用户给定约束条件的关联规则。通过实验与其他相关算法进行对比,实验结果表明,UPC-IITree算法减少了算法的执行时间,节约了内存空间,提高了挖掘效率。(本文来源于《广西师范学院学报(自然科学版)》期刊2016年02期)

徐春[2](2016)在《基于倒排索引的增量更新关联挖掘算法的研究》一文中研究指出关联挖掘是用来发现海量数据集中数据项之间存在潜在的、有价值的关联关系,以便于商业决策提高企业利润。随着移动互联网、人工智能、信息处理、机器学习、物联网等各种计算机科学技术的急速发展和普遍应用,各种海量信息数据呈指数迅速增长,人们为了能够从海量数据集中提取有价值的信息,提出了各种数据挖掘技术。增量更新关联挖掘是一种动态的关联挖掘方法,它主要用来解决动态事务数据库中事务记录随时间的推移而不断地更新,以及根据用户需求的不同,最小支持度阈值、最小置信度阈值发生改变时,发现数据项之间存在潜在、有价值的关联关系问题。针对现有的改进增量更新关联规则挖掘算法存在以下缺陷:(1)多次频繁地扫描原始事务数据库、产生大量无用的候选项集以及使用集合连接操作来计算频繁项集;(2)新产生的关联规则不能满足用户的不同需求;(3)当原始事务数据库新增事务记录的同时,改变最小支持度阈值和最小置信度阈值的情况下,实现增量更新关联挖掘维护问题的研究很少。为解决此类问题,本文采用倒排索引技术与树型结构相结合的方式,提出一种高效的增量更新关联挖掘算法UP-IITree。该算法有效的实现了无需扫描原始事务数据库DB,不产生候选项集且使用集合与操作,能够高效地计算出增量更新后的所有频繁项集。实验结果表明,该算法占用内存空间少、检索频繁项集效率高,且能更好地解决了增量更新关联挖掘算法存在上述难题。在大数据环境下,原始事务数据库中新增的事务数据集都是大批量的,且根据用户的需求不同,所指定的最小支持度阈值和最小置信度阈值也会有所改变,为了能够实现更新后的关联规则得到及时的维护一直是人们追求的目标。本文将UP-IITree算法实行进一步创新,将倒排索引技术与MapReduce并行编程模型相结合提出一种并行增量更新关联挖掘算法UP-IIMR。该算法是利用hadoop平台中MapReduce并行编程模型,使得能够以并行的方式应用倒排索引技术,以便于在新增大批量数据集的同时,改变最小支持度阈值和最小置信度阈值的情况下,高效、及时地解决了关联规则难以维护的问题。通过使用真实数据进行实验,结果表明UP-IIMR算法极大程度上提高了关联规则的挖掘效率和减少了所需的内存空间,有效地解决了大数据环境下增量更新关联规则难以维护的问题。(本文来源于《广西师范学院》期刊2016-06-01)

徐春,李广原,王玄,田换[3](2016)在《一种基于倒排索引树的增量更新关联挖掘算法》一文中研究指出增量更新关联规则挖掘主要解决事务数据库中交易记录不断更新和最小支持度发生变化时关联规则的维护问题。针对目前诸多增量更新关联规则挖掘算法存在效率低、计算成本高、规则难以维护等问题,提出一种基于倒排索引树的增量更新关联挖掘算法。该算法有效地将倒排索引技术与树型结构相结合,使得交易数据库中的数据不断更新和最小支持度随应用环境不同而不断改变时,以实现无需扫描原始交易数据库和不产生候选项集的情况下生成频繁项集。实验结果表明,该算法只需占用较小的存储空间、且检索项集的效率较高,能高效地解决增量更新关联规则难以维护的问题。(本文来源于《计算机工程与科学》期刊2016年05期)

王春华[4](2011)在《增量更新关联规则挖掘方法的研究》一文中研究指出当今社会是一个信息社会,信息瞬息万变。大量信息在给人们带来方便的同时也带来了一大堆问题:第一是信息过量,难以消化;第二是信息真假难以辨认;第叁是信息安全难以保证;第四是信息形式不一致,难以统一处理。如何才能不被信息淹没,而是从中发现有用的知识,提高信息利用率?面对这一挑战,数据挖掘技术应运而生。关联规则是数据挖掘中一个很重要的分支,它能发现事物之间的关系,从而得到数据内部潜在有价值的信息。随着时间的推移,数据库总是在不断的变化,于是如何高效地从更新后的数据库中对已经推导出的关联规则进行更新成为人们探究的热点。已有的成熟的增量更新关联规则挖掘方法大致可以分为两类:一类是基于Apriori算法,如FUP1、FUP2算法等,另一类是基于FP树算法,如FIUA2算法等。这两类算法都有自身的缺点,前者的缺点是需要多次扫描数据库,很耗时间,后者的缺点是需要多次生成条件FP树,很耗空间。本文在总结前人算法的优缺点的基础上,给出了基于图的关联规则增量更新挖掘算法,算法充分考虑了挖掘需要,只需要扫描一次数据库,并且减少了冗余候选集的生成,在提高空间使用率的同时又提高了挖掘效率。本文所作的工作有:首先,对已有的经典算法及其改进算法进行了深入的研究,包括Apriori算法、FP树算法、FUP算法、DLG算法等,分析了这些算法的优缺点。对一些新颖的算法技术进行了探讨和学习,如数值型数据集的处理问题、模糊约束概念等。其次,给出了图的四叉链表存储结构,分析了该结构引入的优点,并且基于该结构给出了完全频繁项集挖掘算法GIU1和最大频繁项集挖掘算法GIU2,给出了算法描述和实例演示。再次,鉴于图的优点,将图的结构拓展到模糊时态的数据集增量更新挖掘应用中,给出了模糊时态增量更新完全频繁项集的挖掘算法FuzzyGIU,分析了图在模糊时态环境下使用的合理性和有效性,并对算法进行了描述和实例演示。最后,对这些算法进行了仿真实验,并与相关的已有算法进行了性能对比。结果表明了本文给出的基于图存储结构的几个算法在数据集规模和最小支持度各自变化时的挖掘效率表现都比已有算法好,从而验证了这些算法的有效性。(本文来源于《哈尔滨工程大学》期刊2011-12-01)

王宇杰,乔聪[5](2010)在《数据挖掘中基于负边界思想的关联规则增量式更新算法》一文中研究指出关联规则的挖掘是数据挖掘领域中的一个重要领域,而如何高效地从更新后的数据库中对已经推导出的关联规则进行更新是具有非常重要的价值的。文章首先分析了现有增量式更新算法的优缺点,然后明确定义了负边界的概念,接着提出了一种基于负边界思想的关联规则增量式更新算法,并详细描述了这一算法的实现原理和实现过程,然后给出程序伪代码,最后通过实验验证了算法的有效性。(本文来源于《计算机与数字工程》期刊2010年06期)

马慧,汤庸,吴凌坤[6](2009)在《流程增量挖掘中的模型更新方法》一文中研究指出正确发现流程实际运作情况对工作流管理有着重要的意义。流程挖掘抽取系统日志信息,挖掘流程的真实运作模型。目前很多该方面的研究,着重于从一份日志中挖掘出工作流模型。然而,这些挖掘方法只关注日志信息,忽略了流程设计者的先验知识。而且,日志所包含信息量较大,进行一次挖掘耗费较大。因此,希望能结合已有工作流模型及新增日志信息,更新工作流模型。已有研究给出对模型及日志的增量挖掘算法。但是,业务流程会随着时间推移变更,可能已有的任务被取消了,因此在新增的一段日志中该任务没被记录。但由于该任务曾经在已有日志中记录下来,故应用已有挖掘算法或增量挖掘算法,在更新模型中,该任务也会被挖掘出来。提出了一种增量挖掘模型更新的改进算法。通过流程设计者的先验知识及统计任务出现的频率,判断该任务是否被取消。最后给出一个实验,验证算法的可行性。(本文来源于《计算机科学》期刊2009年05期)

郑文争[7](2009)在《增量更新关联规则挖掘算法研究》一文中研究指出随着大型数据库系统在各行业普及,数据库中存储的数据量急剧增大,数据挖掘是从海量数据中挖掘有效或重要信息的过程。关联规则挖掘作为数据挖掘的重要研究课题,被广泛地应用。伴随挖掘数据库的规模不断发生变化,对数据的需求也会有所不同,如何从扩展数据库中高效地对已经推导出的关联规则进行更新具有非常重要的应用价值,这就是所谓的增量式挖掘关联规则的问题。(本文来源于《计算机与现代化》期刊2009年02期)

侯兵,程伟丽,李霞[8](2008)在《关联规则挖掘中改进的增量式更新算法》一文中研究指出增量式更新算法能充分利用已挖掘出的知识来提高挖掘效率,是数据挖掘高效算法中的一个主要方向.分析了典型的关联规则增量式更新算法波折法FUP算法的不足,提出了一种改进的关联规则增量式更新算法,新算法极大地降低了存储空间和挖掘时间需求,从而提高了整个关联规则挖掘的效率.(本文来源于《华北水利水电学院学报》期刊2008年05期)

冯嵩[9](2008)在《增量更新关联规则数据库挖掘算法研究》一文中研究指出随着数据库技术的不断发展及数据库管理系统的广泛应用,大型数据库系统己经在各行各业普及,数据库中存储的数据量急剧增大,数据挖掘便是从海量数据库中挖掘有效或重要信息的过程。关联规则挖掘是数据挖掘领域一个非常重要的研究课题,被广泛地应用于商业界、医疗保险、金融业、电信部门等。随着时间的推移,挖掘数据库的规模会发生不断变化,人们对数据的需求也会有所不同,因此如何从扩展数据库中高效地对已经推导出的关联规则进行更新具有非常重要的应用价值,这就是所谓的增量式挖掘关联规则的问题。(本文来源于《电脑知识与技术》期刊2008年S1期)

铁治欣,俞瑞钊[10](2008)在《一种挖掘关联规则的高效增量式更新算法》一文中研究指出对事务数据库增加记录时的关联规则维护问题进行了研究,在分析现有算法的基础上,提出了一个高效的增量式更新算法EUAR。与同类算法相比,算法EUAR通过减少对已有数据库的扫描次数和采用有效的侯选集剪枝算法,提高其执行效率。测试结果表明,算法EUAR是可行且有效的。(本文来源于《浙江理工大学学报》期刊2008年02期)

增量更新挖掘论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

关联挖掘是用来发现海量数据集中数据项之间存在潜在的、有价值的关联关系,以便于商业决策提高企业利润。随着移动互联网、人工智能、信息处理、机器学习、物联网等各种计算机科学技术的急速发展和普遍应用,各种海量信息数据呈指数迅速增长,人们为了能够从海量数据集中提取有价值的信息,提出了各种数据挖掘技术。增量更新关联挖掘是一种动态的关联挖掘方法,它主要用来解决动态事务数据库中事务记录随时间的推移而不断地更新,以及根据用户需求的不同,最小支持度阈值、最小置信度阈值发生改变时,发现数据项之间存在潜在、有价值的关联关系问题。针对现有的改进增量更新关联规则挖掘算法存在以下缺陷:(1)多次频繁地扫描原始事务数据库、产生大量无用的候选项集以及使用集合连接操作来计算频繁项集;(2)新产生的关联规则不能满足用户的不同需求;(3)当原始事务数据库新增事务记录的同时,改变最小支持度阈值和最小置信度阈值的情况下,实现增量更新关联挖掘维护问题的研究很少。为解决此类问题,本文采用倒排索引技术与树型结构相结合的方式,提出一种高效的增量更新关联挖掘算法UP-IITree。该算法有效的实现了无需扫描原始事务数据库DB,不产生候选项集且使用集合与操作,能够高效地计算出增量更新后的所有频繁项集。实验结果表明,该算法占用内存空间少、检索频繁项集效率高,且能更好地解决了增量更新关联挖掘算法存在上述难题。在大数据环境下,原始事务数据库中新增的事务数据集都是大批量的,且根据用户的需求不同,所指定的最小支持度阈值和最小置信度阈值也会有所改变,为了能够实现更新后的关联规则得到及时的维护一直是人们追求的目标。本文将UP-IITree算法实行进一步创新,将倒排索引技术与MapReduce并行编程模型相结合提出一种并行增量更新关联挖掘算法UP-IIMR。该算法是利用hadoop平台中MapReduce并行编程模型,使得能够以并行的方式应用倒排索引技术,以便于在新增大批量数据集的同时,改变最小支持度阈值和最小置信度阈值的情况下,高效、及时地解决了关联规则难以维护的问题。通过使用真实数据进行实验,结果表明UP-IIMR算法极大程度上提高了关联规则的挖掘效率和减少了所需的内存空间,有效地解决了大数据环境下增量更新关联规则难以维护的问题。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

增量更新挖掘论文参考文献

[1].徐春,李广原.一种高效的增量更新约束关联规则挖掘算法的研究[J].广西师范学院学报(自然科学版).2016

[2].徐春.基于倒排索引的增量更新关联挖掘算法的研究[D].广西师范学院.2016

[3].徐春,李广原,王玄,田换.一种基于倒排索引树的增量更新关联挖掘算法[J].计算机工程与科学.2016

[4].王春华.增量更新关联规则挖掘方法的研究[D].哈尔滨工程大学.2011

[5].王宇杰,乔聪.数据挖掘中基于负边界思想的关联规则增量式更新算法[J].计算机与数字工程.2010

[6].马慧,汤庸,吴凌坤.流程增量挖掘中的模型更新方法[J].计算机科学.2009

[7].郑文争.增量更新关联规则挖掘算法研究[J].计算机与现代化.2009

[8].侯兵,程伟丽,李霞.关联规则挖掘中改进的增量式更新算法[J].华北水利水电学院学报.2008

[9].冯嵩.增量更新关联规则数据库挖掘算法研究[J].电脑知识与技术.2008

[10].铁治欣,俞瑞钊.一种挖掘关联规则的高效增量式更新算法[J].浙江理工大学学报.2008

标签:;  ;  ;  ;  

增量更新挖掘论文-徐春,李广原
下载Doc文档

猜你喜欢