导读:本文包含了增量关联规则论文开题报告文献综述、选题提纲参考文献,主要关键词:增量,规则,算法,数据挖掘,数据,景点,分布式。
增量关联规则论文文献综述写法
亓文娟[1](2019)在《增量式关联规则挖掘算法在大学生心理危机预防中的应用研究》一文中研究指出关联规则挖掘是数据挖掘中的重要研究内容.分析了关联规则增量式更新算法FUP算法的思想,指出算法的优缺点及改进算法,为增量式关联规则挖掘奠定理论基础.最后将该算法应用于大学生心理健康测评数据,从而使相关职能部门有效地制定大学生心理危机干预计划、减少或消除危机.(本文来源于《赤峰学院学报(自然科学版)》期刊2019年01期)
亓文娟[2](2018)在《增量式关联规则挖掘算法的研究》一文中研究指出关联规则挖掘是数据挖掘中的重要研究内容,在实际应用中,数据库的更新必然引起关联规则的变化,如何高效地获取更新后数据库的关联规则成为研究的热点。本文重点对增量式关联规则FUP算法的基本思想进行了探讨,指出了该算法的优缺点并通过具体实例说明发现频繁项集的方法,最后针对该算法会产生大量候选项集和多次扫描数据库的问题,指出了改进算法,为增量式关联规则挖掘奠定理论基础。(本文来源于《安阳工学院学报》期刊2018年06期)
赵申屹[3](2018)在《基于增量关联规则算法的短期电力负荷预测方法研究》一文中研究指出近年来,随着我国电力行业的快速发展,作为电力系统规划的重要指标之一,用户与企业对电力负荷预测技术的研究越来越重视。根据预测目标的异同,可将电力负荷预测大致分为短、中、长期叁类。其中,短期负荷预测以日负荷预测为主,它的负荷值主要受到天气、时间等多项外界因素的影响。提高电力负荷预测精确程度的关键点在于如何选取影响负荷变化因素和建立合适的负荷预测模型。精确、及时的负荷预测,让预测员及时掌握负荷量变化的规律,能够为企业决策提供可靠的支持。本文结合关联规则挖掘技术,对负荷预测进行了深入研究。本文的课题研究主要围绕以下几个方面:(1)以PFP-tree算法为基础,结合Spark编程框架,提出一种改进的并行关联规则增量更新算法。算法优化了频繁模式树结构和并行计算分组策略,减小了时间和空间复杂度。实验证明,算法具备了较高的挖掘效率和可扩展性,适用于动态增长的大数据环境;(2)基于改进的并行关联规则算法,设计一种短期电力负荷预测方法。方法能够从海量负荷数据中快速、准确地提取影响负荷变化的因素并输出预测值。实验结果表明,通过该方法产生的负荷预测数据具有较高的准确性和可靠性;(3)搭建一个城市短期电力负荷预测系统,系统主要包括数据处理、关联挖掘和预测叁个核心模块。关联挖掘模块对预处理后的数据进行关联规则挖掘,筛选出与负荷变化具有密切联系的属性因素,输出到预测模块;预测模块采用多元回归模型,计算出未来时刻的负荷预测值。(本文来源于《南京邮电大学》期刊2018-11-14)
胡军,潘皓安[4](2018)在《基于Can树的关联规则增量更新算法改进》一文中研究指出如何从动态数据中挖掘关联规则是目前知识发现中的一个研究热点。Can树是基于CATS树改进后提出的解决关联规则增量挖掘的一种有效算法,它要求事务中的每个项按照某种特定顺序进行排序后再构建Can树,其顺序一般采用字典序、字母序等。然而,Can树所使用的排序方法有可能使得Can树的规模过大,从而使得算法效率较低。针对该问题,在现有Can树挖掘算法的基础上,使用数据量排序替代现有排序方法,提出了一种基于数据量排序的Can树,并基于新的Can树对原有Can树的建树和挖掘方法进行优化。该方法可以有效减小Can树的规模,实现频繁项集挖掘在空间效率和时间效率上的优化。实验结果表明,该方法在空间效率和时间效率上好于现有的Can树算法,同时具有较好的稳定性。(本文来源于《重庆邮电大学学报(自然科学版)》期刊2018年04期)
王帅,杨秋辉,曾嘉彦,万莹,樊哲宁[5](2018)在《加权增量关联规则挖掘在通信告警预测中的应用》一文中研究指出针对通信网络告警预测中预测精度不高、模型训练效率较低等缺陷,提出告警权值确定方法和基于自然序树(Can-tree)的加权增量关联规则挖掘的通信网络告警预测方案。首先,对告警数据进行预处理,确定告警数据权值并压缩到Can-tree结构中;其次,应用增量关联规则挖掘算法对Can-tree进行挖掘,生成告警关联规则;最后,使用模式匹配的方法对实时告警信息进行预测,并对结果进行优化整理。实验结果表明,基于Can-tree的加权增量关联规则挖掘算法是高效的,利用前次挖掘的结果和信息提高了挖掘的效率,网络告警数据的权值分配方案能够合理地区分告警数据的重要程度,有助于将重要程度高的告警关联规则挖掘出来,并加快过时告警关联规则的淘汰,提高预测的准确度和精度。(本文来源于《计算机应用》期刊2018年10期)
潘皓安[6](2018)在《多源数据关联规则增量挖掘研究》一文中研究指出在当今这个大数据时代,数据往往存储在网络中的多个数据源中,按照传统的数据挖掘方法,需要将数据集中或融合后才能进行有效处理,但在实际应用中存在着各种问题:数据规模庞大、数据结构多样化、隐私保护等。因此,如何在不进行数据集中或融合的前提下对多数据源的数据进行有效地分析挖掘是当前数据挖掘中的一个热点问题。关联规则是数据挖掘中的一个重要研究内容,通过关联规则挖掘可以获得数据之间或属性之间的内在关联,为智能推荐、智能预测等后续工作提供可靠的数据支持。目前,研究者们对静态的集中式数据的关联规则挖掘方式进行了研究,并形成了较完善的研究结果。对于动态数据关联规则的挖掘,虽有一些研究,但还不完善。其中关联规则增量挖掘是动态关联规则挖掘的一个重要方向。现有的高效处理关联规则增量挖掘的算法都是不生成候选项集的,此类算法都是以空间换时间的思路实现的,如何在时间效率不变或变化不大的情况下优化空间是关联规则增量挖掘的一个新问题。除此以外,随着数据多样化的出现,针对不同数据类型的关联规则挖掘也成为了目前的研究热点。本文深入研究了关联规则增量挖掘和多源数据关联规则增量挖掘,主要内容如下:1.关联规则增量挖掘。首先,从现有的关联规则增量挖掘算法中分析比较出了一种时间效率较优的Can树算法。然后,分析研究发现该算法存在空间占用率较高的缺点。针对该缺点,分析出导致该缺点的原因与预排序顺序有关,并提出了基于数据量顺序排序构建Can树的改进方法,从而降低了该算法的空间占用率。最后,通过实验验证了该方法能够有效提高Can树算法的空间效率,并提高了时间效率。2.多源数据关联规则增量挖掘。首先,分析了多源数据的叁大特点:多样性、分散性和异步性,以及多源数据挖掘应注意的问题。然后针对多源数据的其中两个特点:分散性和异步性,提出了结合分布式关联规则挖掘和关联规则增量挖掘两类算法的多源数据关联规则增量挖掘算法。最后,通过多组实验验证了该算法可以解决多源数据的分散性和异步性,并针对第二次挖掘比较了多种关联规则增量挖掘算法,选取了其中较优的一种作为算法中的二次挖掘算法。(本文来源于《重庆邮电大学》期刊2018-05-17)
王诚,赵申屹[7](2018)在《一种改进的并行关联规则增量更新算法研究》一文中研究指出传统的基于频繁模式增长的并行关联规则算法在处理动态更新的数据集时,需要把更新后的数据集全部压缩到频繁模式树中,消耗了大量时间和存储空间,且没有充分考虑头表分组过程中组间负载量不同的问题。针对在关联规则的实际挖掘过程中,数据集快速增长所造成的增量更新问题,基于并行频繁模式增长PFP-tree算法,结合Spark分布式并行处理框架,提出一种改进的并行关联规则增量更新算法。在增量更新过程中,为了减少挖掘时间和存储空间,利用已有挖掘结果对新增数据集构建频繁模式树。通过改进头表分组策略,实现了并行挖掘节点之间的负载均衡。实验分析表明,相较于传统的关联增量更新算法,该算法是可行的且具备较高的挖掘效率和可扩展性,适用于动态增长的大数据环境。(本文来源于《计算机技术与发展》期刊2018年07期)
廖旺宇[8](2017)在《基于增量关联规则游记挖掘的景点推荐应用研究》一文中研究指出文章提出了一种基于旅游文记挖掘的改进增量关联规则景点推荐算法。该算法紧密关注旅行者偏好,基于分类有效降低了算法空间复杂度,使得挖掘结果聚焦度更高;能够高效处理旅游文记数量增长的状况,避免了反复扫描整个数据集,仅需扫描增量数据集并结合已有挖掘结果便可开展高效运算分析,完成相关景点推荐应用。通过使用网络获取旅游文记作为实例对算法进行验证,表明改进算法在候选项集获取个数方面减少明显,推荐结果清晰明了,有较明显的优势。(本文来源于《四川旅游学院学报》期刊2017年06期)
余小高,鲁群志[9](2017)在《分布式动态数据库增量关联规则挖掘研究》一文中研究指出为了解决分布式动态数据库关联规则挖掘效率低的问题,利用MPI与OpenMP的优点,提出了实现增量关联规则挖掘的混合模式。在次频繁项概念基础上,给出该混合模式总体架构,设计了基于MPI与OpenMP的分布式动态数据库增量关联规则挖掘混合模式工作流程,并给出了伪代码描述,该模式只处理变化的数据。实验结果表明,该模式比现有的串行与分布式关联规则挖掘方法效率更高、性能更优。(本文来源于《软件导刊》期刊2017年10期)
马威[10](2017)在《基于Spark的增量式关联规则的手机病毒挖掘的研究与实现》一文中研究指出随着手机病毒的爆发及其危害范围的不断变大,手机安全问题引起了信息安全方面的广泛关注。因此,如何快速识别不断变异的手机病毒来避免手机用户的隐私泄露和经济损失变得十分重要。针对手机病毒挖掘系统单机版本实现中训练时间过长的问题,木文基于Spark分布式计算框架实现了基于Apriori的分布式关联规则挖掘算法,并实现了基于FUP和IUA算法的分布式增量更新挖掘算法,为手机病毒数据检测提供了一种高效的解决方案。本文的主要工作为:(1)搭建实验测试环境,基于叁台Linux系统的虚拟机,部署了分布式的Hadoop集群和Spark On Yarn集群。为了便于Spark应用程序的开发与测试,配置了 Scala语言环境和IDEA。本文实现的分布式并行算法的效率都是基于该Spark集群进行验证和测试。(2)总结了关联规则的概念与挖掘步骤。分析了单机版本Apriori及其改进算法,基于Spark分布式计算框架实现并行化的Apriori算法和基于属性全排列的算法,通过实验对两种算法的并行化性能进行分析和比较。(3)在分析了 FUP算法和IUA算法的基础上,根据这两个算法的缺点,采用了新的数据库操作方法和增量更新技术,提出并阐述了对这两个算法的改进方案。针对改进后的FUP算法和IUA算法,基于Spark分布式计算框架实现并行化的FUP改进算法与IUA改进算法,并通过实验对两种改进算法的并行化效果进行验证。(4)在手机病毒检测系统的应用方面,完成了关联规则模块的设计与实现,运用基于Spark的增量关联规则算法进行病毒检测,并通过实验进行结果分析。本文的主要贡献有以下几方面:(1)针对FUP算法和IUA算法存在的缺陷,本文提出了改进的增量更新式关联规则算法FUP和IUA算法,提高了算法的执行效率。(2)本文的关联规则挖掘模块采用了Apriori算法、FUP改进算法和IUA改进算法相结合的方式,首先通过Apriori算法建立关联规则模型,然后通过FUP算法训练增量数据的同时,还能根据频繁项集预选率的适中程度,利用IUA算法在支持度标准偏差允许的条件下调整最小支持度阈值大小,产生更强的关联规则,从而发现未知病毒。(3)本文实现了基于Spark的分布式并行化的Apriori及其改进算法、增量式更新关联规则FUP改进算法和IUA改进算法,不仅提高了算法的效率,而且弥补了 MLlib里关联分析类算法的不足,并可以应用到对大规模数据进行关联分析的其他场景。(本文来源于《北京邮电大学》期刊2017-03-10)
增量关联规则论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
关联规则挖掘是数据挖掘中的重要研究内容,在实际应用中,数据库的更新必然引起关联规则的变化,如何高效地获取更新后数据库的关联规则成为研究的热点。本文重点对增量式关联规则FUP算法的基本思想进行了探讨,指出了该算法的优缺点并通过具体实例说明发现频繁项集的方法,最后针对该算法会产生大量候选项集和多次扫描数据库的问题,指出了改进算法,为增量式关联规则挖掘奠定理论基础。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
增量关联规则论文参考文献
[1].亓文娟.增量式关联规则挖掘算法在大学生心理危机预防中的应用研究[J].赤峰学院学报(自然科学版).2019
[2].亓文娟.增量式关联规则挖掘算法的研究[J].安阳工学院学报.2018
[3].赵申屹.基于增量关联规则算法的短期电力负荷预测方法研究[D].南京邮电大学.2018
[4].胡军,潘皓安.基于Can树的关联规则增量更新算法改进[J].重庆邮电大学学报(自然科学版).2018
[5].王帅,杨秋辉,曾嘉彦,万莹,樊哲宁.加权增量关联规则挖掘在通信告警预测中的应用[J].计算机应用.2018
[6].潘皓安.多源数据关联规则增量挖掘研究[D].重庆邮电大学.2018
[7].王诚,赵申屹.一种改进的并行关联规则增量更新算法研究[J].计算机技术与发展.2018
[8].廖旺宇.基于增量关联规则游记挖掘的景点推荐应用研究[J].四川旅游学院学报.2017
[9].余小高,鲁群志.分布式动态数据库增量关联规则挖掘研究[J].软件导刊.2017
[10].马威.基于Spark的增量式关联规则的手机病毒挖掘的研究与实现[D].北京邮电大学.2017