双支持度关联规则论文-梁杨,钱晓东

双支持度关联规则论文-梁杨,钱晓东

导读:本文包含了双支持度关联规则论文开题报告文献综述及选题提纲参考文献,主要关键词:大数据,频繁项集,关联规则,多最小支持度

双支持度关联规则论文文献综述

梁杨,钱晓东[1](2019)在《多最小支持度关联规则改进算法》一文中研究指出由于大数据具有多样性的特点,在数据挖掘过程中采用单一最小支持度会出现较多冗余规则,造成挖掘效率不高等问题,该文提出一种基于多最小支持度关联规则改进算法.通过给每一项目设置单独的支持度阈值,构建多最小支持度模式树,利用最小频繁项目作为节点筛选标准,进行冗余节点删除;在挖掘频繁项集的过程中利用排序向下闭合的性质,删除冗余的候选项集,同时能够自动停止向下挖掘,从而快速直接地得到所有频繁项集,并且不需要多次扫描数据库.实验结果表明,改进算法能够提高挖掘效率,节省计算时间.(本文来源于《西南大学学报(自然科学版)》期刊2019年07期)

林甲祥,巫建伟,陈崇成,张泽均,舒兆港[2](2018)在《支持度和置信度自适应的关联规则挖掘》一文中研究指出以事务集中所有项的支持数和所有规则的置信度数据为依据,使用统计拟合技术,对支持度和置信度阈值的自动化确定进行研究,提出支持度和置信度自适应的关联规则挖掘算法AdapARM (adaptive association rule mining),降低算法对先验知识的依赖性。在标准数据集Trolley和Groceries上进行实验研究,实验结果及其分析验证了AdapARM算法的有效性,其具有用户不必具备数据集的先验知识、不需人为设定支持度和置信度参数的优点。(本文来源于《计算机工程与设计》期刊2018年12期)

黄亚东,刘渊[3](2017)在《使用多支持度的关联规则分类算法》一文中研究指出传统关联分类算法使用单一最小项目支持度挖掘关联规则,导致稀有项关联规则无法被发现,从而影响分类的准确性和实用性。提出一种多支持度关联规则分类算法MS-CBAR(Multiple Supports-Classification Based on Association Rules),将多最小项目支持度模型应用于关联分类,以有效挖掘稀有项。该算法为数据库中的规则项提供了用户可定义的最小项目支持度。MS-CBAR算法使用项的最小项支持度阈值、类的最小类支持度值和规则项的最小支持度值决定分类规则是否频繁。生成分类规则集后,使用最高优先度规则覆盖法基于规则集建立分类器。实验表明,所提算法在包含稀有项目及稀有类的数据集中准确率高于传统关联分类算法及其相关算法,表现更稳定。(本文来源于《计算机应用与软件》期刊2017年09期)

陈星星[4](2017)在《基于多最小支持度关联规则的电子商务推荐系统的研究与实现》一文中研究指出随着互联网技术的高速发展,数据开始呈指数式的增长,用户在海量的信息中越来越难找到自己所需要的信息。因此,如何在海量的数据中快速的找到自己所需要的信息,这将成为电子商务推荐系统的一个重要研究内容。本文从商品推荐系统的研究背景、研究意义和研究现状开始研究,对推荐系统中常用的算法以及所面临的问题进行深入研究。由于关联规则算法是电子商务推荐系统中应用较为成功的算法,所以本文采用了关联规则算法作为推荐系统的推荐算法。但在实际的运用情况下,传统关联规则挖掘算法存在支持度阈值设置单一、设置难和算法运行效率低下等问题。本文提出了针对FP-growth算法的改进方案,提出了基于多项目支持度树结构和支持度数组结合的关联规则挖掘算法,并且给出了改进关联规则算法的实现过程以及代码的具体实现。同时,本文还针对了单一的关联规则算法难以满足复杂推荐系统的应用,提出了结合数据分层和基于用户兴趣Top-N推荐策略的方法,有效解决数据“规则爆炸”的问题,从而提高推荐系统的运行效率。由于数据量大,对数据的处理需要较长的时间开销,传统的数据处理技术难以满足快速完成大规模的数据处理要求。因此,本文还使用Hadoop作为技术手段,实现高效的电子商务推荐系统。本文将商城的数据作为数据源,使用准确率和覆盖率评价标准来对系统进行测试,实验结果表明该推荐模型在推荐结果的准确性方面有明显的提高,并且保证每个商品种类的覆盖率均达到90%以上。最后,基于理论研究和实验测试,讨论了电子商务推荐系统的架构和实现方法,使用JavaEE的框架和B/S模式搭建推荐系统,系统包含后台管理系统和在线推荐系统两大模块,分别实现数据的处理与在线推荐的功能,从而验证了该推荐系统的可行性及应用性。(本文来源于《暨南大学》期刊2017-05-01)

王海波,张永田,吴升[5](2016)在《基于数据立方体的多最小支持度关联规则在犯罪分析中的应用》一文中研究指出为了快速获取候选项集的支持度,避免频繁访问数据库而造成效率低下的问题,在MSapriori算法的基础上引入数据立方体,提出DC_MSapriori算法。该算法无需多次扫描事务数据库,减少了I/O操作,降低了搜索开销。实验基于福州市鼓楼区各大医院周边的案事件数据,快速挖掘出犯罪时空模式,验证了算法的有效性。(本文来源于《测绘科学技术学报》期刊2016年04期)

赵林莉,杨晓光[6](2015)在《基于Hadoop的多最小支持度关联规则挖掘研究》一文中研究指出本文对关联规则挖掘中的基于多最小支持度模型的MS-Apriori算法进行了介绍,并且对MS-Apriori算法展开分析,针对该算法在单机串行模式下运行效率较低的问题提出改进方案,该方案主要依托云计算技术,基于hadoop平台。算法经过改进,可实现数据的分布式和并行化处理,提高了传统关联规则算法的执行效率。(本文来源于《数字技术与应用》期刊2015年10期)

王金[7](2015)在《基于多最小支持度的关联规则挖掘研究》一文中研究指出随着社会的发展和进步,数据库中的数据量越来越大。如何从海量的数据中找到自己所需要的规则已经成为了人们不得不面对的问题。在大量的数据里挖掘我们所需要的规则是非常繁琐的,一方面由于在现实社会中,我们得到的数据往往是缺失部分值的,这对于规则的挖掘非常不利,另一方面,数据库中的条件属性有些对于决策的得出是不必要的,不需要进行考虑的,多余属性的存在一定程度上使规则的挖掘更加麻烦。同时,目前针对关联规则的挖掘大部分使用的是单最小支持度,这不利于实际的应用。针对上述存在的问题,本文将粗糙集理论中的不完备信息系统完备化、属性约简与关联规则挖掘相结合,进行了基于多最小支持度的关联规则挖掘研究。主要研究内容如下:1.简单介绍了粗糙集与关联规则的相关理论,以及关联规则挖掘问题的国内外研究现状,并对其进行了相应研究。2.在原Apriori算法的基础上结合黄金比例进行改进,得出基于黄金比例的关联规则挖掘算法。改进算法解决了最小支持度过于单一的问题,通过仿真实验证明该算法可以有效提高挖掘关联规则的效率。3.针对不完备信息系统中关联规则的挖掘,本文对相关的传统算法进行了改进。首先,从不完备信息系统中对完备的数据进行抽样,设定较高的支持度阈值后,运用基于黄金比例的关联规则挖掘算法对抽样后的数据进行挖掘,得出其中的频繁项集。之后,借助频繁项集按照一定的规则对不完备数据进行完备化与属性约简,得到新的信息系统。最后,通过改良算法对新的信息系统进行挖掘,得出不完备信息系统中的关联规则。仿真实验分析表明,组合算法实际运行可行,且与其他算法相比,本文所提组合算法显着提高了在不完备信息系统中挖掘关联规则的效率。目前针对完备信息系统的关联规则挖掘已有较多的研究成果,但在不完备信息系统中的关联规则挖掘研究较少,同时本文通过挖掘关联规则来对不完备信息系统进行完备化与属性约简,为以后的研究提供了可能的方向。(本文来源于《青岛理工大学》期刊2015-06-01)

黄水源,段文影,陈桂香,胡苏阳[8](2015)在《基于多支持度的增量式关联规则挖掘算法》一文中研究指出传统的基于关联规则的挖掘算法采用的是统一的最小支持度,但是在实际的事务数据库中数据项的重要性是不同的。针对目前多支持度和增量式关联规则更新维护的局限性,提出一种基于多支持度的增量式关联规则挖掘算法。允许用户根据不同项的重要性设置权值,有利于发现更多有趣的规则。采用矩阵的向量内积策略,结合动态剪枝,无需多次扫描事务数据库,不生成庞大候选集。实验结果验证了算法的有效性。(本文来源于《南昌大学学报(理科版)》期刊2015年02期)

王中义[9](2014)在《基于动态支持度的流数据关联规则挖掘》一文中研究指出流数据存在于工业生产、生活活动、商业交易等领域,与人们的生活、生产等息息相关,因此对流数据的研究是十分有意义的。流数据挖掘的主要方向之一是在其上挖掘关联规则。流数据关联规则的挖掘可以挖掘到不同数据流间的相关关系。由于流数据的自身特性:大量性、流动性、不可预知性等,随着时间的变化,数据流所蕴含的知识也在不断的更新,因此流数据对数据挖掘算法提出了很高的要求。人们大多情况下对最新的数据所蕴藏的知识更感兴趣,并且我们更关心发生在不同时间段之间的关联规则,因此本文提出了搜寻最优支持度的跨事务间关联规则的挖掘方法。目前学界已经对关联规则有了很深入的研究了,研究方向也分许多方面,这些研究由于方法不同所以挖掘出的知识也不尽相同,但是大部分算法都找到了事务内关联规则,在挖掘事务间的关联规则方面做出特别深入的研究是很少,且这些算法都是基于人为主观设置最小支持度阈值的。本文首先利用滑动窗口对数据进行了限制,然后对流数据进行预处理。在预处理的过程中利用了线性化拟合的方法降低了数据量,最后在预处理的结尾本文提出了分组大事务的方法来生成跨事务间数据集。在挖掘关联规则过程中本文根据关联规则的挖掘算法FP-growth提出了ITF-tree算法。随着时间的增加数据量会一直增多,但是一般情况下人们对历史数据的关注度会低于对最近生成的数据,因此本文利用了数据衰减的概念,从而降低历史数据对当前挖掘结果的影响程度。由于人为的设置最小支持度阈值可能会带来许多问题,因此本文提出了一个搜寻最小支持度阈值的方法。通过与已有算法在热电厂数据集上进行了对比试验,表明本文所提出的方法是有效的。在时间效率上可以较好的满足流数据的要求,同时可以挖掘到有效的跨事务关联规则。(本文来源于《哈尔滨工业大学》期刊2014-12-01)

张伟丰,杨丽华[10](2014)在《基于矩阵的多段支持度关联规则挖掘算法》一文中研究指出为有效提高关联规则挖掘算法效率,提出了一种基于矩阵的多段支持度关联规则挖掘算法,该算法通过一次数据库扫描将事务数据存放在矩阵中,利用矩阵进行支持度的计算和频繁集的寻找,同时将项集支持度分段计算的思想应用其中,减少候选集生成,实验表明,算法效率得到了较大提高。(本文来源于《湖北汽车工业学院学报》期刊2014年02期)

双支持度关联规则论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

以事务集中所有项的支持数和所有规则的置信度数据为依据,使用统计拟合技术,对支持度和置信度阈值的自动化确定进行研究,提出支持度和置信度自适应的关联规则挖掘算法AdapARM (adaptive association rule mining),降低算法对先验知识的依赖性。在标准数据集Trolley和Groceries上进行实验研究,实验结果及其分析验证了AdapARM算法的有效性,其具有用户不必具备数据集的先验知识、不需人为设定支持度和置信度参数的优点。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

双支持度关联规则论文参考文献

[1].梁杨,钱晓东.多最小支持度关联规则改进算法[J].西南大学学报(自然科学版).2019

[2].林甲祥,巫建伟,陈崇成,张泽均,舒兆港.支持度和置信度自适应的关联规则挖掘[J].计算机工程与设计.2018

[3].黄亚东,刘渊.使用多支持度的关联规则分类算法[J].计算机应用与软件.2017

[4].陈星星.基于多最小支持度关联规则的电子商务推荐系统的研究与实现[D].暨南大学.2017

[5].王海波,张永田,吴升.基于数据立方体的多最小支持度关联规则在犯罪分析中的应用[J].测绘科学技术学报.2016

[6].赵林莉,杨晓光.基于Hadoop的多最小支持度关联规则挖掘研究[J].数字技术与应用.2015

[7].王金.基于多最小支持度的关联规则挖掘研究[D].青岛理工大学.2015

[8].黄水源,段文影,陈桂香,胡苏阳.基于多支持度的增量式关联规则挖掘算法[J].南昌大学学报(理科版).2015

[9].王中义.基于动态支持度的流数据关联规则挖掘[D].哈尔滨工业大学.2014

[10].张伟丰,杨丽华.基于矩阵的多段支持度关联规则挖掘算法[J].湖北汽车工业学院学报.2014

标签:;  ;  ;  ;  

双支持度关联规则论文-梁杨,钱晓东
下载Doc文档

猜你喜欢