频繁项论文-黄彩娟,刘卓华,所辉,杨滨

频繁项论文-黄彩娟,刘卓华,所辉,杨滨

导读:本文包含了频繁项论文开题报告文献综述及选题提纲参考文献,主要关键词:频繁项集挖掘,MapReduce,前缀序列树,模糊支持度

频繁项论文文献综述

黄彩娟,刘卓华,所辉,杨滨[1](2019)在《大数据环境下基于前缀树的频繁项集挖掘》一文中研究指出针对大数据环境下频繁项查找效率低和可扩展性问题,提出了一种基于MapReduce框架运行的新分布式FIM算法。首先,使用前缀序列树来构建候选序列子集,避免了昂贵的扫描过程。接着,使用宽幅支持度的方法产生频繁项集,每个MapReduce迭代将修剪掉非频繁项集,显着地压缩内存消耗,以及每一个MapReduce作业的迭代时间。最后,在不同事务规模和支持度下,与不同算法进行实验对比。实验结果表明,提出的序列增长算法获得了良好的效率和可扩展性,特别是在处理大数据集和长项集方面。(本文来源于《控制工程》期刊2019年11期)

王志华,刘绍廷,罗齐[2](2019)在《基于邻接多重表的动态频繁项集挖掘算法》一文中研究指出为解决传统的Apriori算法多次扫描数据库和多次连接带来的时间开销及加入新事务时未能实时动态更新频繁项集的不足,对传统Apriori挖掘算法和基于矩阵频繁项集动态挖掘算法的执行效率和空间利用情况的问题进行深入分析,提出基于邻接多重表的动态频繁项集挖掘优化算法。将所有事务项映射到带有权值的邻接多重表结构上,通过遍历邻接多重表结构来挖掘频繁项集,在加入新事务时可以动态更新频繁项集。实验结果表明,该算法在执行性能上有一定提升,减少了内存开销,弥补了加入新事务时未能实时动态更新频繁项集的不足。(本文来源于《计算机工程与设计》期刊2019年11期)

郭宇红,童云海[3](2019)在《隐私保护频繁项集挖掘中的细粒度随机化模型》一文中研究指出已有的随机化回答模型调控的数据范围宽、粒度粗,对隐私数据的保护粒度缺乏灵活性,无法实现精细化、个性化、差异化的隐私保护。提出叁类多参数随机化回答模型,包括行多参、复合多参、分组多参共11种随机化回答模型,给出了模型的分类框架和分类层次。细粒度多参数随机化模型可实现精细化、个性化、差异化的隐私保护效果。(本文来源于《软件工程》期刊2019年10期)

房新秀[4](2019)在《浅谈加权频繁项集挖掘的研究进展》一文中研究指出加权频繁项集挖掘是目前研究热点之一。自从关联规则挖掘提出以来,大部分的研究工作都围绕频繁项集挖掘问题进行。传统的关联挖掘算法往往忽略数据库中各个项目的重要程度区别,因此利用加权关联规则是有意义的。十几年来,学者们从不同的角度进行改进从而提高挖掘加权频繁项集算法的效率。本文首先分析了频繁项集挖掘现状,其次对加权频繁项集挖掘进行深入分析,最后通过对比频繁项集与加权频繁项集算法,对未来的工作进行了展望。(本文来源于《电脑知识与技术》期刊2019年27期)

顾军华,李如婷,张亚娟,董彦琦[5](2019)在《改进的频繁项集挖掘算法及其应用研究》一文中研究指出频繁模式增长(FP-growth)算法是挖掘频繁项集的经典算法,解决了挖掘频繁项集时需多次扫描数据库且产生大量候选项集的问题,但大多数基于FP-growth思想的算法在生成频繁项集时存在过程复杂、占用空间多的问题。为此,提出一种基于前序完全构造链表(PF-List)的频繁项集挖掘算法(PFLFIM)。该算法使用PF-List表示项集,通过简单比较和连接两个PF-List挖掘频繁项集,避免复杂的连接操作;使用包含索引、提前停止交集和父子等价策略对搜索空间进行优化,减少空间占用。通过实验验证,相比于FIN算法和negFIN算法,该算法在运行时间和内存占用方面具有更好的性能。将该算法应用于高校人力资源管理系统中进行关联规则挖掘,寻找影响人才发展的因素,为高校人才引进和选拔提供决策支持。(本文来源于《计算机应用与软件》期刊2019年09期)

郑英姿,张福泉,李立杰[6](2019)在《基于强化学习的大数据频繁项集挖掘算法》一文中研究指出针对当前大数据集频繁项集挖掘算法处理速度慢的问题,提出一种快速的大数据频繁项集挖掘算法。对多目标强化学习技术进行改进,使其适合频繁项集挖掘的应用场景;将频繁1-项集作为强化学习的初始化空间,解决随机初始化方案性能不稳定的问题;利用频繁项集的递归属性引导项集空间的搜索过程,合理地缩小搜索空间。基于不同规模的会话数据集进行仿真实验,结果表明,该算法对于不同规模的数据集均实现了较高的计算效率,获得了较高的挖掘准确率。(本文来源于《计算机工程与设计》期刊2019年08期)

殷茗,王文杰,张煊宇,姜继娇[7](2019)在《一种基于邻接表的最大频繁项集挖掘算法》一文中研究指出针对Apriori算法与FP-Growth算法在最大频繁项集挖掘过程中存在的运行低效、内存消耗大、难以适应稠密数据集的处理、影响大数据价值挖掘时效等问题,该文提出一种基于邻接表的最大频繁项集挖掘算法。该算法只需遍历数据库一次,同时用哈希表对邻接表进行辅助存储,减小了遍历的空间规模。理论分析与实验结果表明,该算法时间与空间复杂度较低,提高了最大频繁项集挖掘速率,尤其在处理稠密数据集时具有较好的优越性。(本文来源于《电子与信息学报》期刊2019年08期)

杨秋翔,王冠男,王婷[8](2019)在《改进的频繁项集挖掘算法关键技术研究》一文中研究指出为解决在挖掘频繁项集时由忽略项目间重要性差异以及最小支持度频繁变动而导致的挖掘效率低以及利用率低。通过关系矩阵解决数据体量大造成的挖掘效率低的问题;通过加权规则解决不同业务项目间重要性差异问题;通过动态树解决最小支持度变动频繁的问题。本文创新性提出加权矩阵动态树算法WMDT。实验结果表明,WMDT算法较以往算法,精准度和挖掘效率有显着提高同时受最小支持度变动影响较小,是一个高效的频繁项集挖掘算法。(本文来源于《电子设计工程》期刊2019年15期)

王培培,胡威威,孙丽娜[9](2019)在《基于频繁项集的多用户数据流混合推荐仿真》一文中研究指出针对当前数据流推荐存在安全性差和精确度低的问题,提出基于频繁项集的电商多用户数据流混合推荐方法。将蚁群算法与属性相关分析融合,将蚁群收敛所至路径判断为存在安全隐患的路径,对路径中存在安全隐患的数据进行判断,确定最终异常值并去除。基于数据流安全分析,引入增量挖掘算法,采用次频繁项索引表更新频繁树,并利用压缩FP-树与矩阵技术对新频繁树的频繁模式进行挖掘。根据数据流频繁模式挖掘,将不同数据流分类至相应主题组。基于频繁项集计算多用户访问相似程度,同时找到用户最近邻平时访问数据。结合主题抽取、最近邻访问及多用户共同兴趣相似度计算,将最符合用户的数据流推荐给用户,实现用户数据流混合推荐。实验结果表明,上述方法推荐过程安全性能好,且推荐结果准确度高,是一种切实可行的数据推荐方法。(本文来源于《计算机仿真》期刊2019年09期)

丁洁[10](2019)在《一种基于云平台的频繁项集数据挖掘改进算法》一文中研究指出在现如今数据本身十分庞杂和数据处理工作量越来越大的情形下,依然采用串行的算法和单机的处理环境进行数据挖掘已不可想象,在分析传统关联规则算法的基础上,提出了一种利用矩阵描述事务以减少遍历次数的挖掘改进算法,同时该算法基于云平台技术并采用并行方式进行以降低时间复杂度。(本文来源于《自动化技术与应用》期刊2019年07期)

频繁项论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为解决传统的Apriori算法多次扫描数据库和多次连接带来的时间开销及加入新事务时未能实时动态更新频繁项集的不足,对传统Apriori挖掘算法和基于矩阵频繁项集动态挖掘算法的执行效率和空间利用情况的问题进行深入分析,提出基于邻接多重表的动态频繁项集挖掘优化算法。将所有事务项映射到带有权值的邻接多重表结构上,通过遍历邻接多重表结构来挖掘频繁项集,在加入新事务时可以动态更新频繁项集。实验结果表明,该算法在执行性能上有一定提升,减少了内存开销,弥补了加入新事务时未能实时动态更新频繁项集的不足。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

频繁项论文参考文献

[1].黄彩娟,刘卓华,所辉,杨滨.大数据环境下基于前缀树的频繁项集挖掘[J].控制工程.2019

[2].王志华,刘绍廷,罗齐.基于邻接多重表的动态频繁项集挖掘算法[J].计算机工程与设计.2019

[3].郭宇红,童云海.隐私保护频繁项集挖掘中的细粒度随机化模型[J].软件工程.2019

[4].房新秀.浅谈加权频繁项集挖掘的研究进展[J].电脑知识与技术.2019

[5].顾军华,李如婷,张亚娟,董彦琦.改进的频繁项集挖掘算法及其应用研究[J].计算机应用与软件.2019

[6].郑英姿,张福泉,李立杰.基于强化学习的大数据频繁项集挖掘算法[J].计算机工程与设计.2019

[7].殷茗,王文杰,张煊宇,姜继娇.一种基于邻接表的最大频繁项集挖掘算法[J].电子与信息学报.2019

[8].杨秋翔,王冠男,王婷.改进的频繁项集挖掘算法关键技术研究[J].电子设计工程.2019

[9].王培培,胡威威,孙丽娜.基于频繁项集的多用户数据流混合推荐仿真[J].计算机仿真.2019

[10].丁洁.一种基于云平台的频繁项集数据挖掘改进算法[J].自动化技术与应用.2019

标签:;  ;  ;  ;  

频繁项论文-黄彩娟,刘卓华,所辉,杨滨
下载Doc文档

猜你喜欢