导读:本文包含了事务间关联论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:规则,事务,算法,数据挖掘,模型,频繁,策略。
事务间关联论文文献综述
张诤,王惠文[1](2015)在《大规模数据集事务间关联规则挖掘方法研究——大数据挖掘方法研究之二》一文中研究指出文章针对具有时间约束的大规模事务数据间关联规则挖掘问题,设计了一种时间约束频繁项目关系矩阵数据结构,并在此基础上,提出了时空性能优越的基于时间约束频繁项目关系矩阵的事务间关联规则挖掘方法。并通过示例和实验,对所提方法的逻辑可行性、有效性和适应性进行了验证。(本文来源于《生产力研究》期刊2015年01期)
李春青,李海生[2](2014)在《基于事务间关联规则的数据挖掘算法研究》一文中研究指出结合模糊集和不确定性推理等理论,对数据挖掘诸多问题进行了系统的描述,尤其注重详细介绍关联规则问题。在研究现有算法的基础之上,提出自己的基于变换矩阵形式的相似度量基础上的多维事务间及事务间关联规则的挖掘算法及模型,从而使得挖掘效率得到提高。(本文来源于《福建电脑》期刊2014年12期)
孙帆[3](2012)在《事务间关联规则挖掘技术研究》一文中研究指出数据挖掘(Data Mining)是从存放在数据库、数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解模式的非平凡过程。而关联规则挖掘作为数据挖掘中的一项根本性任务,其目标是在事务项目中找出所有的并发关系(Co-occurrence Relationships),这种关系也被称为关联。本文对传统的事务间关联规则算法和现有的负关联规则算法进行了系统的分析和总结,在此基础之上提出了新的算法思想,主要包括下面两个方面:首先,本文提出了以用户为研究对象,通过对大量用户的行为建立模型,来推测与其具有相似性的用户的可能行为。提出一种新的双策略模型,按照用户对网站的兴趣度将源数据库分割成为两类库,然后对其使用马尔可夫预测模型和事务间关联规则进行兴趣度预测,将复杂的源数据进行修剪,减少了多次重复扫描数据库的工作量,同时也减少了无用规则的产生,能更真实的反映用户的兴趣趋向,在增大算法精确度的基础上也有效的提高了算法的执行效率。其次,针对负关联规则挖掘问题,总结现有的挖掘负规则规则的方法,如利用兴趣度、相关性等,并指出其在挖掘负关联规则时仍然存在的不足。提出将相关系数和卡方检验相结合的方法,修正了单单使用兴趣度来度量相关性时产生的歧义,通过计算得出的结果来确定其是正规则、弱规则或者负规则,不仅能通过挖掘规则来使我们得到传统关联规则挖掘中得不到的潜在信息,还能甄别出传统关联规则挖掘中存在的误导规则,提高关联规则的实用性和适用性。在现实情况中,事务和事务之间总是存在着因果联系,而关联规则的任务就是找出这些联系。但是随着数据库的增大,数据项的冗余,关联规则结果的增多,数据挖掘的准确效率问题和关联规则结果的可信度问题越加凸显,通过双策略将数据库分而治之,通过负规则检验将误导规则去除,为关联规则挖掘理论研究提供了新的思路。(本文来源于《辽宁师范大学》期刊2012-06-01)
祁艳艳[4](2011)在《Web使用挖掘中事务间关联规则方法研究》一文中研究指出Web数据挖掘是在Web资源环境中根据用户的浏览行为提取出用户关心的、有价值的信息过程。Web使用挖掘是数据挖掘的重要组成部分,用户是Web使用挖掘的核心。Web使用挖掘通过关联规则算法获取有意义的、描述用户行为的模型,并为用户提供指导性的预测经验。通过对以往的事务间关联规则挖掘算法的系统分析和总结,本文提出了两种新的事务间关联规则挖掘算法:(1)基于聚类分析的事务间关联规则挖掘算法,该算法首先利用聚类分析将初始的复杂的数据集进行约减,去掉冗余数据,缩小数据集,避免了多次扫描数据库和大量虚假规则的产生;其次对聚类预处理后所得到的各个小数据集分别进行事务间关联规则预测分析。实验结果表明该方法比单独使用事务间关联规则方法具有更高的效率,更能准确的预测用户的兴趣。(2)基于聚类的事务间关联规则双策略分析模型,该算法将双策略兴趣分析模型的思想融入基于聚类分析的事务间关联规则挖掘算法中。该算法首先利用双策略分析模型判断事务间关联规则的完整性,将初始的数据库分为关联库和马尔库,弥补了挖掘漏洞,避免了虚假规则的产生;其次利用聚类分析去掉关联库和马尔库中大量的无关冗余数据,提高算法的执行效率;最后对经过聚类预处理所得到的各个子数据库分别进行事务间关联规则预测和马尔可夫模型预测。实验证明,该算法在准确度和执行效率方面均优于传统的事务间关联规则算法。随着Web技术的不断发展,Web服务器存储的数据也逐渐向着超大化、多维化的方向发展。这为Web使用挖掘提出了新的挑战,即如何解决挖掘速度和准确度之间的矛盾。所以采用事务间关联规则与聚类分析相结合的方法,既提高了挖掘速度又保证了准确度,为Web使用挖掘提出新的创新思路。(本文来源于《辽宁师范大学》期刊2011-04-01)
祁艳艳,任永功[5](2011)在《一种基于聚类分析的事务间关联规则挖掘算法》一文中研究指出现有算法实现了事务内到事务间最大频繁项目集的转换,能够直接发现不同用户之间的关联关系。但在处理较大的事务数据库时,由于是在原数据库基础上进行关联分析,产生了大量的虚假规则。针对上述问题提出一种基于聚类分析的事务间关联规则挖掘算法,利用聚类分析将初始的复杂的数据集进行约简,去掉冗余数据,缩小数据集,避免了多次扫描数据库和大量的虚假规则的产生。实验结果表明该方法比单独使用事务间的关联规则方法具有更高的效率,能更准确地预测用户的兴趣性。(本文来源于《广西师范大学学报(自然科学版)》期刊2011年01期)
任永功,张琰渝[6](2008)在《一种基于最大频繁项目集的挖掘事务间关联规则方法》一文中研究指出Web事务间关联规则挖掘是通过发现网页之间的关联关系来预测用户的兴趣。提出一种新的事务间关联规则挖掘方法,通过对MAFIA算法改进,得到最大频繁项目集的同时得到对应的共有用户集,通过对事务内到事务间最大频繁项目集的转换,分析不同用户之间的关系,分析用户对网站上不同网页的访问数据,直接发现不同用户之间的关联关系来预测用户的兴趣。该方法经试验证明能够更加全面的预测用户感兴趣的网页,更好地为用户提供个性化服务。(本文来源于《计算机科学》期刊2008年11期)
邢文婧[7](2008)在《事务间关联规则挖掘在股价、期货价格预测中的应用》一文中研究指出关联规则作为数据挖掘的一种重要分析方法,在近年来发展日趋成熟。在金融领域,一些研究已开始关注利用关联规则挖掘不同金融产品价格间的关联性、不同市场变动趋势之间的关联性等。然而,前人的研究主要集中在事务内相关性挖掘发面。引入事务间关联规则的概念,并利用FITI算法研究中国股票市场、债券市场、期货市场变动的关联性,以及不同国家间股票市场的关联性。(本文来源于《硅谷》期刊2008年04期)
顿毅杰[8](2005)在《事务间关联规则的有效挖掘》一文中研究指出世界进入信息时代,在各个领域存在大量数据。人们迫切需要将它们转化成有用的信息和知识,以应用于商务管理、生产控制和预测等方面。数据挖掘和知识发现作为从海量数据中提取信息的一种技术,已经成为当前一个具有重要理论和应用价值的研究课题。在目前学术界引起了广泛关注。本文在充分分析数据挖掘的基本特点和相关技术的基础上,探讨了事务间关联规则挖掘的理论及其在预测中的应用,并对两个算法进行了改进和比较。 首先,阐述了数据挖掘技术数十年的发展概况,对关联规则挖掘的概念作了较为系统的描述;关联规则数十年来的发展迅速,已经被扩展到不同的领域。对于这一方面的研究情况,本文也给了具体详尽的描述和总结,并且介绍了关联规则挖掘中的几个主要算法。 其次,介绍了EH-Apriori算法:使用传统的Apriori算法发现事务间频繁项集。为了进一步提高效率,引用哈希技术。即:事务间所有可能的候选2-项集都被作到一个哈希表里。组成哈希表的每个桶的数目代表在这个桶里有多少项集。哈希表被用于减少事务间候选2-项集的数目。如果在哈希表里对应得桶值小于minsup,就撤去一个候选2-项集。称这个算法为Extended Hash Apriori,简称EH-Apriori。 最后,详细探讨了事务间关联规则的挖掘算法。在本论文中,将打破事务的壁垒,扩展关联规则挖掘的范围,从传统的单维事务内关联扩展到多维事务间关联。事务间关联描述了不同事务之间的关联关系,有关联的项属于不同的事务。然而,在相同的规则里,这样一个事务间关联能被扩展出更多性能的关联,以致多维事务间关联也能被定义和发现。挖掘事务间关联在有效率的过程方面比挖掘事物内关联提出了更多的挑战。因为潜在的关联规则数目在事务的界限被打破后,变得特别的大。在介绍了事务间关联规则的概念后,定义它的度量:支持度和置信度,且提出一个有效的算法:FITI(First Intra Then Inter),它采用了两个主要思想:1)一个事务间频繁项集仅仅包含它对应的事务内的副本的频繁项集;2)在事务内频繁项集之间建立一个特殊的数据结构来有效的挖掘事务间频繁项集。拿FITI与EH-Apriori比较,FITI是更好的算法,它更进一步地伸展了事务间挖掘的方法且它的实用性在论文里也被讨论。(本文来源于《兰州理工大学》期刊2005-04-01)
事务间关联论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
结合模糊集和不确定性推理等理论,对数据挖掘诸多问题进行了系统的描述,尤其注重详细介绍关联规则问题。在研究现有算法的基础之上,提出自己的基于变换矩阵形式的相似度量基础上的多维事务间及事务间关联规则的挖掘算法及模型,从而使得挖掘效率得到提高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
事务间关联论文参考文献
[1].张诤,王惠文.大规模数据集事务间关联规则挖掘方法研究——大数据挖掘方法研究之二[J].生产力研究.2015
[2].李春青,李海生.基于事务间关联规则的数据挖掘算法研究[J].福建电脑.2014
[3].孙帆.事务间关联规则挖掘技术研究[D].辽宁师范大学.2012
[4].祁艳艳.Web使用挖掘中事务间关联规则方法研究[D].辽宁师范大学.2011
[5].祁艳艳,任永功.一种基于聚类分析的事务间关联规则挖掘算法[J].广西师范大学学报(自然科学版).2011
[6].任永功,张琰渝.一种基于最大频繁项目集的挖掘事务间关联规则方法[J].计算机科学.2008
[7].邢文婧.事务间关联规则挖掘在股价、期货价格预测中的应用[J].硅谷.2008
[8].顿毅杰.事务间关联规则的有效挖掘[D].兰州理工大学.2005