导读:本文包含了时态数据关联规则论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:时态,规则,数据挖掘,数据,时间,不确定,多维。
时态数据关联规则论文文献综述
刘昆[1](2008)在《针对时间序列数据的时态关联规则挖掘研究》一文中研究指出自80年代开始,数据库技术得到了广泛的普及和应用。随着数据库容量的膨胀,特别是数据仓库以及Web等新型数据源的日益普及,人们面临的主要问题是“数据丰富,但信息贫乏”,即面对浩瀚的数据海洋,却不知该如何有效的地利用这些数据。面对这一问题的挑战,数据挖掘技术应运而生,并显示出强大的生命力。从海量的历史数据中挖掘出其背后蕴含的价值信息对揭发事物发展变化有着重要意义,同时也为科学决策和正确认识事物提供了依据。这些历史数据普遍具有时间性,因此,时间序列数据挖掘研究作为数据挖掘技术研究的重要组成部分,一直以来都受到广泛地重视,成为具有重要理论和实用价值的热点研究课题之一。本文针对时间序列数据的时态关联规则挖掘中时间序列数据表示,频繁序列挖掘,时态关联规则表示和时间序列预测等问题进行研究分析,在频繁序列挖掘和时态关联规则表示等方面取得了一些成果,主要研究工作和研究内容如下:在时序数据中,首先面对的时间区间、时态关系、和时间序列数据表示方法等问题,本文给出了时间序列数据的定义;针对股票交易数据应用,给出了一种相对斜率符号化方法。对已有互关联后继树模型进行了分析,发现此模型能够快速创建并保存挖掘序列的线索,从这个模型中任意分支按线索访问得到的序列是挖掘序列的子序列,根据这性质给出了查询控制机制,尽管如此,一些不需要访问的分支依然被访问到了;针对这一冗余问题,提出了互关联统计线索树模型,互关联统计线索树保存了时间序列的有序性,归并了同类序列,对同类序列创建了线索,避免了查询不必要分支,具有准确定位的特点。本文结合互关联后继树与互关联统计线索树各自优点,提出互关联后继树与互关联统计线索树挖掘频繁序列算法,使挖掘频繁序列的时间复杂度降至为O(可能频繁项的分支数)。对已有的时间序列挖掘思想进行研究,发现对间隔连续序列的研究工作几乎没有开展,本文提出了间隔频繁序列的定义及性质,给出关联加权有向图挖掘间隔频繁序列方法,利用有向图路的有向性保证时间序列有序性,利用加权找出构成可能间隔频繁序列的紧密非频繁序列;使用互关联后继树与统计线索树结合算法对连续非频繁项进行查询、验证、统计,从而得到间隔频繁序列。对时态关联规则进行研究,提出了相对支持度概念,用相对支持度对挖掘出来的连续频繁序列和间隔频繁序列进行表示,获取该时间序列的时态关联规则;利用时态关联规则对时间序列进行预测;通过实验对所提方法进行验证,验证了该算法是有效性、可行性。科技的进步,特别是信息产业的发展,把我们带入了一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据库管理系统的应用领域越来越广泛。特别是条形码和信用卡的普及和使用,进一步加速了商业、金融、保险等领域的信息化进程。人们已经用计算机取代了绝大部分手工操作,使信息数据库系统的信息源不断扩大。同时,海量存储设备不断涌现。面对这些海量和繁杂的信息,如何才能从中提取有价值的知识,是人们需要解决的问题。基于数据库的知识发现(KDD)及相应的数据挖掘就在这样的环境下出现了。数据挖掘是从大量、含有噪声的信息或数据中,挖掘出不为人知的规律或知识,从而更好的指导人们的生产、生活。目前,已经被用到各个领域。根据挖掘研究的数据不同,又有不同的分支;其中,有一类数据具有时间特性在里面,称之为时间序列数据,这类数据在日常生活、工作、生产和科技等各个领域涉足。对这类数据的挖掘是十分必要而且有意义的,对它的挖掘,称之为时间序列数据挖掘。时间序列数据挖掘是数据挖掘的一个分支,当然数据挖掘的经典方法对时间序列数据的挖掘有很好的指导作用,但是由于时间特性,不能将其方法全盘照搬到时间序列挖掘中。本文介绍了数据挖掘的一些基本知识,包括数据挖掘的背景、历史,数据挖掘过程;论述了目前比较流行的挖掘算法,比如传统统计方法、可视化技术、决策树、神经网络、遗传算法、关联规则挖掘算法、粗糙集方法、贝叶斯分类方法、模糊集方法、k-最临近分类法对这些算法做了简要的分析,指明各种算法论述的文章,以便读者需深入时查阅。时间数据序列挖掘是数据挖掘的一个重要组成部分,也是目前研究的热点问题之一。本文介绍了时间序列数据挖掘的目的、任务和方法,介绍时间序列数据变换方法、数据相似搜索、聚类/分类分析、数据可视化、时间序列分割与模式发现、时间序列预测等方法,总结了将来的发展方向。最后,对新动态进行了简单介绍。(本文来源于《云南师范大学》期刊2008-05-20)
梁晓蕾[2](2008)在《关于时态数据关联规则挖掘的研究》一文中研究指出数据挖掘技术自20世纪90年代初期开始崛起,并迅速的成为计算机理论及应用界研究的热点。如今数据挖掘是一个多学科交叉研究领域,它融合了数据库技术、人工智能、机器学习、统计学、信息检索、高性能计算以及可视化等最新技术的研究成果,成功的打破了“数据丰富,知识贫乏”的局面。在数据挖掘技术蓬勃发展的过程中,人们逐渐意识到时态数据挖掘研究的必要性及其重要意义。因为时间是客观世界的客观属性,是数据的固有属性,在数据挖掘的过程中忽略数据的时态语义已然暴露出很多不足。于是诸如时态数据的模式、趋势、约束、因果关系等时态知识的挖掘得到了越来越多的研究,值得提出的是,计算机学术界对于挖掘时态关联规则给予了尤其多的关注。本文提出的是时态数据库中离散属性的带周期规律的关联规则发现方法。关于时态数据周期性关联规则挖掘的研究也有不少,其中包括连续属性的周期性关联规则提取,定制周期内时态关联规则提取等等。在这些研究成果的基础上,本文提出的方法能够计算得到时态数据库中离散属性的周期,进而通过执行改造了的Apriori算法挖掘周期性时态关联规则。本文所做的主要工作概括如下:1.在对时态数据库中的有效时间属性进行划分和标记的基础上,提出了时态数据库中离散属性的周期计算方法,并详细描述了算法的执行步骤。2.提出新的时间区间标记方法,通过划分和标记时态数据库的有效时间属性,用标记集合代替时间区间,达到有效时间区间合理离散化的目的。3.提出改进了的Apriori算法,在计算频繁项集的过程中,相匹配的项集根据其所携带的时间区间标记的不同来分别计算支持度,从而得到带时态信息的频繁项集。4.计算得到带时态信息的关联规则,结合离散属性的周期,合理解释关联规则的周期规律。5.分析本文提出的改进了的Apriori算法在性能上有所提升的主要原因。本文通过对时态数据库的有效时间属性进行两次划分和标记,有效的实现了离散属性的周期计算以及时间区间的离散化,为进一步执行Apriori算法奠定了基础。另外,本文提出的改进了的Apriori算法使得计算频繁项集的迭代过程迅速收敛,减少了扫描数据库的次数,提高了算法的执行效率。(本文来源于《山东大学》期刊2008-04-05)
乐燕波[3](2008)在《时态数据挖掘中关联规则的应用研究》一文中研究指出20世纪80年代末,数据挖掘作为一个全新的研究领域悄然出现并迅速发展。数据挖掘的研究目的是在大型数据集中发现那些隐藏的、人们感兴趣的具有特定规律的信息。作为数据挖掘对象之一的时态数据库是由随时间变化的一系列序列值或事件组成的数据库。时态数据挖掘的研究对商业、金融、医疗诊断、科学与工程等领域的数据分析具有重要意义,因而时态数据的挖掘方法也成为数据挖掘的一个研究热点。关联规则一直是近年来数据挖掘和人工智能领域研究的热点课题,目前在客户关系管理、医学、生物等领域已有应用。传统的关联规则挖掘过程通常不考虑时间约束,如购物篮分析等。由于时态数据库规模不断壮大,重要性不断加强,如何将关联规则挖掘应用到时态数据库中以获得有价值的时态关联规则是一个非常值得研究的课题。另外关联规则在证券市场中的应用尚处于起步阶段,如何有效地将关联规则应用于证券交易系统数据库分析,也需要进一步的探索。本文从研究所处的背景出发,详细阐述了数据挖掘技术及时态数据挖掘的研究现状,介绍了关联规则的相关理论及其在时态数据挖掘中的应用。在深入分析时态关联规则的基础上,本文改进了一般时态关联规则挖掘算法,提出了加权时态关联规则的概念,初步研究了它应用的可行性。用该方法挖掘时态数据库,挖掘结果能更好地反映客户购买习惯的变迁,为市场营销提供决策支持。文章还对不同关联规则挖掘模型得到的结果进行了比较和分析,验证了加权思想的有效性和合理性。本文还创新性地提出了有时态约束的数值型关联规则挖掘方法,并将其引入股市技术分析指标有效性的检验中。选取相对强弱指标RSI,收集交易数据进行实证分析,得出了若干条有用的数值型关联规则,为技术分析的实际应用和投资操作实践提供了指导。(本文来源于《厦门大学》期刊2008-04-01)
朱建平,乐燕波[4](2008)在《数据挖掘中加权时态关联规则的构造》一文中研究指出传统的关联规则很少考虑规则的时间适用性,而时态关联规则中每条关联规则都有其成立的时间区域,对上述问题进行了一定的改进。该文在此基础上,构造了一种体现数据时间价值的加权时态关联规则,以使规则的发现体现一种时间趋势,并对同一组数据采用不同关联规则挖掘的结果进行比较,取得了良好的效果。(本文来源于《计算机工程》期刊2008年06期)
曾志勇,余建坤,翟勇[5](2006)在《一种多维时态关联规则数据挖掘算法》一文中研究指出在关联规则挖掘中,大量的数据是多维的,且带有时态特性,所以往往需要在时态约束的前提下挖掘多维关联规则.本文从一个实际问题出发,在单维Apriori算法和已有的工作基础上,提出了一种新的多维时态关联规则挖掘算法,并与类似算法进行了比较.(本文来源于《云南大学学报(自然科学版)》期刊2006年S2期)
袁海峰[6](2006)在《时态数据关联规则挖掘方法研究》一文中研究指出关联规则作为数据挖掘的一种重要模式,已成为数据挖掘领域的一个非常重要的研究课题,侧重于确定数据集中不同属性之间的联系,找出满足给定支持度和置信度阈值的多属性之间的依赖关系。 由于现实世界是不断演变进化的,时间是那些反映现实世界信息的基本部分,因而大多数数据库应用程序都有时态的特性。时态数据挖掘作为数据挖掘的一个新的课题,引起了人们极大的兴趣,其中时态关联规则的挖掘,已经成为众多学者研究的热点之一。 本论文首先介绍了数据挖掘有关的概念、技术和研究现状,论述了时态数据挖掘及时态关联规则挖掘的研究背景和进展,给出了本文研究的内容。 时间是时态数据的重要属性,对时间进行科学的定义,有助于时态数据库中时间的表示及时态数据挖掘中时态模型的建立,所以我们引入时态型、时态因子和时间粒度等基本概念及性质。在此基础上给出一个时态关联规则的数学模型,列举几个具有实际意义的时态关联规则,最后给出事务数据库中时态关联规则的一种挖掘方法。 最后对不确定时间进行了研究,引入了不确定时间的一种表示方法,给出一种新的不确定时间的“同时”时态关系以及不确定时间的交。在此基础上,提出一种全新的适合有效时间中含有不确定时间的关联规则挖掘方法,并以病历时态数据为例,给出相应算法,最终挖掘出一些疾病间的关联关系。(本文来源于《哈尔滨工程大学》期刊2006-01-01)
罗来鹏[7](2004)在《关于时态数据关联规则挖掘研究》一文中研究指出时态数据挖掘已成为数据挖掘领域一个重要分支和较新的研究方向。目前有关它的关联规则挖掘研究大多比较零散,缺乏统一的理论框架,而且由此所建立的模型及相应算法只是适用于某一特殊的数据类型,缺乏可扩展性;此外,随着Fuzzy集和Rough集理论的引入,如何结合不确定性理论进行挖掘也是尚待探索等等。 本论文,首先通过对基于相关集合事务数据库关联规则挖掘这一方法的研究,借助不确定性推理中包含度理论将之所建立的信任度与Rough集中精度进行对比分析,发现它们在数学计算上是相同的,此外,还推导了信任度的增量计算。 在时间序列挖掘中,借助Rough集理论,将传统的纯数学方法转向人工智能技术与数学相结合的方法。研究了使用Rough集进行挖掘的思想、方法及某些方面的改进,并总结了利用Rough集进行挖掘的常用策略。 其次,为了更好地刻画关联规则的时效性问题,研究了由此而建立的时态型和相应的支持度、信任度及不同类型的时态数据关联规则的描述,通过将它运用于事务数据库中,发现这种描述具有较好的理论分析与实际应用价值。 最后,探讨了模糊思想引入时态数据关联规则挖掘的必要性。(本文来源于《西南交通大学》期刊2004-03-01)
郑琪[8](2003)在《有效时间不确定的时态数据的关联规则挖掘研究》一文中研究指出本文在不确定时间点的时态关系基础上给出了不确定时间区间的定义和“同时”时态关系。由于病历数据的特点和关联规则挖掘的要求,采用附加约束并包含复合项的DHP算法,结合不确定时间区间的时态关系,挖掘出有意义的关联规则。最后给出了一个完整的数据挖掘模型。(本文来源于《暨南大学》期刊2003-04-01)
李少年[9](2003)在《一类时态关联规则数据挖掘的研究》一文中研究指出随着商务活动日趋频繁和企业信息化程度的提高,有越来越多的信息积累,其中大部分均以时态数据形式存在。这样,时态数据挖掘作为数据挖掘的一个新的课题出现,引起了人们极大的兴趣。国内外时态数据挖掘的研究起步不久,面向时态数据的挖掘算法目前效果还不是非常理想,还存在许多问题亟待解决。本文对此进行了研究。 首先,我们介绍了数据挖掘有关的概念、技术和研究现状,论述了时态数据挖掘的研究背景和进展,给出了本文研究的内容。 然后,介绍了时态型、时态因子和时态粒度的基本概念和性质,给出了一种时态关联规则的数学模型,并对给出了几个具有实际意义的时态关联规则。 其次,讨论了单事件相同时态、周期时态内关联规则挖掘的两个算法,并给出了相应的试验结果。同时针对双事件时态关联规则挖掘提出一个增量算法,并给出了实验结果。另外还给出一个基于兴趣度的关联规则挖掘算法和试验结果。 最后,我们论述了Markov Chain在时态数据挖掘中的应用。 本文所获得的主要成果为:1、给出了一种时态关联规则的数学模型,2、提出了单事件相同时态、周期时态内时态关联规则挖掘的两算法,以及双事件时态关联规则挖掘的一个增量算法和一个基于兴趣度的时态关联规则挖掘算法。(本文来源于《湘潭大学》期刊2003-04-01)
孟志青,杨斌[10](2002)在《数据仓库的时态关联规则的描述》一文中研究指出该文从时态型概念出发给出了有限个属性在时态型上描绘的不同状态时态事件空间,定义了事件之间的时态关联规则,由此导出了5种不同的具有一定意义的时态关联规则,这些时态关联规则具有普遍的理论意义,可以用于商品销售、股票价格等等数据仓库中的数据采掘问题。(本文来源于《计算机工程与应用》期刊2002年09期)
时态数据关联规则论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
数据挖掘技术自20世纪90年代初期开始崛起,并迅速的成为计算机理论及应用界研究的热点。如今数据挖掘是一个多学科交叉研究领域,它融合了数据库技术、人工智能、机器学习、统计学、信息检索、高性能计算以及可视化等最新技术的研究成果,成功的打破了“数据丰富,知识贫乏”的局面。在数据挖掘技术蓬勃发展的过程中,人们逐渐意识到时态数据挖掘研究的必要性及其重要意义。因为时间是客观世界的客观属性,是数据的固有属性,在数据挖掘的过程中忽略数据的时态语义已然暴露出很多不足。于是诸如时态数据的模式、趋势、约束、因果关系等时态知识的挖掘得到了越来越多的研究,值得提出的是,计算机学术界对于挖掘时态关联规则给予了尤其多的关注。本文提出的是时态数据库中离散属性的带周期规律的关联规则发现方法。关于时态数据周期性关联规则挖掘的研究也有不少,其中包括连续属性的周期性关联规则提取,定制周期内时态关联规则提取等等。在这些研究成果的基础上,本文提出的方法能够计算得到时态数据库中离散属性的周期,进而通过执行改造了的Apriori算法挖掘周期性时态关联规则。本文所做的主要工作概括如下:1.在对时态数据库中的有效时间属性进行划分和标记的基础上,提出了时态数据库中离散属性的周期计算方法,并详细描述了算法的执行步骤。2.提出新的时间区间标记方法,通过划分和标记时态数据库的有效时间属性,用标记集合代替时间区间,达到有效时间区间合理离散化的目的。3.提出改进了的Apriori算法,在计算频繁项集的过程中,相匹配的项集根据其所携带的时间区间标记的不同来分别计算支持度,从而得到带时态信息的频繁项集。4.计算得到带时态信息的关联规则,结合离散属性的周期,合理解释关联规则的周期规律。5.分析本文提出的改进了的Apriori算法在性能上有所提升的主要原因。本文通过对时态数据库的有效时间属性进行两次划分和标记,有效的实现了离散属性的周期计算以及时间区间的离散化,为进一步执行Apriori算法奠定了基础。另外,本文提出的改进了的Apriori算法使得计算频繁项集的迭代过程迅速收敛,减少了扫描数据库的次数,提高了算法的执行效率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
时态数据关联规则论文参考文献
[1].刘昆.针对时间序列数据的时态关联规则挖掘研究[D].云南师范大学.2008
[2].梁晓蕾.关于时态数据关联规则挖掘的研究[D].山东大学.2008
[3].乐燕波.时态数据挖掘中关联规则的应用研究[D].厦门大学.2008
[4].朱建平,乐燕波.数据挖掘中加权时态关联规则的构造[J].计算机工程.2008
[5].曾志勇,余建坤,翟勇.一种多维时态关联规则数据挖掘算法[J].云南大学学报(自然科学版).2006
[6].袁海峰.时态数据关联规则挖掘方法研究[D].哈尔滨工程大学.2006
[7].罗来鹏.关于时态数据关联规则挖掘研究[D].西南交通大学.2004
[8].郑琪.有效时间不确定的时态数据的关联规则挖掘研究[D].暨南大学.2003
[9].李少年.一类时态关联规则数据挖掘的研究[D].湘潭大学.2003
[10].孟志青,杨斌.数据仓库的时态关联规则的描述[J].计算机工程与应用.2002
论文知识图





