导读:本文包含了数据仓库的演化论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:数据仓库,视图,数据挖掘,过程,数据,论文。
数据仓库的演化论文文献综述
陈佳[1](2010)在《数据仓库中基于演化计算的实视图查询优化》一文中研究指出数据仓库是一个面向主题的、集成的、不可更新的且随时间不断变化的数据集合,主要用于有效地支持决策支持查询。随着数据仓库的规模不断增加,这种涉及大量数据的复杂决策查询是非常耗时的。数据处理的低效意味着资源的浪费,因此,较高的数据查询效率对数据仓库来说是很重要的,是数据仓库系统设计的一大系统目标。为了提高查询性能,一种有效的方法就是使用辅助数据回答查询。在现代数据仓库系统中,一种常用的辅助数据就是实视图:将用户常用的查询或最可能的查询模式计算出来的结果或者中间结果的物理存储。有了实视图,基本上不再需要对原始数据进行处理,而只需要在实视图的基础上进行一些简单的计算便可以完成复杂的查询。在使用实视图提高查询效率的时候,必须解决两个重要的问题:实视图选择和实视图最优重写。本文就这两个问题进行分析研究并提出了详细的解决方案。实视图选择:实视图选择就是针对一个查询集,在给定的某些资源约束下选择一个视图集进行实化,使得该查询集的查询响应时间最小。首先,全面分析了数据仓库系统中实视图选择的特点、难点以及传统实视图选择方法的弊端之后,系统地介绍了分布估计算法的特性、方法,并采用分布估计算法从“宏观”层面上对群体建立数学模型来解决实视图选择问题;同时,提出两种混合遗传算法GEDA和BMUTGA,在后代的产生过程中同时利用全局统计信息以及局部信息来克服GA和EDAs的缺点,从而更有效地解决复杂的实视图选择问题。通过实验来验证所引入的UMDA以及所提出的GEDA和BMUTGA算法的求解质量和求解效率。测试数据及来自TPC-D的基准测试数据以及多种模拟数据集。实验结果表明,在不同的空间约束,不同的查询分布和视图大小分布下,本文所引入和提出的算法优于经典遗传算法。实视图最优重写:实视图最优重写问题就是对于给定的一个用户查询Q和实视图集V,找到Q的一个最优(等价)重写R。首先,与传统的查询优化进行了对比,全面分析了数据仓库中实视图最优查询重写的特点、难点以及传统的使用实视图最优查询重写方法的弊端之后,系统地介绍了启发式方法和遗传程序设计的特性,并分析了用启发式方法和遗传程序设计有效地解决利用实视图最优查询重写问题的可能性。其次,提出了两种新颖的基于实视图最优查询重写的算法BSHS以及SRGP来解决这个问题,主要贡献如下:(1)这两种算法基于包-集语义,这种语义被广泛的应用于当今的关系型数据库。在这个语义下,基本关系并不包含重复元组,而查询结果可能包含重复元组;(2)本文的算法不仅能处理合取(选择-连接-投影)查询还可以处理聚集(SUM/COUNT)查询;(3)所提出的算法不仅可以使用多个实视图重写还可以使用单个实视图重写,从而保证所产生的重写的近似最优性。通过模拟数据集,从求解质量和运行时间两个方面对算法进行了比较,验证了本文提出的启发式方法BSHS以及基于规则的遗传程序设计SRGP的有效性。(本文来源于《武汉大学》期刊2010-10-01)
杨文川,黄涛,顾淑清[2](2002)在《数据仓库中演化信息现象的研究》一文中研究指出在对基于统计数据仓库的海量历史数据进行数据挖掘和知识发现过程中,产生出一大类带有时态特征的演化信息,可以归结定义为演化过程,通过对万峰统计数据仓库中进行数据挖掘和知识发现过程中的演化现象的介绍,定义了演化过程的数学模型,并对统计数据挖掘中演化过程模型的建立提出了相关规则。(本文来源于《第六届全国计算机应用联合学术会议论文集》期刊2002-10-01)
乔琳,许晖,于玉,周水庚[3](2000)在《复杂企业决策支持环境下的数据仓库体系结构的演化》一文中研究指出在基于复杂的企业决策支持系统环境下,讨论决策支持系统数据仓库体系结构的演化,并由此进一步讨论对动态集成问题的解决方案。文章还讨论了分布式知识管理体系结构和数据采掘的关系,对决策支持系统数据仓库体系结构中的各个阶段进行了简要评估。(本文来源于《计算机工程与应用》期刊2000年07期)
数据仓库的演化论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在对基于统计数据仓库的海量历史数据进行数据挖掘和知识发现过程中,产生出一大类带有时态特征的演化信息,可以归结定义为演化过程,通过对万峰统计数据仓库中进行数据挖掘和知识发现过程中的演化现象的介绍,定义了演化过程的数学模型,并对统计数据挖掘中演化过程模型的建立提出了相关规则。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据仓库的演化论文参考文献
[1].陈佳.数据仓库中基于演化计算的实视图查询优化[D].武汉大学.2010
[2].杨文川,黄涛,顾淑清.数据仓库中演化信息现象的研究[C].第六届全国计算机应用联合学术会议论文集.2002
[3].乔琳,许晖,于玉,周水庚.复杂企业决策支持环境下的数据仓库体系结构的演化[J].计算机工程与应用.2000