导读:本文包含了分布式查询调度论文开题报告文献综述、选题提纲参考文献,主要关键词:分布式,空间,分片,区域,数据库,分配,计划。
分布式查询调度论文文献综述写法
吴佩[1](2017)在《分布式数据库查询任务调度方法研究》一文中研究指出互联网技术的高速发展,逐渐改变了大众的消费观念。如今,多样的交易模式使得数据库技术面临着新的挑战。传统的分布式技术已经不能满足爆炸式增长的海量数据的处理需求。在大规模并行处理(MPP)技术的基础上,借助于分布式思想,Greenplum实现了分布式存储与大规模的并行计算。目前,Greenplum成为一种面向海量数据分析与处理的最新技术。针对分布式数据库,如何对查询任务进行有效的调度从而实现查询优化一直都是研究的重点。本文将从查询任务调度的角度来对Greenplum进行优化。Greenplum采用一种集中式调度策略。其中,主节点作为调度器,负责整个查询的并行处理过程。这个调度过程实现了查询任务到子节点上的映射,以及子节点的协调执行工作。随着硬件技术的发展,多核技术为并行计算提供了新的发展方向。将Greenplum运用于解决OLAP场景时,集群环境大都利用多核CPU系统来充分实现并行化。本文对Greenplum的集中式调度方案进行研究,对其中的两个阶段提出了改进策略,从而实现了一种优化的集中式调度方案。为了对Greenplum的调度方案进行优化,本文做了以下研究:(1)首先对任务分配过程进行优化。本文实现了一种更优的查询计划生成方案,来实现查询任务到子节点上的分配。考虑影响执行计划生成的因素,本文分别从搜索空间、代价模型以及搜索策略来设计优化方案。本文首先给出了一种代价估算模型。该模型综合考虑了数据操作的代价与数据传输的代价。基于该代价模型,本文采用并行最大最小蚁群算法对查询连接顺序进行优化,来高效地生成更优的查询计划。(2)然后对任务调度阶段进行优化。对分配给每一个子节点上的任务DAG图,本文给出了一种改进的表调度策略来完成任务到处理器内核的调度。基于子节点上的多核处理器系统,以及常用于解决多核处理器系统的调度问题的表调度算法HEFT和CPOP,本文给出了一种考虑多因素优先级与实时冗余处理的表调度算法MHECP。MHECP算法对任务优先级计算阶段与冗余任务消除阶段进行改进,在没有提高算法复杂度的同时实现了更有效的任务调度。基于以上研究,本文分别从任务分配与任务调度阶段实现了对Greenplum的任务调度方案的优化。结合Greenplum对查询的预处理及前期优化过程,优化后的集中式调度方案能有效地提升查询效率以及系统的性能。最后,本文通过一系列对比实验,证明了Greenplum在处理大数据上的优势,并通过将优化后的调度方案与优化前的调度方案进行对比,证明了本文给出的优化的集中式任务调度方案在一定程度上提升了Greenplum的查询效率,有其实用性。(本文来源于《武汉理工大学》期刊2017-03-01)
何永强,谷春英[2](2014)在《基于子任务区域分片下的分布式空间查询处理与并行调度方法》一文中研究指出分布式空间查询优化是提高分布式空间数据库性能的关键问题之一。本文针对区域分片的数据分布特征,在已有的跨边界连接转化及优化规则基础上,依据片段连接的分配规则将全局查询映射为局部片段连接,提出不同站点上交矩形大面积优先的任务排序策略以及基于子任务的代价模型的分布式并行查询动态任务调整方法。经过实验表明,该方法不仅进一步提高了分布式空间查询的效率,有效解决分布式空间并行查询的负载平衡问题。(本文来源于《科技通报》期刊2014年01期)
陈迪,朱欣焰,周春辉,苏科华[3](2012)在《区域分片下的分布式空间查询处理与并行调度方法》一文中研究指出针对区域分片的数据分布特征,在已有的跨边界连接转化及优化规则的基础上,提出了一种先静态任务分配、后动态任务调整的混合并行调度策略。实验表明,该混合策略有效解决了分布式空间并行查询的负载平衡问题,进一步提高了分布式空间查询的效率。(本文来源于《武汉大学学报(信息科学版)》期刊2012年08期)
刘宇[4](2002)在《分布式综合查询调度技术研究》一文中研究指出查询调度问题是分布式开放环境中进行查询处理的一个关键问题。给定一个用户的查询,假定我们已经知道有n个资源与应答这个查询相关,则我们需要解决的首要问题就是考虑我们应当如何将查询分解为n个子查询,每个子查询对应一个单一的资源。其次是在存在站点之间的连接时如何为n个子查询实现同步。第叁是如何根据用户的原始查询表达式将从n个信息源上返回的结果打包并装配起来。 经过研究和探索,我们实现了一个分布式综合查询调合系统(Distributed Integration Mediation System),我们在这个环境中解决了前面两个问题。本文的主要内容包括: 1.DIMS系统介绍; 2.元数据模式(接口描述语言和接口查询语言); 3.分布式综合查询调度框架; 4.分布式综合查询调度和优化技术研究。(本文来源于《国防科学技术大学》期刊2002-01-01)
分布式查询调度论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
分布式空间查询优化是提高分布式空间数据库性能的关键问题之一。本文针对区域分片的数据分布特征,在已有的跨边界连接转化及优化规则基础上,依据片段连接的分配规则将全局查询映射为局部片段连接,提出不同站点上交矩形大面积优先的任务排序策略以及基于子任务的代价模型的分布式并行查询动态任务调整方法。经过实验表明,该方法不仅进一步提高了分布式空间查询的效率,有效解决分布式空间并行查询的负载平衡问题。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
分布式查询调度论文参考文献
[1].吴佩.分布式数据库查询任务调度方法研究[D].武汉理工大学.2017
[2].何永强,谷春英.基于子任务区域分片下的分布式空间查询处理与并行调度方法[J].科技通报.2014
[3].陈迪,朱欣焰,周春辉,苏科华.区域分片下的分布式空间查询处理与并行调度方法[J].武汉大学学报(信息科学版).2012
[4].刘宇.分布式综合查询调度技术研究[D].国防科学技术大学.2002