查询子空间论文开题报告文献综述

查询子空间论文开题报告文献综述

导读:本文包含了查询子空间论文开题报告文献综述、选题提纲参考文献,主要关键词:空间,算法,边界线,立方体,多子,数据流,下限。

查询子空间论文文献综述写法

韩苏东[1](2019)在《子空间下基于用户遗憾率的代表点查询技术研究》一文中研究指出大数据时代下,从海量数据集中选取用户感兴趣的精简结果集返回给用户是当代数据库系统进行多决策准则的重要功能之一。k-遗憾方法将最大遗憾率作为衡量标准,输出遗憾率最小的k个点作为整个数据库的代表点。但是现有k-遗憾方法以Skyline集合作为算法的候选集,算法耗时较多,并且不能很好地适应维度的变化。因此论文致力于寻找比Skyline集合更小的候选集从而提高k-遗憾查询算法的效率。论文的主要工作和创新点如下:(1)研究了基于Skyline频率的候选集确定方法。首先,论文基于Skyline频率首次提出“频繁Skyline点”的概念,并将其作为k-遗憾查询的候选集。其次,为了计算频繁Skyline点,论文提出基于精确计数的SF_(SKYCUBE)算法。但是由于SF_(SKYCUBE)算法时间复杂度较高,因此论文结合蒙特卡洛方法提出了一种对子空间Skyline频率采样的近似计算方法SF_(APPROX)。此外,论文还提出预排序和设置阈值等手段对算法进行优化。最后,论文在不同数据集下对算法和候选集进行实验,验证了论文提出的算法和候选集的有效性和高效性。(2)研究了基于Skyline优先级的候选集确定方法。首先,论文首次提出Skyline优先级和“优先Skyline点”的概念,并且将优先Skyline点作为k-遗憾查询的候选集。其次,为了计算优先Skyline点,论文提出基于共享结果策略和共享排序策略的自底向上计算方法SP_(BUS),并且利用过滤算法进行优化。此外,论文还提出自顶向下的计算方法SP_(TDS),它利用共享祖先策略和共享分治策略合并重复计算,使总的计算的效率达到最高。最后,论文通过实验对比了论文提出的所有算法效率和候选集性能。实验表明,论文提出的两种候选集均能够极大地减少k-遗憾查询算法的运行时间,提高k-遗憾查询的效率。(本文来源于《南京航空航天大学》期刊2019-03-01)

王潇逸[2](2017)在《多子空间Skyline查询处理技术研究》一文中研究指出信息技术的快速发展使人们需要处理的数据量以及数据维度日益增大,如何快速分析庞杂的数据,并从中获取人们更感兴趣的信息成为一种迫切需求。Skyline查询作为一种有效的数据分析手段,在数据库领域有着越来越重要的研究地位。现有的Skyline查询处理方法主要有全空间Skyline查询和子空间Skyline查询,面对海量高维的数据,全空间Skyline查询具有结果集过大以及效率过低等劣势,因此子空间Skyline查询具有更重要的研究意义。本文在对现有Skyline查询技术充分分析的基础上,结合现实生活中的应用场景,针对多子空间Skyline查询处理技术展开研究,主要贡献概括如下:(1)针对现有方法不能有效解决任意多个子空间Skyline查询的不足,提出了一种多子空间Skyline查询算法。算法中基于Skycube概念提出了子空间立方体群结构,在此基础上,算法通过子空间候选集,充分利用了群结构中各子空间Skyline结果集之间的共享关系。此外,算法采用求和过滤以及最大值过滤等方法,进一步提高了效率。通过实验验证了算法的有效性,并表明算法能够高效的解决多子空间Skyline查询问题。(2)在解决多子空间Skyline查询的基础上,进一步针对实际应用中用户或用户组查询组合结果的需求,提出了多偏好最优组合查询问题。基于多子空间Skyline查询算法,提出了解决多偏好最优组合查询问题的有效算法。该算法允许查询者对目标组合的每个成员都提出自己的偏好定义,最终返回符合要求的最优组合结果。算法采用组成员候选集裁剪的方式对中间结果进行裁剪,保证了结果集大小可控;此外,针对现有方法渐进性差的问题,在算法中加入了动态输出机制,查询者可在得到满意的组合结果后随时终止查询,保证了算法的渐进性。(3)为将上述两种查询应用于数据库管理系统,针对SQL查询语言进行扩展,使其有效支持多子空间Skyline查询和多偏好最优组合查询的语义。首先对SQL查询语言进行语法扩展设计,之后在课题组自主研发的数据库管理系统上进行实现,增加Skyline查询处理模块,完成了一套支持上述两种查询的数据库原型系统。(本文来源于《南京航空航天大学》期刊2017-03-01)

王潇逸,秦小麟,王宁,史文浩[3](2016)在《高效多子空间Skyline查询处理算法》一文中研究指出随着Skyline查询应用的增多,子空间Skyline查询成为热点。针对实际应用中用户从多角度审视某一数据集的需求,充分研究了多子空间Skyline查询问题。在分析现有子空间Skyline查询算法解决该问题不足的基础上,提出了子空间立方体群(subspace skycube group,SSG)结构,并给出了基于该结构的同时计算任意多个子空间Skyline查询的MSSC(multiple subspace skycube)算法。该算法采用子空间候选集(subspace candidate sets,SCS),并充分利用了子空间立方体群结构中各子空间Skyline结果间的共享关系;在此基础上,算法采用求和过滤以及最大值过滤等方法,对数据集进行剪枝和过滤,从而进一步提高算法效率。最后,分别用人造数据和真实数据对算法进行实验,并与现有算法进行比较,结果表明MSSC算法可以高效地解决多子空间Skyline查询问题。(本文来源于《计算机科学与探索》期刊2016年05期)

李秋生,吴亚东,林茂松,王松,王海洋[4](2015)在《有效的子空间支配查询算法——Ranking-k》一文中研究指出针对Top-k dominating查询算法需要较高的时空消耗来构建属性组合索引,并且在相同属性值较多情况下的查询结果准确率低等问题,提出一种通过B+-trees和概率分布模型相结合的子空间支配查询算法——Ranking-k算法。首先,采用B+-trees为待查找数据各属性构建有序列表;然后,采取轮询调度算法读取skyline准则涉及到的有序列表,生成候选元组并获得k组终结元组;其次,根据生成的候选元组和终结元组,采用概率分布模型计算终结元组支配分数。迭代上述过程优化查询结果,直到满足条件为止。实验结果表明:Ranking-k与基本扫描算法(BSA)相比,查询效率提高了94.43%;与差分算法(DA)相比,查询效率提高了7.63%;与早剪枝Top-k支配(TDEP)算法、BSA和DA相比,查询结果更接近理论值。(本文来源于《计算机应用》期刊2015年01期)

孟熠,刘玉葆,李启睿[5](2013)在《一种基于压缩策略的高维空间子空间skyline查询算法》一文中研究指出skyline操作就是找出数据集中不被其他数据点支配的点的集合,但是随着数据属性维度的不断增多,通常人们只对数据集的某几个属性感兴趣,高维空间子空间skyline计算就是发现数据集中在某几个特定维度上不被其他点支配的点的集合,skyline计算在数据量大时其时间花销是非常大的,快速的返回结果才是人们能接受的.基于此提出了一个RSky算法,在原有CSky算法的基础上,指出并改进了其存在的3处明显不足,并根据InvertS索引的特性提出了一个压缩扫描策略,通过设置每个维度的下限来控制要处理的桶,除去不必要处理的桶和不可能是skyline的点,从而减少了点与点之间的比较次数.实验结果表明了RSky算法的有效性.(本文来源于《计算机研究与发展》期刊2013年S1期)

杨艳艳,赵雷,杨季文[6](2013)在《基于网格索引的数据流子空间概率轮廓查询》一文中研究指出在数据流子空间上的连续概率轮廓查询(CPSQS)基础上,提出一种基于网格索引结构的概率轮廓查询算法。采用适合于子空间轮廓计算的网格索引结构,将数据空间划分成若干个格,利用格间的支配关系,减少对象之间的比较次数。同时挖掘全空间与子空间上格的概率上下界关系,设计有效的剪枝策略提高CPSQS算法的性能。理论分析和实验结果表明,该算法能满足实际应用中用户的个性化查询要求,降低查询响应时间。(本文来源于《计算机工程》期刊2013年02期)

谢志军,金光,何贤芒,钱江波,唐建华[7](2012)在《无线传感器网络中基于子空间划分的Skyline查询处理研究》一文中研究指出提出了一种无线传感器网络中基于子空间划分的分布式Skyline查询算法(subspace dividingbascddistributed skyline query algorithm,SDKSA),算法提出了一种基于子空间划分的感知数据存储方法,设立子空间划分策略、数据存储和映射策略,研究了查询执行过程和负载均衡策略.理论分析和实验结果都表明,该算法能够大大减少网络的平均通信量,对网络的规模扩展、节点密度变化以及维度变化并不敏感,具有更好的执行性能.(本文来源于《第29届中国数据库学术会议论文集(B辑)(NDBC2012)》期刊2012-10-12)

张彬,蒋涛,乐光学,李国徽[8](2010)在《高效的子空间可逆skyline查询算法》一文中研究指出提出了一种高效的子空间可逆skyline查询算法RSQS.该算法采用基于分区的B+树对可逆Skyline进行计算,不同于传统的R-tree修剪方法;RSQS利用提出的几种修剪策略,包括相互修剪、预计算、尽早终止搜索等,采用过滤-精炼框架实现,能快速地修剪搜索空间,避免了大部分的I/O操作.实验结果表明:RSQS算法具有极高的修剪能力和很高的效率:在二维子空间中每个对象平均仅需与约1.2个其他对象比较.(本文来源于《华中科技大学学报(自然科学版)》期刊2010年06期)

黄震华,王智慧,郭建魁,汪卫,施伯乐[9](2009)在《有效预处理P2P网络中的子空间skyline查询》一文中研究指出多维空间的skyline查询处理是近年来数据库领域的一个研究重点和热点.Vlachou等人首次考虑如何在P2P网络中有效进行子空间上的skyline查询,并提出"扩展skyline集合"的概念来减少预处理时的网络传输量.然而实验评估表明,扩展skyline集合只能有限地减少子空间skyline查询预处理的数据传输量.基于此,提出一种缩减预处理时数据传输量的有效方法TPAOSS(three-phase algorithm for optimizing skyline scalar).TPAOSS算法根据全空间skyline集合与子空间skyline集合间的语义关系分3个阶段来传输必要的数据,其中第1阶段发送全空间skyline对象;第2阶段接收种子skyline对象;而第3阶段基于Bloomfilter技术发送种子skyline对象在子空间上的重复对象.为了降低第2阶段的数据传输量,给出两种接收种子skyline对象的有效策略.理论分析和实验评估结果表明,所给出的算法具有有效性和实用性.(本文来源于《软件学报》期刊2009年07期)

黄震华[10](2008)在《子空间SKYLINE查询若干关键问题的研究》一文中研究指出Skyline查询技术是近年来数据库邻域的一个研究重点和热点,这主要是因为该查询技术广泛应用于多标准决策系统、城市导航系统、数据挖掘和可视化、智能防御系统、以及地理信息系统等领域。现有的相关工作主要集中于研究全空间上的skyline查询,即它们假定用户所提交的是单个查询,并且查询所涉及的维度包含对象的所有属性。然而,在实际应用中,由于对象具有较大规模的全空间,而用户通常只对部分子空间上的skyline对象集合感兴趣;同时,不同的用户可能关注不同的子空间,因此,现有的算法和数据结构无法满足子空间skyline查询在有效性和可扩展性上的需求。基于此,本文着重研究子空间skyline查询技术中的效率问题,主要包括如下3个关键方面:(1)有效解析用户提交的子空间skyline查询现有的研究工作不考虑传统关系操作(如选择、卡氏积和连接等)存在于子空间skyline查询的情况,而且没有考虑系统中同时存在多个不同子空间skyline查询的情况。因此,本文的一个重要工作是从提高查询性能出发,在逻辑层面上,考虑如何优化它们之间的执行顺序来缩减子空间skyline查询的时间开销。我们将子空间skyline查询计算作为一个特殊的关系操作符(称之为子空间skyline操作符),研究它与传统关系操作符间执行顺序变换的等价规则,以及达到这种等价变换所需要的附加条件。从而,基于这些等价变换规则和附加条件,通过改变子空间skyline操作符与传统关系操作符之间的执行顺序来有效提高查询的效率。另一方面,我们提供充分的理论证明来表明这些等价变换规则的正确性;同时,给出执行顺序变换前后的时间开销的理论值来表明这些等价变换规则的有效性。最后,我们实施了大量的实验,实验结果表明,变换之后的时间开销显着低于变换之前的时间开销。(2)有效实施用户提交的子空间skyline查询由于传统关系操作的实施算法现已较成熟,而现有关于在物理层面上实施子空间skyline计算的相关工作比较有限,而且它们的计算效率通常较低。因此,本文的第二个重要工作是考虑如何有效实施子空间skyline计算。我们从减少对象间的比较次数出发,基于正规格结构,给出一种有效进行任意单个子空间上skyline计算的有效方法CDCA。CDCA算法通过单元格之间的叁种支配关系来缩减对象间的比较次数,从而有效降低子空间skyline计算的时间开销。另一方面,为了有效降低多个并发的子空间skyline查询的总时间开销,我们给出子空间树序列的概念。基于子空间树序列,我们有效确定各子空间skyline查询的执行顺序,并提出一种优化其执行性能的高效算法APMSSQ。APMSSQ算法利用如下两个方面来优化多个子空间skyline查询的总响应时间:①各子空间skyline对象集合之间的关系;以及②树路径上的各节点间的共享重复值查找策略。理论分析和实验结果表明,我们的方法显着优于现有的相关方法。(3)在分布式网络环境中,高效处理多个子空间上的skyline查询由于分布式网络是现有多数企业和单位使用的网络模式,而早期的C/S架构的网络能够方便地升级到超级节点架构(Super Peer Architecture:SPA)的分布式网络,因此,本文的第叁个重要工作是研究在SPA架构的分布式网络中,如何高效进行多个不同子空间上的skyline查询。与以往研究簇划分和路由策略的相关工作不同,我们主要研究子空间skyline查询本身,而假定分布式网络的簇划分和路由策略已经确定。由于网络传输代价以及子空间skyline计算的时间开销决定了在SPA架构的分布式网络中,返回子空间skyline查询结果集的效率。因此,我们主要从优化这两方面代价入手给出有效的解决方法。本文所给出的解决方法能够通过控制单个网络节点对之间的冗余数据传输以及采用对象编码机制来有效降低网络节点间的数据传输量;并使用本文给出的多子空间skyline查询优化算法APMSSQ(见本文的第二个重要工作)来有效进行子空间skyline计算。理论分析和实验结果表明,我们的方法显着优于现有的相关方法。(本文来源于《复旦大学》期刊2008-03-10)

查询子空间论文开题报告范文

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

信息技术的快速发展使人们需要处理的数据量以及数据维度日益增大,如何快速分析庞杂的数据,并从中获取人们更感兴趣的信息成为一种迫切需求。Skyline查询作为一种有效的数据分析手段,在数据库领域有着越来越重要的研究地位。现有的Skyline查询处理方法主要有全空间Skyline查询和子空间Skyline查询,面对海量高维的数据,全空间Skyline查询具有结果集过大以及效率过低等劣势,因此子空间Skyline查询具有更重要的研究意义。本文在对现有Skyline查询技术充分分析的基础上,结合现实生活中的应用场景,针对多子空间Skyline查询处理技术展开研究,主要贡献概括如下:(1)针对现有方法不能有效解决任意多个子空间Skyline查询的不足,提出了一种多子空间Skyline查询算法。算法中基于Skycube概念提出了子空间立方体群结构,在此基础上,算法通过子空间候选集,充分利用了群结构中各子空间Skyline结果集之间的共享关系。此外,算法采用求和过滤以及最大值过滤等方法,进一步提高了效率。通过实验验证了算法的有效性,并表明算法能够高效的解决多子空间Skyline查询问题。(2)在解决多子空间Skyline查询的基础上,进一步针对实际应用中用户或用户组查询组合结果的需求,提出了多偏好最优组合查询问题。基于多子空间Skyline查询算法,提出了解决多偏好最优组合查询问题的有效算法。该算法允许查询者对目标组合的每个成员都提出自己的偏好定义,最终返回符合要求的最优组合结果。算法采用组成员候选集裁剪的方式对中间结果进行裁剪,保证了结果集大小可控;此外,针对现有方法渐进性差的问题,在算法中加入了动态输出机制,查询者可在得到满意的组合结果后随时终止查询,保证了算法的渐进性。(3)为将上述两种查询应用于数据库管理系统,针对SQL查询语言进行扩展,使其有效支持多子空间Skyline查询和多偏好最优组合查询的语义。首先对SQL查询语言进行语法扩展设计,之后在课题组自主研发的数据库管理系统上进行实现,增加Skyline查询处理模块,完成了一套支持上述两种查询的数据库原型系统。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

查询子空间论文参考文献

[1].韩苏东.子空间下基于用户遗憾率的代表点查询技术研究[D].南京航空航天大学.2019

[2].王潇逸.多子空间Skyline查询处理技术研究[D].南京航空航天大学.2017

[3].王潇逸,秦小麟,王宁,史文浩.高效多子空间Skyline查询处理算法[J].计算机科学与探索.2016

[4].李秋生,吴亚东,林茂松,王松,王海洋.有效的子空间支配查询算法——Ranking-k[J].计算机应用.2015

[5].孟熠,刘玉葆,李启睿.一种基于压缩策略的高维空间子空间skyline查询算法[J].计算机研究与发展.2013

[6].杨艳艳,赵雷,杨季文.基于网格索引的数据流子空间概率轮廓查询[J].计算机工程.2013

[7].谢志军,金光,何贤芒,钱江波,唐建华.无线传感器网络中基于子空间划分的Skyline查询处理研究[C].第29届中国数据库学术会议论文集(B辑)(NDBC2012).2012

[8].张彬,蒋涛,乐光学,李国徽.高效的子空间可逆skyline查询算法[J].华中科技大学学报(自然科学版).2010

[9].黄震华,王智慧,郭建魁,汪卫,施伯乐.有效预处理P2P网络中的子空间skyline查询[J].软件学报.2009

[10].黄震华.子空间SKYLINE查询若干关键问题的研究[D].复旦大学.2008

标签:;  ;  ;  ;  ;  ;  ;  

查询子空间论文开题报告文献综述
下载Doc文档

猜你喜欢