导读:本文包含了多维索引论文开题报告文献综述及选题提纲参考文献,主要关键词:HBase,多维索引,空间填充曲线,覆盖网络
多维索引论文文献综述
谭玉龙[1](2019)在《基于HBase的多维索引查询机制的优化研究》一文中研究指出移动设备的广泛使用和用户位置信息的实时可用性正在促进新的个性化、基于位置的应用程序和服务(LBSs)的开发。此类应用程序需要能够实现多属性查询、实时查询、大数据分析及支持数百万用户的可伸缩性。新一代的分布式数据库从大量数据中提取值,同时具有高可用性、容错性和可伸缩性,因此提供了非常需要的基础设施来支持LBSs。但是,它不能有效地处理多维数据上的复杂查询,因为它们不提供访问多个属性的方法。因而,为实现多维查询以及提高实时查询效率,本文对基于HBase的多维索引机制以及优化策略进行了研究,主要工作如下:(1)提出了New-grid方案,一个基于HBase的统一的索引和数据分发框架,它利用键值存储来支持多维查询。首先,对P-grid进行了改进,在覆盖网络中组织了一组节点,使其能够提供有效的数据分布、容错和多维数据的查询处理。其次,为了建立索引,使用了基于Hilbert空间填充曲线的线性化技术,该技术保留了数据的局部性,有效地管理键值存储中的多维数据。最后,优化了动态处理范围查询和k近邻查询的算法,这消除了单独索引表的维护开销。该方法完全独立于底层存储层,可以在任何云基础设施上实现。(2)提出了基于HBase的自动配置参数调优方案,HBase有许多影响系统性能的配置参数,这些参数之间以复杂的方式相互影响,使得手动调整它们以获得最佳性能变得极其困难。底层配置参数优化的关键问题是建立以配置参数为输入的低成本的精确性能模型。通过分析和研究,新方案中使用随机森林算法来构建性能模型,并结合遗传算法及性能模型为HBase应用系统搜索最优配置参数从而提高HBase的性能。(3)搭建了Hadoop实验平台,通过实验验证了所提出的多维查询方案和参数调优方案的有效性和效率。实验结果表明,New-grid方案可以有效提高基于Hbase的多维数据查询效率,参数调优方案可以提高HBase的性能。(本文来源于《郑州大学》期刊2019-04-01)
张艺,张重阳[2](2019)在《基于HBase的海量冠字号码多维索引研究》一文中研究指出传统的关系型数据库在处理海量冠字号码数据时面临巨大挑战,系统扩展成本高,难度大。为此,论文采用HBase技术来解决海量冠字号码的存储与查询问题。HBase是云计算平台中一种典型的分布式数据库,对处理海量数据有着很大的优势。由于HBase是基于键值对形式的非关系型数据库,只提供了键值这一种索引方式,所以在实际应用中很难满足多维查询的需求。为了解决这一问题,论文提出了一种基于时间序列与空间曲线结合的索引方式。经理论分析与实验结果证明,该方法能有效支持高吞吐量和多维查询,具有更好的效率。(本文来源于《计算机与数字工程》期刊2019年01期)
李军良,张杨,王睿,高欣,李晓蕾[3](2018)在《电动汽车充电网络云平台下一种基于Chord-R的多租户多维索引方法》一文中研究指出面向不同运营商多租户数据的高效索引方法是构建电动汽车充电网络云平台的关键技术之一。现有多租户数据索引方法在面对海量多维信息索引时存在效率低的问题。在此背景下,提出了一种基于共享存储模式的Chord-R双层索引方法,上层采用对等结构中的Chord协议作为全局索引,使单个租户的数据聚集并有序地分布在尽量少且相邻的节点上,保证数据具有良好的隔离性和扩展性;下层引入空间索引方法 R树进行本地数据的局部索引,最终实现了多租户数据多维信息的高效索引。实验结果表明,在进行多维信息索引时,与典型多租户索引方法(multi-tenant indexing mechanism based on improved Chord mapping approach,M IM C)相比,查询时间至少可以节省48%。(本文来源于《电力建设》期刊2018年10期)
邓丹苹,秦小麟,李博涵,郑伟,刘亮[4](2019)在《一种基于改进网格多维TTI索引的动态Top-k查询算法》一文中研究指出Top-k查询是目前海量数据在动态环境中高效处理的重要方法之一.在许多实际应用中,满足用户偏好的top-k查询一般由两个部分组成:选择条件和排序函数.用户可自行设置排序函数,也可选择对不同数据子集进行查询.在传统数据库领域中已经对top-k算法进行了深入的研究,但是现有的方法不适用于大量目标对象的属性值发生动态变化的情况.在查询过程中由于目标对象的属性值发生改变可能导致查询结果的改变,从而对算法性能有更高的要求.围绕动态top-k计算问题,在网格索引的基础上提出了TTI索引,通过TTI索引中的概要信息高效计算网格k支配能力并划分影响区和自由区.根据划分的区域裁剪数据集并降低数据动态变化时需重新计算发生的概率.实验中采用多种数据集进行测试,分别与top-k、RankCube和CIA算法进行了比较.实验结果验证了算法的有效性,实验数据表明在静态情况下,该文算法的查询效率可比传统top-k算法最多快至8倍,动态情况下可比传统top-k算法最多快10倍.(本文来源于《计算机学报》期刊2019年08期)
胡玉涵[5](2018)在《面向气象领域的多维数据索引结构的研究与实现》一文中研究指出随着数据量的急剧增长,满足许多领域数据处理实时性和准确性的要求也变得越来越难,而数据查询是数据处理的基础,如何提高查询效率显得至关重要。以气象数据为主要研究对象,随着气象服务的发展,用户的查询需求增加,而气象数据具有大规模、多维度的特点,采用分布式的云存储方式,大多数云存储系统是基于键值对(Key-Value)来存储数据的,这种方式主要支持主键Key的高效查询,而无法支持非Key的高效查询,多维的复杂查询仍然需要对整个数据集进行扫描,查询效率低下。因此,在Key-Value的存储模式下,利用多维数据索引提高查询效率成为当前学术界和工业界的重点研究内容之一。本文针对气象领域典型的数据特征,为解决Key-Value存储模式下的多维数据查询问题,提出了一种高效的MOTree多维索引结构。MOTree的索引结构与传统索引不同,它是有序的平衡树,支持稳定的动态更新和多种查询操作(包括布尔查询、点查询、范围查询),它利用前缀规则来进行索引的构建和查询,提高了索引的空间利用率,减少了索引的多维查询时间。同时,本文设计并实现了MOTree的构建、查询和更新算法,构建算法是基础,主要包括直接插入路径、合并已有路径、去除冗余路径叁个步骤。本文还定义了多维气象数据查询语言,主要用于用户查询请求的预处理和分段解析,基于MOTree设计并实现了多维气象数据查询引擎,该引擎可以支持多个气象数据维度的在线索引构建和多种气象数据的高效查询。本文用多维气象数据集和随机数据集分别将MOTree与已有索引结构在数据维度、节点数量、查询时间等多个方面进行了对比实验,理论分析与实验结果表明,MOTree支持高效的点查询和范围查询,且索引构建和更新时间开销更小。该索引结构能够为多维气象数据提供高效的查询,满足更多用户的查询需求,对推动气象领域的发展具有重要意义。(本文来源于《湖南大学》期刊2018-05-16)
王茹娟[6](2018)在《基于云数据管理的多维索引》一文中研究指出近年来,云计算平台作为数据管理的一个新趋势,越来越受到人们的重视。然而,目前的云平台只支持简单的基于关键字的查询,由于缺乏有效的索引技术,无法有效地应对复杂查询。提出了一种有效的云计算多维索引构建方法,使用R树和树的组合组织数据记录并提供快速的查询处理。(本文来源于《电脑编程技巧与维护》期刊2018年01期)
房华蓉[7](2018)在《多维数据近似检索的分层LSH索引算法模型研究》一文中研究指出该文鉴于数据管理技术发展的前瞻性考虑,以多维数据为处理对象,探索高性能数据过滤器的若干理论和实现技术,针对假阳性和假阴性过高的问题,以及对时空效率的要求,设计了适合多维数据近似检索的分层LSH索引算法模型。(本文来源于《电脑知识与技术》期刊2018年02期)
段玲琳[8](2017)在《多维转类一维特征波控码表索引的设计方法》一文中研究指出相控阵天线在电子对抗装备中频繁应用,针对其中波束调度过程中多维波控码表存储器空间使用效率低,利用多维特征检索存储表过程繁琐的问题,文章提出了一种将多维特征索引存储表在存储地址上简化成类一维特征索引存储表的方法。将多维特征进行离散化处理和地址拼接,并将拼接后的地址作为类一维索引。应用该方法后存储地址连续且规律性强,检索过程明显简化,大大提高了装备波束调度的速度。(本文来源于《合肥工业大学学报(自然科学版)》期刊2017年11期)
李剑锋,陈世平,钮亮,段林茂,王忠智[9](2017)在《一种支持复杂查询的多维云数据管理索引机制》一文中研究指出针对当前分布式云数据管理系统的数据索引不支持复杂查询的问题,提出一种支持复杂查询的多维云数据索引机制PR-Chord.PR-Chord由基于PR四叉树的全局索引PR-Index和覆盖网络路由协议Chord组成.将由多维数据的值域所形成的多维空间根据PR四叉树的剖分规则平均划分为若干个超矩形,利用改进的PR四叉树技术建立树形索引PR-Index,分层索引这些超矩形空间.多维数据的复杂查询转化为对PR-Index叶节点的查询.设计了数据查询、插入和删除算法,以支持多维查询和区间查询.PR-Index索引本身不存储多维数据,因此维护代价为零.PR-Chord具有负载均衡、算法简单的优点.实验证明PRChord具有良好的查询效率.(本文来源于《小型微型计算机系统》期刊2017年09期)
周双[10](2017)在《基于多维索引的大规模图可达性查询方法研究》一文中研究指出大规模图的可达性查询是指在给定的图中判断从初始结点到目标结点间是否有路径相连。可达性查询是图的基本操作之一,它吸引了许多学术上和工业上的研究者来研究这个问题。目前,图可达性查询主要的技术难题是如何在大规模图中快速地构建大小合理的索引的同时能高效准确地回答结点对的可达性。而随着现实生活中图的规模越来越大,图越来越复杂,可达性查询问题仍具有极大的挑战性。基于多维索引的大规模图可达性查询算法是一种新的图可达性查询算法。它通过递归地遍历图来把图划分成若干个互不相交的不共享子图和连接这些子图的跨子图边。这些不共享子图与原始图相比更简单,它们具有类树结构,因此在不共享子图中利用间隔域来回答结点对的可达性将比在整个图中更有效。接着,为了定位图中结点的位置,该算法为每个结点构建了一个四维索引——结点所处的层次值、结点所处的不共享子图标记值、结点的初始间隔域值、结点的目标间隔域值。其中,结点所处的层次值和结点所处的不共享子图标记值可以定位结点所在的不共享子图的拓扑顺序;结点的初始间隔域值和结点的目标间隔域值可以定位结点在不共享子图内的位置,同时间隔域也可以用来回答位于同一不共享子图的结点对的可达性。随后,为了进一步提高查询效率,该算法建立了两个额外的索引——向上等级索引和向下等级索引——来排除一部分不可达的结点对。最后,利用前面构建的索引设计了一个高效的查询算法来快速回答结点对的可达性。通过与现有的可达性查询算法在28个不同的图上的效果相比,基于多维索引的大规模图可达性查询算法可以快速的构建大小合理的图索引,并且能高效准确地回答结点对的可达性,同时它还具有更好的可扩展性。(本文来源于《华中科技大学》期刊2017-05-01)
多维索引论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
传统的关系型数据库在处理海量冠字号码数据时面临巨大挑战,系统扩展成本高,难度大。为此,论文采用HBase技术来解决海量冠字号码的存储与查询问题。HBase是云计算平台中一种典型的分布式数据库,对处理海量数据有着很大的优势。由于HBase是基于键值对形式的非关系型数据库,只提供了键值这一种索引方式,所以在实际应用中很难满足多维查询的需求。为了解决这一问题,论文提出了一种基于时间序列与空间曲线结合的索引方式。经理论分析与实验结果证明,该方法能有效支持高吞吐量和多维查询,具有更好的效率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
多维索引论文参考文献
[1].谭玉龙.基于HBase的多维索引查询机制的优化研究[D].郑州大学.2019
[2].张艺,张重阳.基于HBase的海量冠字号码多维索引研究[J].计算机与数字工程.2019
[3].李军良,张杨,王睿,高欣,李晓蕾.电动汽车充电网络云平台下一种基于Chord-R的多租户多维索引方法[J].电力建设.2018
[4].邓丹苹,秦小麟,李博涵,郑伟,刘亮.一种基于改进网格多维TTI索引的动态Top-k查询算法[J].计算机学报.2019
[5].胡玉涵.面向气象领域的多维数据索引结构的研究与实现[D].湖南大学.2018
[6].王茹娟.基于云数据管理的多维索引[J].电脑编程技巧与维护.2018
[7].房华蓉.多维数据近似检索的分层LSH索引算法模型研究[J].电脑知识与技术.2018
[8].段玲琳.多维转类一维特征波控码表索引的设计方法[J].合肥工业大学学报(自然科学版).2017
[9].李剑锋,陈世平,钮亮,段林茂,王忠智.一种支持复杂查询的多维云数据管理索引机制[J].小型微型计算机系统.2017
[10].周双.基于多维索引的大规模图可达性查询方法研究[D].华中科技大学.2017