导读:本文包含了时态索引论文开题报告文献综述及选题提纲参考文献,主要关键词:时态数据,时态索引,Spark,分布式
时态索引论文文献综述
郑晓东,王梅,陈德华,张碧莹[1](2018)在《一种基于Spark的分布式时态索引方法》一文中研究指出基于Spark分布式计算平台提出一种分布式时态索引方法。该方法提出时态数据集的分段索引构造策略,对每一分段设计基于Spark的时态索引构建方法及基于Spark RDD的并行查询策略;根据时态查询所涉及的Spark RDD分区模式的不同,将其分为分区独立查询,跨区查询以及跨段查询,并分别针对不同模式的时态查询提出优化的辅助索引结构,提高查询效率;在基准数据上进行实验,验证了所提索引策略的实用性和高效性,同时表明所提方法对数据规模的有效自扩展性以及降低了集群硬件配置需求。(本文来源于《计算机应用与软件》期刊2018年05期)
周亮,李格非,邰伟鹏,郑啸[2](2017)在《基于Spark的时态查询扩展与时态索引优化研究》一文中研究指出时空数据库和基于集群计算的时间分析工具大多基于外存,将其应用在大数据处理场景下系统性能将迅速降低。为此,基于Spark构建一个易用且高可扩展的时态大数据查询分析系统。通过扩展Spark SQL解析器,使其能够支持类SQL形式的时态操作,运用SIMBA开源项目的方法,引入全局过滤和局部时态索引2种优化策略,使得系统能以高吞吐量及低延迟执行时态查询操作。基于时态查询效率的评估实验结果表明,在不同影响参数下,该系统的时态查询性能优于原生的Spark SQL查询处理方案。(本文来源于《计算机工程》期刊2017年07期)
周翔宇,程春玲,杨雁莹[3](2016)在《基于分布式内存数据库的移动对象全时态索引》一文中研究指出针对现有移动索引仅对内存/磁盘两层结构进行优化,忽略了索引节点在内存中的缓存敏感性,提出一种基于分布式内存数据库的全时态索引结构DFTB~x树。该索引结构针对存储器Cache、内存和磁盘3层结构进行优化,根据Cache行、指令数量和TLB失配数等多个条件设计内存索引节点的大小。同时,根据磁盘数据页的大小设计历史数据迁移链节点的大小,使得Cache和内存能够一次读取索引节点和迁移链节点数据,避免多次读取数据带来的延迟。此外,构建历史数据迁移链,实现历史数据持久化,从而支持移动对象全时态索引。实验结果表明:与Bx树、Bdual树、TPR*树和STRIPES算法相比,DFTBx树具有较高的查询和更新效率。(本文来源于《计算机科学》期刊2016年07期)
肖蒙[4](2016)在《数据库中一种分段混合时态索引的研究与实现》一文中研究指出时至今日,大数据时代已然来临。大数据及其中包含的大量信息,已成为了各行各业极为重要的决策资料。时间作为客观事物发展变化的基本描述,几乎所有信息都显式或隐式地具备时态特征。大数据的产生往往也是经过时间累积形成的,天然的具备时态属性。因此,对时态数据的有效支持已成为目前各行业应用的迫切要求。然而,传统基于快照的数据库技术仅能反映对象在某个时刻的状态,对时态信息的存储、处理十分有限。如何在海量数据库中对时态数据进行有效管理以支持快速、高效地检索到用户所需要的时态信息已经成为研究的热点。时态索引是时态数据库中加速查询的重要手段之一。然而,现有的时态索引技术主要针对时态属性创建索引结构,难以有效地支持用户的多样性查询。此外,由于时态数据库中数据的持续更新,使得目前的索引技术在保障查询执行高效性的同时,难以兼顾索引创建和维护的高效性。为此,本文针对时态数据库特性,就如何创建有效的索引结构,满足用户多样性的查询要求进行了研究。首先,论文阐述了信息时代时态数据管理的重要意义,并且对时态数据库的发展历程和国内外时态索引技术的现状进行了分析,总结了这些索引技术的特征和不足之处。其次,论文对数据库中索引技术进行了详细地介绍,其中包括B+树索引,以及SAP HANA中的Timeline索引,介绍了其查询、插入和删除等操作的实现,对其索引创建和维护的效率及满足多样性查询的局限性进行了分析。此外,介绍了分区索引加速并行的可行技术。再次,本文深入研究了数据库中满足多样性查询需求的时态索引技术,提出了一种面向时态数据的分段混合索引——SHB+树(Segmentation Hybrid B+-Tree,SHB+-Tree)索引。该技术首先将时态数据表按时间进行分段,在每个分段上建立局部的时间和对象的混合索引结构,时间和对象索引部分共享局部分段中的时态数据。进而,将用户查询分为四类,分别为时间版本查询、对象查询、复杂查询和跨时间段查询,本文详细介绍了基于SHB+树的四类查询实现方法。由于SHB+树索引结构有效的集中了对象索引和时态索引的优势,因此可高效的支持上述多种类型的查询执行。此外,对于每个局部分段混合索引,本文设计了自底向上的索引创建方式,结合分段索引策略,提高索引创建和维护的效率。最后,本文具体实现了上述的各项关键技术,并以基准数据集进行实验。通过对这些测试结果进行对比分析,验证了本文所描述内容的正确性及有效性。在处理时态数据时,该索引技术能够在满足用户多样性查询要求的同时,提高查询性能。(本文来源于《东华大学》期刊2016-01-01)
廖青云,周畅,朱峰华[5](2013)在《二级线序划分时态索引STLOP的研究与实现》一文中研究指出随着数据库技术的发展,对时态数据进行处理的重要性不断提高。在时间期间间的序关系的基础上,提出了一种基于线序划分的二级索引STLOPIndex。通过该二级索引STLOPIndex能加快其一级索引TLOPIndex的查询速度,然后再通过一级索引TLOPIndex实现"一次一集合"的数据查询。(本文来源于《软件导刊》期刊2013年07期)
叶小平,周畅,廖青云,朱峰华[6](2013)在《DTindex:分布式时态索引技术》一文中研究指出研究了基于线序划分(LOP)分布式时态索引技术DTindex.通过建立DTindex所需数据结构和算法,讨论分布式时态数据索引DTindex;针对时间数据LOP结构提出基于查询期望的数据分布算,依据DTindex两层索引架构提出P2P部署以减少系统的通信开销;通过仿真实验表明了索引可行性和有效性.(本文来源于《华南师范大学学报(自然科学版)》期刊2013年03期)
顾星,朱占宇,杨群,皮德常[7](2012)在《一种构建于DSM的移动对象的全时态索引方法》一文中研究指出移动对象索引技术是移动对象数据库这个新兴的热点领域中的关键技术之一.针对该技术处理数据的繁琐复杂特性,提出构建于DSM的移动对象索引方法 DSM_MSMON,在分布式系统中并行的管理移动对象的信息,支持更新和查询操作.DSM_MSMON统一了单机和多机的内存管理策略,解决了DSM系统中的数据定位、一致性维护、负载平衡和可扩充性等主要问题,有效地提高了移动对象索引的效率.文中给出DSM_MSMON的设计思想和模型,并分析了DSM_MSMON的关键技术和程序流程.实验结果表明,该方法要优于MSMON结构.(本文来源于《小型微型计算机系统》期刊2012年07期)
郭欢,汤庸,叶小平[8](2011)在《基于结构摘要的时态索引技术》一文中研究指出目前B+树仍是在商业数据库中应用最广泛的基本索引结构,为在现有数据库平台上对时态数据进行有效操作,有必要研究基于B+树的时态索引技术.研究了一种以B+树为基本存储结构、基于结构摘要的时态索引方法CMap-tree.首先,引入基于内存的结构摘要,通过存储结点必要的结构摘要信息,有效地降低了时态操作过程中对无效结点的访问;其次,提出了时态矩阵的概念,并以时态矩阵为参考详细分析了各时态关系对应的结果集;然后,在结构摘要的基础上,详细讨论了CMap-tree的时态插入、查询和更新算法.最后,通过仿真实验,对CMap-tree的空间利用率、查询效率和更新效率等基本性能与现有时态索引方法进行了比较和分析.实验结果表明,CMap-tree具有明显优势.(本文来源于《计算机研究与发展》期刊2011年11期)
李贞海[9](2011)在《交通网络中移动对象全时态索引研究与实现》一文中研究指出随着移动计算、无线通信技术及GPS等技术的迅速发展,基于位置服务越来越受到重视,因此移动对象位置查询变得可行和必需。在交通网络中,移动对象将更新的位置信息提交给移动对象数据库,移动对象数据库对移动对象位置的信息进行存储和有效管理。为实现对移动对象高效的查询,移动对象索引技术应运而生,它能够有效地对移动对象的数据进行组织与管理,并提供准确的位置查询等,在移动数据库的研究中具有重要的研究价值和商业潜力。在介绍时空数据库技术和移动对象索引的基础上,着重分析了交通网络中移动对象的索引技术。首先对交通网络中的路网进行相应的建模,将现实中的道路抽象为二维空间图的形式;分析了常用的移动对象时空模型,通过对现有移动对象索引技术的分析与路网受限的移动对象应用需求的研究,提出了交通网络中移动对象过去、现在和未来的位置改进索引结构FNR*-Tree。FNR*-Tree由2DR-Tree、1DR-Tree和HASH表叁层结构组成,其中2DR-Tree对路网空间进行索引,将整个索引空间划分成多级子索引空间,叶结点根据空间划分包含道路的路段,并分别对应一棵1DR-Tree,同时2DR-Tree将属于同一条道路的路段通过指针连接,实现基于道路的查询。1DR-Tree按照时间属性对经过某一路段的所有移动对象进行管理,随着移动对象不断离开路段,1DR-Tree中不断地插入移动对象运动信息。HASH结构由HASH表和单链表构成,其中HASH表中存储了移动对象的标识,每个对象指向一个动态链表,链表中存放着按照更新时间顺序存储的移动对象的运动等信息。在分析了交通网络中移动对象运动的规律基础上,结合FNR*-Tree索引结构,提出了郊区与市区中移动对象轨迹预测模型;该模型能够回答处于两次更新时刻之间或者最后一次更新之后的查询请求,实现了对移动对象全时态的索引。针对交通网络中的移动对象索引结构,分析了常用的更新策略,为降低更新代价,提出了适合FNR*-Tree索引结构的自底部向中间动态更新策略。操作中以结点存取次数为性能参考,对FNR*-Tree索引结构和FNR-Tree索引方法进行了性能比较。结果表明,交通网络中移动对象全时态索引结构在动态更新、窗口查询、点查询、特别是轨迹查询方面性能有提高,对移动对象轨迹的预测具有较高的精度。(本文来源于《西南大学》期刊2011-04-18)
叶小平,汤庸,郭欢,陈罗武,朱君[10](2009)在《时态索引技术研究及其应用》一文中研究指出研究有效时间期间集合上数学关系以及时态索引构造与应用.建立时间期间集合上时态连通等价关系和时态包含拟序关系.在引入数学关系框架内,通过对时间期间特征进行精细分析,讨论了大时态连通等价类分割和时态包含拟序关系集重迭等问题,建立了由根结点、等价类分割集结点和拟序关系集线序分枝结点构成的时态索引树形模型TDIM.在TDIM架构下,基于时态数据库中数据实体动态管理基本特征,研究了具时态变量情况下时态索引动态实现机制和查询技术,同时讨论了时态更新(时态插入、时态删除和时态修改)的增量式算法.由于建立在一般时间集合之上,TDIM可以应用于时态关系和XML的数据管理.(本文来源于《中国科学(F辑:信息科学)》期刊2009年12期)
时态索引论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
时空数据库和基于集群计算的时间分析工具大多基于外存,将其应用在大数据处理场景下系统性能将迅速降低。为此,基于Spark构建一个易用且高可扩展的时态大数据查询分析系统。通过扩展Spark SQL解析器,使其能够支持类SQL形式的时态操作,运用SIMBA开源项目的方法,引入全局过滤和局部时态索引2种优化策略,使得系统能以高吞吐量及低延迟执行时态查询操作。基于时态查询效率的评估实验结果表明,在不同影响参数下,该系统的时态查询性能优于原生的Spark SQL查询处理方案。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
时态索引论文参考文献
[1].郑晓东,王梅,陈德华,张碧莹.一种基于Spark的分布式时态索引方法[J].计算机应用与软件.2018
[2].周亮,李格非,邰伟鹏,郑啸.基于Spark的时态查询扩展与时态索引优化研究[J].计算机工程.2017
[3].周翔宇,程春玲,杨雁莹.基于分布式内存数据库的移动对象全时态索引[J].计算机科学.2016
[4].肖蒙.数据库中一种分段混合时态索引的研究与实现[D].东华大学.2016
[5].廖青云,周畅,朱峰华.二级线序划分时态索引STLOP的研究与实现[J].软件导刊.2013
[6].叶小平,周畅,廖青云,朱峰华.DTindex:分布式时态索引技术[J].华南师范大学学报(自然科学版).2013
[7].顾星,朱占宇,杨群,皮德常.一种构建于DSM的移动对象的全时态索引方法[J].小型微型计算机系统.2012
[8].郭欢,汤庸,叶小平.基于结构摘要的时态索引技术[J].计算机研究与发展.2011
[9].李贞海.交通网络中移动对象全时态索引研究与实现[D].西南大学.2011
[10].叶小平,汤庸,郭欢,陈罗武,朱君.时态索引技术研究及其应用[J].中国科学(F辑:信息科学).2009