表索引算法论文-杨传福

表索引算法论文-杨传福

导读:本文包含了表索引算法论文开题报告文献综述及选题提纲参考文献,主要关键词:大规模数据,高维数据,近似最近邻搜索,多哈希表索引

表索引算法论文文献综述

杨传福[1](2017)在《海量高维数据的多哈希表索引算法的研究》一文中研究指出近年来,随着互特网技术的快速发展,多媒体数据诸如文本、图像、视频等数据已呈现爆炸性增长的趋势。如何在海量的多媒体数据中搜索到目标数据是计算机科学研究领域的一个热点问题。由于在实际应用中,多媒体数据一般通过其特征数据表示,而这些特征表示往往是高维向量数据。此时传统的基于空间划分树、聚类划分树等索引技术的检索方案,并不能很好地应对这类海量高维数据,且面临着效率低下的问题。针对海量高维数据的近邻查询,一种主流的解决思路是把数据映射为二进制码,其主要原因是二进制码具备存储代价低、汉明距离计算快等特性。主流的研究工作包括局部敏感哈希、乘积量化、ITQ、K均值哈希等。不过,二进制表示本身也有一些问题:首先,如何使得二进制码表示能够保持原始数据之间的空间近邻结构;其次,如何利用尽量少的二进制码位数来保持尽量高的检索性能;再次,当数据的规模太大直接进行汉明距离匹配效率过低时,如何利用二进制码作为索引,给出海量高维数据的高效索引及查询方案等。针对海量高维数据的二进制表示如何索引问题,本文提出了一种新的索引结构及近邻查找算法,即基于多哈希表的索引及查询算法。首先,我们通过度量不同哈希位之间的独立性,选择最优的哈希位分组方案。由于哈希位之间的组合数是几何数量级的,我们提出了近似求解的方法来构建多个哈希表。其次,对于原始数据集中的数据点,进行离线索引的构建。再次,对于给定查询点,我们在多个哈希表中分别搜索查询点近邻,并提出了近邻查询扩展和优化方法。最后,我们结合当前主流的大数据计算框架Spark,讨论了算法的并行实现。为了评价多哈希表索引及查询算法的性能,我们在多个数据集包括公开数据集和合成数据集上,进行了大量的数值实验,并且和一些主流的哈希及索引算法进行了对比分析。数值实验说明,相比于其它算法,论文提出的算法在检索的准确率、召回率、MAP值方面具备一定的优势。(本文来源于《大连海事大学》期刊2017-12-01)

丛犁,李晓记[2](2014)在《基于OFDM信号分布的指数查询表索引算法》一文中研究指出针对传统查表查询表项更新频率不一致的问题,提出一种新型基于OFDM(Orthogonal Frequency Division Multiplexing)信号幅度统计特性的指数查询表索引算法,通过在查询表索引算法中引入OFDM信号幅度的分布特性,使查表法的表项更新频率最终趋于一致,达到提升系统的非线性失真矫正精度的目的,同时不明显增加复杂度。仿真结果表明,在查询表大小相同的条件下,新型查询表索引算法比传统算法提升了系统的性能,降低了饱和性失真的影响;同时,由于将索引目标由信号幅度改为信号功率,使其硬件实现更为简单高效。(本文来源于《吉林大学学报(信息科学版)》期刊2014年06期)

表索引算法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对传统查表查询表项更新频率不一致的问题,提出一种新型基于OFDM(Orthogonal Frequency Division Multiplexing)信号幅度统计特性的指数查询表索引算法,通过在查询表索引算法中引入OFDM信号幅度的分布特性,使查表法的表项更新频率最终趋于一致,达到提升系统的非线性失真矫正精度的目的,同时不明显增加复杂度。仿真结果表明,在查询表大小相同的条件下,新型查询表索引算法比传统算法提升了系统的性能,降低了饱和性失真的影响;同时,由于将索引目标由信号幅度改为信号功率,使其硬件实现更为简单高效。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

表索引算法论文参考文献

[1].杨传福.海量高维数据的多哈希表索引算法的研究[D].大连海事大学.2017

[2].丛犁,李晓记.基于OFDM信号分布的指数查询表索引算法[J].吉林大学学报(信息科学版).2014

标签:;  ;  ;  ;  

表索引算法论文-杨传福
下载Doc文档

猜你喜欢