近邻搜索论文_王敏

导读:本文包含了近邻搜索论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:近邻,近似,图像,相似性,拓扑,光谱,线性。

近邻搜索论文文献综述

王敏[1](2019)在《基于二值哈希和量化的近似最近邻搜索研究》一文中研究指出近似最近邻搜索是多媒体与计算机视觉领域的基础研究方向,在大规模图像检索、行人再识别等实际问题中获得广泛研究和应用。给定一个查询样本,近似最近邻搜索方法的目标是以次线性甚至常数时间复杂度从大规模数据集中返回查询样本的最近邻。目前主流的近似最近邻搜索技术可以分为叁类,分别是基于树的方法,基于二值哈希的方法和基于量化的方法。由于基于二值哈希的方法和基于量化的方法具有特征距离计算快和内存占用低的优势,近年来获得了更多的研究关注。其中,二值哈希方法将原始高维数据特征投影为低维二值码,而量化方法将原始高维特征投影为码本中最近的码本单词的整数索引。本文基于对二值哈希方法和量化方法的研究,提出了叁种近似最近邻检索框架,应用于图像检索任务。(1)基于线性距离约束的哈希通用框架。二值哈希方法通常需要学习一系列的哈希函数来产生规定长度的二值码。本文提出一种基于线性距离约束的哈希通用框架,同时结合了成对保距约束和单点性约束学习哈希函数。本文设计了一种新颖的成对线性保距目标,保证原始的欧氏距离与汉明距离之间具有线性变换关系,充分体现了二值哈希方法的保距原则。基于不同的单点性约束,本文提出了五种方法去实例化该哈希通用框架。(2)深度有监督量化框架。基于量化的方法目前大多采用无监督的方式进行学习,忽略了数据集中样本包含的语义信息,而且通常将特征学习和码本学习分为两个步骤进行,不能保证码本与特征相匹配,影响了近似最近邻检索的准确度。本文提出了一种深度有监督量化框架以解决该问题。该框架将卷积神经网络和量化网络融合到一个统一的深度架构中,同时学习图像的深度特征和码本。基于不同的码本学习方法,本文提出了叁种深度有监督量化方法去实例化该深度有监督量化框架。(3)基于生成对抗网络的深度无监督量化框架。目前深度哈希方法较少在无监督情境下应用,其主要原因是类别或标签等语义信息的缺失给深度网络的训练带来难度。然而,在很多实际应用中获取标签或类别等信息的代价是昂贵的甚至是不可能实现的。本文提出了一种新颖的深度无监督量化方法,可以同时学习特征表达和量化器。基于生成对抗网络,量化器中每个聚类中心学习生成一张真实感的图像。优化目标是通过同时在图像空间和特征空间进行聚类中心的优化,使得获得的聚类中心能够自动抓取图像分布,获得区分性信息。综上,本文主要研究图像检索中的二值哈希方法和量化方法,并提出了叁种近似最近邻检索框架。在公共数据集上的测试结果表明,所提出框架的实例化方法相对于现有近似最近邻搜索方法获得了较大的检索性能提升。(本文来源于《中国科学技术大学》期刊2019-06-05)

苗建辉,栗志扬,周泽艳,杨传福,刘朝斌[2](2019)在《比特串划分多索引的近邻搜索算法》一文中研究指出哈希表示的比特串是解决海量数据相似性搜索问题最有效的方法之一.针对比特串索引方式导致搜索效果低下的问题,提出一种基于比特串划分多索引的近邻搜索算法.首先由于比特串划分本质是一个组合优化问题,采用贪婪的思想给出该问题的近似解;其次在近邻查询阶段,结合多索引结构提出新的查询扩展和融合机制;最后通过采用一种查询自适应的办法优化多索引之间的不平衡性.在MNIST, CIFAR-10, SIFT-1M和GIST-1M数据集上使用Matlab软件进行实验的结果表明,该算法在基于哈希表示的索引结构以及在近邻搜索方面具有有效性和通用性.(本文来源于《计算机辅助设计与图形学学报》期刊2019年05期)

王昌旭[3](2018)在《基于导向性分散伸展图的高效近似最近邻搜索》一文中研究指出近似最近邻搜索问题是数据库、数据挖掘、人工智能等领域中的一个基本问题。一个具有实际应用价值的近似最近邻搜索算法必须同时具有极高的搜索速度以及合理的内存用量。相比于传统的基于树结构、基于哈希和基于量化的搜索算法,基于图索引的近似最近邻搜索算法因其搜索高且速度快的特点,吸引了来自学术界和工业界的大量关注。虽然许多早期的基于图结构的近似最近邻搜索算法算法在理论上具有十分低的搜索时间复杂度,但这些图结构索引的索引构建算法往往具有极高的时间复杂度,从而使其在目前的大数据时代场景中无法有效应用。因此近年来学界提出了诸多新的图结构索引,以期能够降低索引构建的时间复杂度。虽然这些方法取得了许多革命性的进步,但其仍旧不够高效从而限制了其在更大规模数据集上的应用。本文结合近年来的最新研究成果,对图结构索引进行了更深入的探究,以希望能够更有效地解决上述困难。具体来讲,本文从以下四个方面出发对用于近似最近邻搜索的图结构进行了探究:(1)保证图的连通性;(2)降低图中节点的平均出度已获得更快的遍历速度;(3)降低查询在图上的搜索路径长度;(4)减小基于图结构的索引的大小。基于以上四点,本文在理论上提出了一种全新的图结构——单调相对近邻图(Monotonic Relative Neighborhood Graph,MRNG),这种图结构在理论上具有极低的搜索复杂度(接近对数时间复杂度)。但直接构造MRNG的算法复杂度过高,使其在超大规模数据上不具有实际可行性。为此本文提出了另一种全新的称为“导向性分散伸展图(Navigating Spreading-out Graph,NSG)”的图结构用以近似MRNG,从而实现了一种同时具有高效索引构建与搜索性能的全新近似最近邻搜索算法。本文在SIFT1M、GIST1M等多个百万级数据集上对NSG算法进行了充分的实验验证,并在这些数据集上与现有主流算法进行横向对比试验,从而证明NSG在索引构建速度与搜索速度精度等具有巨大的优越性。最后本文提出了一种可用于工业场景的基于NSG的超大规模快速近似最近邻搜索系统设计方案,并在亿级数据集上对其可行性进行了初步验证。(本文来源于《浙江大学》期刊2018-12-28)

张芳菲,梁玉斌,王佳[4](2018)在《基于近邻搜索的激光点云数据孤立噪点滤波研究》一文中研究指出受仪器自身和测量环境等条件的影响,地面叁维激光扫描仪获取的无序或者散乱点云中通常存在孤立的噪声点。针对孤立噪声点,使用k-d tree组织和管理点云数据,使其有序化;根据孤立噪声点与其k个最近邻点距离的正态统计分布特性,自动计算噪声滤除的阈值并滤除噪声。建筑物激光点滤除噪声的实验表明,文中方法能自动滤除孤立噪声点,滤噪阈值无需人工设置且精度与人机交互滤噪结果基本一致,能有效滤除无序点云的孤立噪声点。(本文来源于《测绘工程》期刊2018年11期)

杨杰[5](2018)在《图像检索中基于近似k-近邻图的近似最近邻搜索算法研究》一文中研究指出最近邻搜索作为一个基础性问题,广泛出现在数据库、机器学习、计算机视觉和信息检索等领域。最近邻搜索问题可以被简单定义为,给定查询向量和n个同维的候选向量,要求返回某种距离度量方式下距离查询向量最近的一个或多个候选向量。在许多现实应用中,精确算法往往需要高昂的时间和空间代价,而近似最近邻搜索则以牺牲一定的准确率为代价,显着地降低了对存储空间和查询时间的要求。近似最近邻搜索因其实用性,受到了广泛关注,许多算法相继被提出,包括基于空间分割、基于哈希、基于向量量化和基于近邻图四类算法。然而目前还没有通用的亚线性时间复杂度的近似最近邻搜索算法。在大数据时代,设计高质、高效的近似最近邻搜索算法具有重要的理论意义和实用价值。基于(近似)k-近邻图(k-NX图)的近似最近邻搜索算法是当前的主流算法,一般包括两个步骤:一是对候选向量离线构造k-NN图,二是基于k-NN图采用某种搜索策略返回查询结果。k-NN图的质量和搜索策略极大地影响了算法的效果和效率。本文对k-NN图的构造,以及爬山搜索(GNNS)算法做了改进。主要结果有:(1)发现爬山搜索算法存在冗余计算、收敛速度慢,提出一种改进的爬山搜索(E-GNNS)算法:即在每一轮迭代中,不只对第一个样本,而是对前k个样本都在k-NN图上进行扩展。实验表明,E-GNNS算法在搜索效率和平均召回率上获得了显着提升。(2)在爬山搜索种子点的选择上,采用基于RVQ编码的倒排索引来生成候选种子点,替代原方法的随机种子点。实验表明,在这一策略的支持下,E-GNNS算法能够在相似的搜索时间下,获得超10%的平均召回率的提升。(3)为克服k-NN图构造时效率低下、内存消耗严重的缺点,提出一个基于2-M树的轻量级的构造方法。实验表明,该方法能够在不牺牲后期搜索效果和效率的前提下,显着降低k-NN图构造的时间和内存消耗。(本文来源于《厦门大学》期刊2018-05-01)

毛婷伟[6](2018)在《融合多视角信息和互补哈希表的海量图像近邻搜索》一文中研究指出人工智能技术的发展与大数据分析技术息息相关,图像数据是大数据中的重要构成部分,因此对图像数据的处理和挖掘变得越来越重要。在图像数据处理和挖掘的众多迫切需求中,近邻搜索是一个基础的、广泛的需求,工业界和学术界的许多问题都需要一个快速、准确的图像近邻搜索算法。本文研究的问题是无标签情况下,海量图像上的快速近邻搜索。近年来,由于哈希在存储和检索效率两方面的优势,利用哈希技术解决快速近邻搜索问题已被广泛认可,已有的基于哈希的近邻搜索技术可分为数据独立的方法和数据依赖的方法两类。数据依赖的方法属于数据驱动的一类方法,它适应的从数据中学习哈希函数,从而能产生更加紧凑的哈希码,因此该类方法已成为解决海量数据近邻搜索问题的主流方法。数据依赖的哈希方法大多依赖样本相似度学习哈希函数。在数据有标签的情况下,样本相似度可以通过标签信息准确获得,但无标签时,该相似度则需要通过样本在特征空间的距离近似得到。对于现实世界中的图像,由于光照、遮挡、形变等因素的影响,从特征空间估计的相似度矩阵会存在偏差,从而影响哈希函数的学习。本文结合多视角学习中的相关理论和技术,提出了一种融合多视角信息和互补哈希表的海量图像近邻搜索方法。本文贡献总结如下:(1)考虑到多视角数据在嵌入空间的一致性,提出了一种近邻融合的多视角融合方式;(2)基于近邻融合的多视角数据融合方式,从多视角数据中提取邻居置信度和相似度排序两种信息,并将其作为指导线索用于哈希表的学习过程;(3)考虑到图像海量的特点,结合互补哈希表在海量数据检索中的优势,提出了一种融合多视角信息和互补哈希表的海量图像近邻搜索算法,提高了无监督情景下,海量图像近邻搜索问题的性能;(4)本文提出的算法在NUS-WIDE,CIFAR-10和MNIST叁个公开数据集上进行了评估,实验结果表明了本文方法的有效性。(本文来源于《华南理工大学》期刊2018-04-20)

史二颖,朱家群,杨长春[7](2018)在《基于最近邻搜索耦合近邻损耗聚类的图像伪造检测算法》一文中研究指出目的为了解决当前图像伪造检测算法在对图像进行伪造检测时,主要依靠全局搜索的方式来完成特征点匹配,导致其检测效率较低,且在对复杂伪造图像进行检测时,易出现检测精度不高和检测错误的不足。方法提出基于最近邻搜索耦合近邻损耗聚类的图像伪造检测算法。首先引入积分图像的方法,对图像进行预处理,借助Hessian矩阵行列式来提取特征点。利用特征点构建圆形区域,通过求取圆形区域内Haar小波响应获取特征点的特征描述符。然后通过特征描述符建立KD树索引,利用最近邻搜索方法代替SURF中全局搜索的方法,对SURF进行改进,完成特征点的匹配。最后,利用特征点间的近邻关系求取近邻函数值,通过近邻函数值对特征点进行聚类,完成图像的伪造检测。结果实验结果显示,与当前图像伪造检测算法相比,所提算法具有更高的检测效率以及更高的检测正确度。结论所提算法具备较高的检测精度,在印刷防伪与信息安全等领域具有较好的应用价值。(本文来源于《包装工程》期刊2018年05期)

张廷,王功明[8](2018)在《基于有序NPsim矩阵的颜色近邻搜索》一文中研究指出基于光谱表示法颜色近邻搜索的核心是高维向量近邻搜索,相似性度量和索引树构建是影响其性能的关键,前者存在等距性问题,后者存在构建困难、查询效率低、不易动态调整等问题,从而严重影响颜色近邻搜索算法的性能。使用NPsim函数计算颜色相似性,结合有序矩阵组织颜色空间数据,提出一种基于有序NPsim矩阵的颜色近邻搜索算法。首先,计算颜色空间中所有颜色之间的NPsim值,构建反映所有颜色相似性关系的NPsim矩阵;然后,按照每种颜色与其他颜色的相似性,对NPsim矩阵的每行元素降序排列,从而得到反映每种颜色与其他颜色相似性大小关系的有序NPsim矩阵;最后,对于颜色空间中任意给定的颜色,根据它在有序NPsim矩阵中的行号,就能够直接找到该颜色的所有近邻。采用蒙赛尔全光泽色系光谱构建有序NPsim矩阵,同时建立KD树和SR树,分别进行K近邻搜索,并从精度和速度两方面比较。在精度方面,本算法得到的颜色近邻与查询颜色距离最近、相似性最好,存在逆序现象的近邻个数最少;在速度方面,构建有序NPsim矩阵的时间比构建KD树和SR树的时间要长,但近邻搜索速度是KD树/SR树的1万倍左右,而且与K值无关;此外,构建有序NPsim矩阵易于并行化,而构建KD树和SR树不易并行化,并行化后构建有序NPsim矩阵的速度会超过构建KD树和SR树的速度。实验结果表明该方法适用于颜色近邻搜索。(本文来源于《光谱学与光谱分析》期刊2018年02期)

杨昕欣,姜精萍[9](2018)在《基于近似最近邻搜索的并行光流计算》一文中研究指出Barnes近似最近邻算法是当前匹配性能优秀的近似块匹配算法,将其应用于稠密光流的计算中,并与OpenCV中实现的两种稠密光流算法进行对比。针对Barnes算法不易并行化的不足,对Barnes算法中的传播过程进行修改,使其易于在GPU上实现并行加速。实验表明,经并行加速后的光流算法比原算法快两倍以上,而在精确度上与原算法接近,并且都优于OpenCV实现的两种稠密光流算法。(本文来源于《计算机工程与应用》期刊2018年18期)

梁周雁,邵为真,孙文潇,马伟丽[10](2018)在《基于PCL的点云数据空间管理及近邻搜索》一文中研究指出由叁维激光扫描技术获取的点云数据仅包含点的叁维坐标,缺乏点对应的几何拓扑信息,同时为了在计算机中更高效的管理和处理点云数据,本文结合PCL开源库为点云数据建立K-D树和八叉树两种数据结构,并实现基于K-D树和八叉树的快速邻域搜索。(本文来源于《北京测绘》期刊2018年01期)

近邻搜索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

哈希表示的比特串是解决海量数据相似性搜索问题最有效的方法之一.针对比特串索引方式导致搜索效果低下的问题,提出一种基于比特串划分多索引的近邻搜索算法.首先由于比特串划分本质是一个组合优化问题,采用贪婪的思想给出该问题的近似解;其次在近邻查询阶段,结合多索引结构提出新的查询扩展和融合机制;最后通过采用一种查询自适应的办法优化多索引之间的不平衡性.在MNIST, CIFAR-10, SIFT-1M和GIST-1M数据集上使用Matlab软件进行实验的结果表明,该算法在基于哈希表示的索引结构以及在近邻搜索方面具有有效性和通用性.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

近邻搜索论文参考文献

[1].王敏.基于二值哈希和量化的近似最近邻搜索研究[D].中国科学技术大学.2019

[2].苗建辉,栗志扬,周泽艳,杨传福,刘朝斌.比特串划分多索引的近邻搜索算法[J].计算机辅助设计与图形学学报.2019

[3].王昌旭.基于导向性分散伸展图的高效近似最近邻搜索[D].浙江大学.2018

[4].张芳菲,梁玉斌,王佳.基于近邻搜索的激光点云数据孤立噪点滤波研究[J].测绘工程.2018

[5].杨杰.图像检索中基于近似k-近邻图的近似最近邻搜索算法研究[D].厦门大学.2018

[6].毛婷伟.融合多视角信息和互补哈希表的海量图像近邻搜索[D].华南理工大学.2018

[7].史二颖,朱家群,杨长春.基于最近邻搜索耦合近邻损耗聚类的图像伪造检测算法[J].包装工程.2018

[8].张廷,王功明.基于有序NPsim矩阵的颜色近邻搜索[J].光谱学与光谱分析.2018

[9].杨昕欣,姜精萍.基于近似最近邻搜索的并行光流计算[J].计算机工程与应用.2018

[10].梁周雁,邵为真,孙文潇,马伟丽.基于PCL的点云数据空间管理及近邻搜索[J].北京测绘.2018

论文知识图

对应点和投影点距离产生的误差法向距离插值法计算投影点基于最近邻搜索策略的主要流程...图像近邻搜索应用场景实例(a)图片最近邻搜索示意图;(...最近邻搜索算子示意图

标签:;  ;  ;  ;  ;  ;  ;  

近邻搜索论文_王敏
下载Doc文档

猜你喜欢