导读:本文包含了分布式检索论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:分布式,数据库,索引,数据,语料库,卷积,信息检索。
分布式检索论文文献综述
崔天鑫[1](2019)在《基于SOAP的分布式检索系统的部署结构设计》一文中研究指出针对分布式检索的典型需求,作者设计并实现了一种基于SOAP的分布式检索系统。给出了对等型结构下的分布式部署结构设计,进一步实现了一种基于数据交换区的部署结构设计,极大提高了分布式条件下的检索效率。(本文来源于《科技创新与应用》期刊2019年31期)
戴厚乐,杨庚,闵兆娥[2](2019)在《分布式环境下多关键词并行密文检索方案》一文中研究指出对于可搜索加密需要均衡数据的安全性和检索效率。针对SSE-1密文检索方案中检索性能低、单关键词检索模式不足和传统单服务器架构中的单机资源局限性等问题,设计并实现了一种多关键词并行密文检索系统。该系统采用不同的索引加密方式提高密文检索性能;通过对密文倒排索引的切分实现倒排索引的分块检索,克服了单机资源的局限性并提高了检索效率;通过结合分布式特点扩展了传统单机检索架构并实现了多关键词的并行检索。实验结果表明,与SSE-1方案相比,在保证密文数据安全性的前提下所提方案能够提高检索、更新等操作的效率,实现多关键词的检索,同时动态扩展系统分布式架构以提高系统负载能力。(本文来源于《计算机应用》期刊2019年10期)
卿建飞,杨雅萍,李德平,杜佳[3](2019)在《基于分布式ElasticSearch的海量遥感影像检索方法研究》一文中研究指出针对遥感影像爆发式增长带来的检索问题,本文采取Geo JSON格式对遥感影像元数据进行映射,运用ElasticSearch对元数据进行存储并进行分布式的索引和检索,在大数据量下,按照不同的查询方式与传统的对象关系型数据库PostgreSQL进行比较,实验结果表明,该方法能有效提高检索的效率。(本文来源于《测绘与空间地理信息》期刊2019年06期)
程跃豪[4](2019)在《分布式平台下自适应的快速图像检索》一文中研究指出随着移动互联网的兴起、新兴媒体的普及,各种拍照、摄像设备的爆炸式增长,人们将各种图像分享到社交媒体上,在线图像的数量巨幅增长。如何在这些数量庞大、内容丰富的图像数据中检索出相似图像,一直是图像领域研究的热点问题。图像的特征选择和检索的效率是图像检索研究者们关心的重点问题。选取合适的图像特征对图像检索的性能很重要。卷积神经网络(Convolutional Neural Networks,CNN)由更复杂的网络构成,与传统特征提取方法相比具有更强大的特征表达能力。同时,分布式计算平台Hadoop具有良好的稳定性、安全性、扩展性等特点,可以加速图像检索的效率。使用卷积神经网络提取的隐藏层输出,作为图像深度特征进行图像检索,并且借助于Hadoop的强大计算能力进行图像检索任务,加速图像检索。本文的主要工作内容有:(1)使用预训练的AlexNet网络模型,提取图像的深度特征。使用单层深度特征、多层网络层特征合并的方式进行图像检索任务。之后与基于传统手工特征的图像检索方法进行对比,最终选择FC6层特征进行图像特征索引的构建。(2)为了解决检索任务中深度特征维度过高,给图像检索带来的检索时间长、检索任务计算量大的难题,本文提出一种自适应的索引构建方法。使用深度特征构建索引并保存在HBase中,该方法可以提高图像检索的效率。(3)在分布式平台Hadoop上实现图像检索任务。根据图像特征构建特征索引,通过特征索引完成图像检索任务。实验表明使用Hadoop平台在大型数据集上进行图像检索任务可以有效提升图像检索效率。本文实验在四个公开的数据集Holiday数据集、UKbench数据集、Oxford Building数据集、MIRFlickr1M数据集上进行相关实验,包括提取图像特征、构建索引、图像检索。实验表明,通过建立图像特征索引和使用分布式平台Hadoop,图像检索任务的效率和准确率有所提升。(本文来源于《北京交通大学》期刊2019-06-01)
施晓峰[5](2019)在《基于分布式NoSQL数据库的档案大数据存储与检索方案研究》一文中研究指出随着数字档案资源体系建设的不断加快,档案数据的种类日趋丰富,数量迅猛增长,呈现出大数据的特征。传统关系型数据库与集中式存储在档案大数据处理方面存在着适应性、可靠性和扩展性不足的问题。针对当前遇到的问题,通过分析传统档案数据存储模式的局限性,将分布式NoSQL数据库、分布式文件系统、分布式搜索引擎应用于档案大数据的管理。设计一套基于分布式NoSQL数据库的档案大数据存储与检索方案,并开发原型系统进行验证。(本文来源于《计算机应用与软件》期刊2019年05期)
齐长义[6](2019)在《浅析网络通讯分布式数据库信息检索技术》一文中研究指出在科技、网络技术迅速发展过程中,计算机技术在多个行业得到了广泛应用。本文主要研究了网络通讯分布式数据库信息检索技术。在建立网络通讯分布式数据库结构后,使用位置算符、限制算符检索网络通讯分布式数据库中的信息。(本文来源于《数字技术与应用》期刊2019年04期)
吴天锋[7](2019)在《分布式信息检索的资源库选择与结果融合的学习算法研究》一文中研究指出信息检索技术为人们日常信息搜索以及信息筛选提供了便利的服务,随着网络信息量的不断增加,人们常常希望能快速搜索到多样化的、更相关的检索结果。分布式信息检索技术可以把查询转发给相关的分布式资源库,并整合多样化的检索结果返回给用户,以满足用户的多方面检索需求。分布式信息检索通常分为协作式的环境与非协作式的环境,在协作式的环境中,检索代理能获取资源库的内部所有的信息。而在非协作式的环境中,检索代理通常通过查询采样的方式获得资源库的信息。在分布式信息检索中,影响资源库选择以及结果融合的因素往往众多,结合多因素进行学习,能有效的拟合多方面特征,提高资源库选择以及结果融合的效果。本文首先提出基于排序学习的资源库选择算法LTR_RS,通过分析影响资源库选择的因素,提取了资源库的词项匹配、中央采样索引库、主题相关性叁个方面的特征,在LTR_RS算法中通过训练LambdaMART的排序学习模型,对资源库排序列表指标NDCG值进行优化,来提高资源库选择效果。在搜狗数据集SogouQCL上的实验结果表明,LTR_RS算法的效果与对比方法相比,在NDCG值以及准确率上均有很大的提升。针对资源库选择中有标签的训练数据获取成本高以及非协作式环境中多因素特征提取不充分的场景下,本文提出基于变分自编码器的资源库选择算法VAE_RS。VAE_RS中使用无监督学习的变分自编码器对资源库中的文档进行建模,利用文档的隐变量表示来得到资源库的向量表示,通过计算查询与资源库的向量的相似度,来得到资源库的得分。通过在TREC Fedweb数据集上的实验证明了该算法的有效性。在结果融合部分,本文提出结合文档、结果列表、资源库、垂直领域等多因素来进行结果融合学习的算法框架。通过分析影响结果融合的因素,算法框架中提取多因素特征,并采用LambaMart模型对多因素特征进行拟合,优化最终结果列表的NDCG值。在Fedweb数据集上的实验结果表明,有效利用多因素特征的结果融合学习算法相比其他模型的效果要好,并且优于目前在该数据集上表现最优的DeepMerge算法。(本文来源于《华南理工大学》期刊2019-04-15)
姚立群,邓攀,任海,白亮,邱源[8](2019)在《星载多源数据的分布式存储与快速检索系统设计》一文中研究指出基于国产嵌入式操作系统和PowerPC处理器研究并设计了一种面向星载的多源数据分布式存储与快速数据检索管理系统,满足航天器平台对数据灵活存储、检索的设计需求。该系统基于新型Nosql数据库研发星载数据的高效存储管理技术,并结合Sqlite技术设计了基于分布式的星载综合数据查询模块,实现以分布式方式高效管理多源星载数据,便于综合数据管理中心实时快速查询和传输需要的数据,为构建高性能、低功耗的星载分布式数据管理系统提供关键技术支撑。(本文来源于《单片机与嵌入式系统应用》期刊2019年04期)
鲁松[9](2019)在《网络新闻语料库建设及其分布式检索系统研究》一文中研究指出网络新闻语料库是以语料库语言学等相关理论为基础,并使用网络爬虫等技术手段,随机的收集互联网上的真实的新闻文本而建立的具有一定规模的语料库。网络新闻作为互联网上一种十分常见的文本形式,我们可以利用网络新闻发掘互联网上网络语言使用的习惯,以及新闻的热点趋势及变化等有价值信息。综上,我们可以从网络新闻语料库发掘许多之前因理论技术所限没有注意到的语言在实际使用中的规律和模式,使用语料库可以进行许多自然语言相关的科学研究。因此,网络新闻语料库的研究价值巨大。另外,随着计算机应用技术的不断发展,加之个人计算机性能的不断提升,充分利用互联网资源建设适合自己需要的语料库也成为可能。基于以上,本课题利用网络爬虫技术爬取了最近五年约200万篇八个类别的网络新闻来完成了一个网络新闻语料库的建设。同时设计并实现了一个基于Elasticsearch的分布式检索系统。分布式检索系统基于B/S架构,遵循MVC的软件设计规范,检索效果优良。本文主要的工作如下:一、介绍了网络新闻语料库建设中最重要的技术——网络爬虫的技术原理,以及网络爬虫中涉及到的其他技术原理。二、介绍了全文检索技术的理论基础。包括全文检索的技术原理,分词算法,倒排索引的原理及其在全文检索中的重要意义,学习tf-idf权重计算来测量词项对于一篇新闻文档的重要程度,以及如何使用向量空间模型来用线性代数中向量的相关理论来解决计算文本相似性的问题等等。叁、设计并完成了网络新闻语料库的建设,设计并实现了基于Elasticsearch的分布式检索系统。最后,通过上述工作,我们完成了一个具有足够的代表性的,高质量的,具有一定规模的网络新闻语料库的建设工作,实现了一个检索响应快,可用性高的分布式检索系统。(本文来源于《华中师范大学》期刊2019-04-01)
朱立秀[10](2018)在《分布式大数据下多条件快速检索的设计与实现》一文中研究指出本文分析了分布式大数据多条件检索的需求,并提出对应的方案设计与实现。(本文来源于《科学技术创新》期刊2018年28期)
分布式检索论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
对于可搜索加密需要均衡数据的安全性和检索效率。针对SSE-1密文检索方案中检索性能低、单关键词检索模式不足和传统单服务器架构中的单机资源局限性等问题,设计并实现了一种多关键词并行密文检索系统。该系统采用不同的索引加密方式提高密文检索性能;通过对密文倒排索引的切分实现倒排索引的分块检索,克服了单机资源的局限性并提高了检索效率;通过结合分布式特点扩展了传统单机检索架构并实现了多关键词的并行检索。实验结果表明,与SSE-1方案相比,在保证密文数据安全性的前提下所提方案能够提高检索、更新等操作的效率,实现多关键词的检索,同时动态扩展系统分布式架构以提高系统负载能力。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
分布式检索论文参考文献
[1].崔天鑫.基于SOAP的分布式检索系统的部署结构设计[J].科技创新与应用.2019
[2].戴厚乐,杨庚,闵兆娥.分布式环境下多关键词并行密文检索方案[J].计算机应用.2019
[3].卿建飞,杨雅萍,李德平,杜佳.基于分布式ElasticSearch的海量遥感影像检索方法研究[J].测绘与空间地理信息.2019
[4].程跃豪.分布式平台下自适应的快速图像检索[D].北京交通大学.2019
[5].施晓峰.基于分布式NoSQL数据库的档案大数据存储与检索方案研究[J].计算机应用与软件.2019
[6].齐长义.浅析网络通讯分布式数据库信息检索技术[J].数字技术与应用.2019
[7].吴天锋.分布式信息检索的资源库选择与结果融合的学习算法研究[D].华南理工大学.2019
[8].姚立群,邓攀,任海,白亮,邱源.星载多源数据的分布式存储与快速检索系统设计[J].单片机与嵌入式系统应用.2019
[9].鲁松.网络新闻语料库建设及其分布式检索系统研究[D].华中师范大学.2019
[10].朱立秀.分布式大数据下多条件快速检索的设计与实现[J].科学技术创新.2018