导读:本文包含了关键字检索论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:关键字,分词,密度,模糊,数据,权重,概率。
关键字检索论文文献综述
覃遵跃,汤庸,徐洪智,黄云[1](2019)在《基于关键字密度的XML关键字检索》一文中研究指出关键字检索具有友好的用户操作体验,该检索方式已在文本信息检索领域得到了广泛而深入的应用.对XML数据采用关键字检索是目前研究的热点.基于查询语义的XML关键字检索方法存在返回大量与用户查询意图无关的查询片段或者丢失符合用户查询意图的片段这两个问题.针对这些问题,在考虑LCA横向和纵向两个维度的基础上,提出了用户查询意图与LCA相关性的两个规则,根据两个规则定义了LCA的边密度和路径密度,建立了综合的LCA节点评分公式,最后设计TopLCA-K算法对LCA进行排名,并利用中心位置索引CI提高了TopLCA-K算法的效率.实验结果显示,利用所提出的方法返回的查询节点更加符合用户需求.(本文来源于《软件学报》期刊2019年04期)
杜阳阳[2](2018)在《基于图结构的多关键字检索研究》一文中研究指出信息技术的发展极大地改变了人们获取资源的方式。其中,图上关键字查询技术引起了越来越多的关注。基于图结构的多关键字检索是在数据图上找到能够所有包含查询关键字的子图。很多文献都是返回子树的形式,如最小代价生成树。最近有研究也提出查找子图的算法,启发性算法就是其中的一种,但是它的查找过程是基于边的权重,而没有优先考虑节点和关键字之间的相似度,所以现有的算法并不能表现出两个节点之间最好的连接关系。同时,现有的方法在top-k结果的排序上也有一定的局限性,在计算边的权重时只是单纯的考虑两端节点的权重求平均,没有考虑每个查询关键字的影响,造成排序结果不理想。本文提出了一种新的图上多关键字检索方法,采用新的方式计算节点权重,并基于节点内容设计出一种搜索子图的算法,首先得到每个关键字对应的节点集合,然后根据节点的内容相关度依次选择节点加入结果集,最后计算结果边集的过程中考虑了hub节点的影响,克服了直接计算两两节点之间最短路径的弊端。最终试图返回结构关系更为紧密和无冗余的结果。本文同时提出一种新的计算方式来对每个结果子图进行打分排序,充分考虑了每个关键字对节点内容相关度的贡献,从而返回最优的top-k个结果。实验表明,本文提出的方法能较快且准确的为用户返回更符合用户查询意图的结果。(本文来源于《南京邮电大学》期刊2018-11-14)
接鹏飞[3](2018)在《汇文OPAC二次开发之关键字检索功能的实现——以盐城市图书馆为例》一文中研究指出从考虑读者检索需求和提升读者使用体验的角度,对汇文OPAC的检索功能进行拓展,增加检索关键字智能提示功能。(本文来源于《图书馆学刊》期刊2018年04期)
常雪琴[4](2018)在《一种改进的云环境下排序的密文模糊关键字检索方案》一文中研究指出针对当前流行的云服务器环境,提出基于隐私保护的PFKS算法;在传统的DFSC算法和OPM密文检索算法基础之上,增加多关键字检索、模糊检索以及排序检索,且改进索引结构.研究结果表明该算法在云服务器环境下的安全性上,在算法的精度上,特别是一对多保序映射算法的正确性上,具有较大的提升.(本文来源于《徐州工程学院学报(自然科学版)》期刊2018年02期)
刘天宇[5](2018)在《一种基于Lucene的近义词关键字检索系统设计》一文中研究指出本文对关键字检索技术和Lucene进行了研究和使用。针对文档库,在使用Lucene引擎及其工具包的基础上,设计了一套简单并且行之有效的近义词关键字检索模型。分析了Lucene自带评分算法,并在原有的基础上提出了改进的相关度排序算法。比较了Lucene自带中文分词器和第叁方中文分词器的分词效果,设计了定制化的近义词分词器和近义词词典,实现了近义词查询,提高了Lucene关键字检索的性能。(本文来源于《中国科技信息》期刊2018年05期)
刘天宇[6](2018)在《一种基于Lucene的近义词关键字检索系统设计》一文中研究指出本文对关键字检索技术和Lucene进行了研究和使用。针对文档库,在使用Lucene引擎及其工具包的基础上,设计了一套简单并且行之有效的近义词关键字检索模型。分析了Lucene自带评分算法,并在原有的基础上提出了改进的相关度排序算法。比较了Lucene自带中文分词器和第叁方中文分词器的分词效果,设计了定制化的近义词分词器和近义词词典,实现了近义词查询,提高了Lucene关键字检索的性能。(本文来源于《中国科技信息》期刊2018年Z1期)
赵越,袁野,王国仁[7](2016)在《概率XML关键字检索排序算法》一文中研究指出探讨了针对概率XML文档集中与内容相关的关键字检索结果的排序问题,针对概率XML文档的特征提出了一种新的排序模式.与仅取决于检索结果概率的检索排序算法不同,本文提出的排序算法充分考虑了节点对文档的区分程度、节点描述文档的程度,以及XML文档本身的结构特性,设计了满足以上特征的检索结果排序模型,并针对排序模型提出了新的倒排索引结构.新的排序算法可以快速完成关键字检索,并将最相关的信息提供给用户.模拟数据集实验验证了该方法的有效性.(本文来源于《东北大学学报(自然科学版)》期刊2016年08期)
郭秋滟[8](2016)在《安全云环境中一种改进的多关键字检索方案》一文中研究指出为了降低硬件购置成本,许多机构倾向于使用稳健快速的云服务将他们的数据转包出去。然而,外包数据可能含有需要防护的敏感数据,而云提供商并不能可靠地满足这一要求。因此,必须采取防护措施,以保护敏感数据不受到云服务器和其他未授权机构的破坏。针对该问题,提出一种基于minhash函数的高效加密云数据隐私保护多关键字检索方法。该方法根据数据所有者生成并外包给云服务器的加密可检索索引进行加密云检索。已知检索内容后,服务器采用tf-idf加权法将检索内容与可检索索引相比较,除了鉴于隐私因素可被泄露的信息外,不需其他信息即可返回结果。基于公开的Enron数据集的仿真实验结果表明,该方法可保证用户只会检索到最相关的条目,不会对用户造成不必要的通信和计算负担。另外,在检索精度方面,也要优于现有的方法。(本文来源于《计算机应用与软件》期刊2016年04期)
刘勇[9](2016)在《基于地理位置的模糊关键字检索》一文中研究指出随着旅游行业的不断发展,人们出行变得越来越方便,同时也有越来越多的人选择去陌生的地方探索,在这样的背景下,也出现了越来越多的研究问题,其中如何更快更准确发现用户想要去的地方变成一个热门的问题。在以往的研究中,研究者往往根据用户提交的关键字在地图中筛选一个点或是若干个点作为返回的对象让用户选择,而本文则是针对那些没有明确需求的用户提交的关键字,给用户返回若干块区域作为返回的对象给用户选择。在实际的应用中,很多用户往往遇到这样的问题,某用户想要去一个陌生的地方逗留几天,所以用户想要找到一块区域,这个区域内有很多的咖啡店、旅店和饭店,用户将选择这块区域作为自己主要的活动区域。例如用户提交咖啡店、旅店、饭店关键字,算法返回若干个区域,并且区域中含有咖啡店、旅店、饭店对象,本文将这类问题称为基于地理位置的模糊关键字检索问题。实现模糊关键字检索算法后发现算法中用到了大量的排序,并成为算法效率低下的一个原因。本文提出了一个多线程的快速排序算法,使排序的效率提高很多。并行的排序算法被很好的应用到模糊关键字检索算法中,让模糊关键字检索算法能够更快的返回用户想要的结果。通过对模糊关键字检索问题的研究发现,一些用户还可能有另外一种需求,就是用户想要找到确定目标点周围的区域作为活动范围,例如用户想要找到省图书馆周围的模糊区域(例如上文提到的含有咖啡店、旅店、饭店对象的区域),本文将这个问题称为基于地理位置的半模糊关键字检索。(本文来源于《黑龙江大学》期刊2016-02-26)
王师[10](2015)在《面向大数据的关键字检索算法研究及优化》一文中研究指出针对传统检索模型在检索上存在的数据冗余、模糊匹配、检索结果差等缺点,结合当前研究热点,论述异构数据集成、冗余数据排除、高效数据分类、关键字检索等模型与方法,旨在大数据环境下,充分利用传统技术与虚拟化技术、MapReduce并行框架模型、改进向量空间检索模型等技术相结合优化存储模型、改进分类算法以及优化检索算法,进而提高算法运算效率,为用户提供一套集数据存储、数据分类、数据检索于一体的大数据检索基础平台。以关键字检索算法作为研究对象,主要研究内容为:首先,为了更好地对数据检索提供良好的数据存储基础,研究数据模型的设计与优化,并在云计算环境下研讨设计数据存储模型,文件块的数据更新算法设计,以及云存储的故障恢复机制等。第二,为了达到准确地对不同数据的检索要求,在原有分类算法的基础上提出了并行分类混合算法(PCHA算法),该算法利用邻近分类算法适合处理属性多、数据大的分类问题的优势,引入Map-Reduce并行框架与其融合设计,优化并提升原有分类算法的建模预测能力和分类识别率。第叁,研讨传统检索算法并提出无序关键字检索算法(DKRA算法),该算法利用向量检索模型计算方便、复杂度低等优点,引入K-D矩阵构造及相似度等计算方法设计检索算法,并与计算关键字序列权重得到相关数据相似度的计算方法做比较,从而体现DKRA算法在计算效率上的优势。最后,在DKRA算法的基础上提出了有序关键字检索算法(OKRA算法),该算法利用检索关键字的有序性,给出了关键字检索步长、总体检索步长、相关数据检索步长、总体相关数据检索步长、位置匹配度的计算公式等的定义,在计算相似度中引入位置匹配度解决了由于检索关键字顺序组合造成的检索错误率问题,利用该算法可以过滤掉较差无关数据,降低数据集遍历所耗时长,提高了相关检索数据的返回质量。(本文来源于《华北理工大学》期刊2015-11-27)
关键字检索论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
信息技术的发展极大地改变了人们获取资源的方式。其中,图上关键字查询技术引起了越来越多的关注。基于图结构的多关键字检索是在数据图上找到能够所有包含查询关键字的子图。很多文献都是返回子树的形式,如最小代价生成树。最近有研究也提出查找子图的算法,启发性算法就是其中的一种,但是它的查找过程是基于边的权重,而没有优先考虑节点和关键字之间的相似度,所以现有的算法并不能表现出两个节点之间最好的连接关系。同时,现有的方法在top-k结果的排序上也有一定的局限性,在计算边的权重时只是单纯的考虑两端节点的权重求平均,没有考虑每个查询关键字的影响,造成排序结果不理想。本文提出了一种新的图上多关键字检索方法,采用新的方式计算节点权重,并基于节点内容设计出一种搜索子图的算法,首先得到每个关键字对应的节点集合,然后根据节点的内容相关度依次选择节点加入结果集,最后计算结果边集的过程中考虑了hub节点的影响,克服了直接计算两两节点之间最短路径的弊端。最终试图返回结构关系更为紧密和无冗余的结果。本文同时提出一种新的计算方式来对每个结果子图进行打分排序,充分考虑了每个关键字对节点内容相关度的贡献,从而返回最优的top-k个结果。实验表明,本文提出的方法能较快且准确的为用户返回更符合用户查询意图的结果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
关键字检索论文参考文献
[1].覃遵跃,汤庸,徐洪智,黄云.基于关键字密度的XML关键字检索[J].软件学报.2019
[2].杜阳阳.基于图结构的多关键字检索研究[D].南京邮电大学.2018
[3].接鹏飞.汇文OPAC二次开发之关键字检索功能的实现——以盐城市图书馆为例[J].图书馆学刊.2018
[4].常雪琴.一种改进的云环境下排序的密文模糊关键字检索方案[J].徐州工程学院学报(自然科学版).2018
[5].刘天宇.一种基于Lucene的近义词关键字检索系统设计[J].中国科技信息.2018
[6].刘天宇.一种基于Lucene的近义词关键字检索系统设计[J].中国科技信息.2018
[7].赵越,袁野,王国仁.概率XML关键字检索排序算法[J].东北大学学报(自然科学版).2016
[8].郭秋滟.安全云环境中一种改进的多关键字检索方案[J].计算机应用与软件.2016
[9].刘勇.基于地理位置的模糊关键字检索[D].黑龙江大学.2016
[10].王师.面向大数据的关键字检索算法研究及优化[D].华北理工大学.2015