结构化搜索论文-李利达

结构化搜索论文-李利达

导读:本文包含了结构化搜索论文开题报告文献综述及选题提纲参考文献,主要关键词:众智科学,电子商务,分布式网络,商品搜索

结构化搜索论文文献综述

李利达[1](2019)在《非结构化众智交易网络商品搜索算法研究与仿真》一文中研究指出现今的电子商务模式大多是以某一电商平台为中心,买家、卖家与其它机构与平台相连或直接进驻平台,实现信息注册、商品搜索、商品交易等功能,这种电子商务模式采用集中式网络结构,依赖中心服务器的超强计算处理能力和超大的信息储存空间。随着众智科学的研究和发展,提出了众智电子商务模式,即网络中买家、卖家和其它机构都是相应独立的智能个体,采用分布式网络结构,智能个体之间直接相连,从而实现全息交易主客体信息共享、精准供需信息识别、智能供需匹配与搜索、商品交易等功能。在众智电子商务网络中,各个智能个体将商品信息储存在本地节点,并通过朋友圈来寻址和路由,实现信息的传递与共享。该网络中存在一个关键问题是,针对网络中某一节点的搜索需求,如何高效、快速和低消耗的进行商品信息资源搜索。本文针对上述商品信息资源搜索问题开展研究,设计了两种搜索算法,具体工作如下(1)设计了两种商品信息资源搜索算法。分析了众智交易网络的特点,在分布式网络搜索算法理论和技术研究现状综述的基础上,分别设计了广深结合启发式商品搜索算法、基于蚁群算法的商品搜索算法。1)广深结合启发式商品搜索算法,融合广度搜索算法和深度搜索算法,定义了网络中节点之间的关联度,并利用节点与朋友圈邻居节点之间的关联度来优化搜索规则和转发路径;2)基于蚁群算法的商品搜索算法,运用蚁群算法启发性、鲁棒性和正反馈性等特点,针对众智交易网络商品信息搜索问题,定义了商品信息关键词信息素和启发方程计算,利用蚁群算法的转发概率和信息素更新机制来设计网络中节点间商品信息资源搜索的规则,从而降低搜索的盲目性。在信息素定义、启发因子的设置和信息素更新策略方面具有一定的新意。(2)开展了众智电子商务网络搜索仿真实验。为了验证上述两种商品信息资源搜索算法的性能,基于Peersim仿真软件对网络环境进行仿真,通过Java语言对本文设计的算法进行编程实现,并且与洪泛算法和随机漫步算法两种基础性搜索算法做比较。实验结果显示,本文设计的算法在搜索成功率、搜索时间、商品匹配度、搜索网络消耗和可拓展性上都具有显着的优势。其中,广深结合的启发式搜索算法消耗较少的网络宽带资源和使用最少的搜索时间,可以达到较高的搜索成功率和商品匹配度;而基于蚁群算法的搜索算法,在搜索成功率、平均商品匹配度返回商品信息资源数量上都有着绝对的优势,从而可以实现网络高效、快速的搜索效果。(本文来源于《北京交通大学》期刊2019-06-05)

姜恩波,覃琳[2](2019)在《基于结构化数据的搜索引擎》一文中研究指出[目的/意义]搜索引擎作为互联网的核心技术与应用之一,代表了互联网发展的水平。了解当前搜索引擎的发展情况,有利于更好地把握技术前沿动态。[方法/过程]文章首先阐述搜索引擎的发展历史,然后重点介绍基于结构化数据的搜索引擎的原理、应用场景,揭示这一类搜索引擎的特征。[结果/结论]基于数据的搜索引擎是互联网发展过程中的必然结果,也是互联网发展的一个亮点。搜索引擎会继续将互联网的精英技术和理念收揽其中,在人们的学习、生活中发挥更加突出的作用。(本文来源于《现代情报》期刊2019年02期)

庄伟[3](2018)在《基于节点兴趣非结构化P2P网络搜索机制研究》一文中研究指出随着网络用户以及网络资源的增长,P2P网络,一种在对等者(peer)之间分配任务和工作负载的分布式应用架构,引起了广泛关注。由于具有较好的可用性、可扩展性,非结构化P2P网络成为P2P网络研究的热点。现今对于非结构化P2P网络资源搜索算法的研究主要是在洪泛算法的基础上进行一定的改进,但这些算法存在明显的问题:一是算法在搜索过程中有一定的盲目性,搜索效率不高;二是搜索过程中会向所有邻居节点发送消息从而产生大量的冗余消息,易造成网络阻塞。针对上述问题,提出一种基于节点兴趣的非结构化P2P覆盖网络拓扑结构,在相似度较高的节点之间建立二叉搜索树来降低查询消息转发的盲目性并提高搜索效率。仿真结果表明,与传统的洪泛算法相比,提出的非结构化P2P网络搜索机制查询时间更短,查询消息量更少,搜索效率更高。(本文来源于《计算机技术与发展》期刊2018年05期)

庄伟[4](2017)在《基于节点兴趣的非结构化P2P网络搜索机制的研究》一文中研究指出P2P(Peer-to-Peer)网络又名对等网络,主要应用在文件共享、流媒体即时通讯和资源搜索等领域。与传统的C/S模式不同的是,P2P网络减少了对中央服务器依赖,并且具有扩展性好、负载均衡等优势。P2P网络中所有节点都是对等体,网络中所有节点既能向其他节点进行资源或者服务的请求,又可以享受其他节点所提供的服务。非结构化P2P网络由于拓扑简单、资源搜索容易实现、网络限制少等特点,获得了越来越多的关注。现今对于非结构化P2P网络资源搜索算法的研究主要是在洪泛算法的基础上进行一定的改进,但这些算法存在明显的问题:一是算法在搜索过程中有一定的盲目性,是一种随机搜索,搜索效率不高;二是搜索过程中会向所有邻居节点发送消息从而产生大量的冗余消息,这容易造成网络阻塞。本论文针对非结构化P2P网络中资源搜索算法的缺点,提出了下面叁个方面的改进:1.针对非结构化P2P网络自适应和松散特性,提出了一种基于兴趣相似度的非结构化P2P覆盖网络拓扑结构,将兴趣相似度值较高的节点之间通过构建二叉搜索树建立逻辑连接。在二叉搜索树中根节点左边的节点与根节点之间兴趣相似度小于根节点本身阈值,而右边节点与根节点之间兴趣相似度则大于等于根节点本身的阈值。由于二叉搜索树本身的特性,在资源搜索的过程中该算法可以获得更高的搜索成功率,并且会极大减少搜索过程中的冗余消息。2.针对传统蚁群算法搜索效率较低和过多的依赖于路径信息浓度导致容易陷入局部最优解的问题,本文在搜索过程通过对节点信誉评价从而优化查询请求的传递,同时引入了伪随机比例的规则,使在资源搜索过程中可以访问到更多的节点,从而有效的避免了蚁群算法过早陷入局部最优解的问题。3.在基于改进蚁群算法的非结构化P2P网络搜索算法的基础上,针对蚁群算法中常见的计算量过大的问题,提出了一种新蚁群算法的非结构化P2P网络搜索算法。本文将构建二叉树拓扑结构,在二叉树中子节点将自己的资源存储在父节点中。在利用蚁群算法进行资源搜索过程中只有部分节点会参与资源搜索和查询请求的转发,这在一定程度上减少了节点的转发,降低了蚁群算法的计算量。(本文来源于《南京邮电大学》期刊2017-10-26)

金运志[5](2017)在《基于本体语义与对象特征的非结构化信息搜索研究》一文中研究指出移动互联网的迅猛发展和移动智能产品的迅速推广,加速了 Web 2.0和社会媒体的发展,导致海量的非结构化信息在互联网上涌现。如何在海量的非结构化信息中有效地、快速地找到所需信息,是信息检索领域一个重要且极具挑战性的研究课题。现有的信息检索系统主要存在两个方面的问题:第一,传统基于关键字的检索利用关键字的绝对匹配技术对文本进行索引和搜索,但由于自然语言固有的歧义性造成检索的查全率与查准率较低,并且搜索返回的结果排序不合理。第二,基于内容的图像检索(CBIR)通过提取图像的视觉特征对图像进行索引和搜索,然而,用户查询意图的高层语义与表达图像的低层视觉特征之间的语义鸿沟严重地影响了 CBIR的性能。为了解决上述问题,尤其是如何对互联网上快速增长的海量信息数据(如文本、图像等)进行有效地分析与高效地搜索,并保证其返回结果的准确性和排序的合理性以及满足用户查询输入来源的多样性,本文对基于本体语义的信息检索相关理论基础进行了研究,在此基础上提出了基于本体语义与对象特征的非结构化信息搜索模式(UISPOSOF)并设计与实现了该模式下的原型系统(UISSOSOF)。具体而言,本文的主要贡献与工作总结如下:(1)提出 了基于 PDCAE(Plan、Do、Check、Act、Evaluate)循环的领域本体构建方法,建立古陶瓷领域本体。针对目前公认的比较成熟的领域本体构建方法(斯坦福大学医学院提出的“七步法”)没有考虑本体评价阶段,从而导致构建出的领域本体的质量参差不齐的现象,本文引入PDCA循环并增加评价阶段,提出基于PDCAE循环的领域本体构建方法使其具有循环、评价反馈等特性,更利于构建高质量的领域本体。在该方法的本体评价阶段,目前已有的综合标准的领域本体评价相关研究未对指标评价集隶属度算法进行讨论,因此,本文给出了领域本体的指标评价集隶属度算法、领域本体评价指标体系和综合评分的计算模型,为定量地评价领域本体的质量或选择集成高质量的领域本体提供参考依据。针对目前古陶瓷领域本体相关研究较少,限制了古陶瓷领域知识的共享与重用以及相关应用的发展,本文建立了古陶瓷领域本体。(2)提出基于本体的语义相似度和相关度计算方法。为了进行语义检索时能够用本体中的概念来表达用户的查询需求,需要计算概念之间的相似度或相关度,判断本体中的概念与用户查询在语义上的匹配程度。针对目前已有的相似度或相关度计算方法未能全面考虑影响概念间相似度或相关度的因素,以及未充分利用本体语义知识的问题,本文提出本体概念间的语义相似度和相关度的计算方法,联合本体概念间的语义相似度与语义相关度的计算方法。基于标准的Miller and Charles测试数据集和WordNet 3.0将提出的计算方法与近年来提出的9种方法进行对比实验,实验结果验证了本文提出的本体概念间的语义相似度计算方法的有效性。(3)提出基于 SVD-SIFT(Singular Value Decomposition-Scale Invariant Feature Transform)的图像重要局部特征提取方法。针对目前基于本体语义的信息搜索研究未考虑联合非结构化信息的特征来对返回的结果进行排序,从而导致基于本体语义的信息搜索不能区分用户查询输入描述非结构化信息语义相同的个体。本文研究联合语义概念和个体对应的非结构化信息的特征(即非结构化对象特征)的方法来进行信息搜索,从而解决返回结果多,排序不合理的问题。如何有效地提取非结构化对象的特征正是解决这一问题的关键。在非结构化对象中,对于图像特征提取,本文提出基于SVD-SIFT的图像重要局部特征提取方法,采用不变矩和基于HSV(Hue Saturation Value)空间的颜色直方图提取图像的全局特征,最后联合图像的重要局部特征和全局特征来描述图像。本文采用联合图像的全局特征(包括颜色特征与形状特征)和重要局部特征(即,SVD-SIFT特征)的方法与颜色直方图、不变矩、SIFT、SVD-SIFT四种图像特征提取方法来进行图像检索对比实验。实验结果表明,本文提出的图像特征提取方法显着降低了图像视觉特征相似度计算的复杂度,平衡了基于内容的图像检索的有效性和高效性。为基于本体语义与对象特征的非结构化信息搜索提供原始基础。(4)提出了基于本体语义与对象特征的非结构化信息搜索模式(UISPOSOF)。具体而言,提出了融合本体语义与非结构化对象特征(即,非结构化信息的特征)的相似度计算策略,并分析与说明融合语义分阶段的相似度量策略对大规模非结构化信息检索更为有利。因此,本文提出了基于本体语义与对象特征的非结构化信息搜索流程,该流程中涉及的核心算法包括基于本体概念的语义搜索算法、基于示例图像的语义搜索算法以及融合语义的分阶段交互式搜索算法,为基于本体语义与对象特征的非结构化信息搜索原型系统的实现奠定了理论基础。(5)基于以上理论研究成果,设计与实现了基于本体语义与对象特征的非结构化信息搜索模式下的原型系统(UISSOSOF)。该系统支持基于本体概念、基于示例图像,以及联合本体概念与示例图像的搜索,并具有一定程度的语义推理能力。在UISSOSOF原型系统平台的基础上,用大量真实的古陶瓷个体信息(以文本和图像为主)对本文提出的搜索算法进行全面地分析与评价,包括搜索实例分析、不同查询模式以及不同算法的比较分析与评价。实验结果验证了本文提出的搜索算法具有有效性和高效性,相对于传统基于关键字的搜索和基于内容的图像检索有显着改进,同时也印证了基于本体语义与对象特征的非结构化信息搜索模式的可行性与实用性。(本文来源于《云南大学》期刊2017-09-01)

燕敬博[6](2016)在《针对结构化数据的安全搜索和模糊测试研究》一文中研究指出随着大数据时代的到来,数据规模呈现爆炸式增长,结构化数据由于其易于存储,查询和分析的特性,成为大规模数据管理的主要数据形式。然而,结构化数据在安全协议设计和模糊测试等安全研究领域面临着新的问题和挑战。例如在安全协议设计时,不仅需要满足数据的安全性,同时要保持数据的结构特性以保证其高效处理的优势;在模糊测试中,传统的测试用例生成手段无法适应只接受结构化输入(具有特定语法结构)的程序,导致代码覆盖率过低,无法有效检测出安全漏洞。针对这些问题,我们展开了对结构化数据的安全研究工作,并取得了以下成果:(1)提出一种能够支持结果排序和文件更新的安全多关键字搜索方案。在云计算场景中,用户出于隐私保护的考虑通常会在上传敏感数据前对其加密,这使得常用的数据搜索功能不再有效,引发了对安全搜索技术的研究。但是现有的安全搜索方案很少可以同时支持多关键字,结果排序和文件更新这叁种功能。针对这一问题,我们提出一种支持结果排序和文件更新的安全多关键字搜索方案。方案中我们将向量空间模型与B~+树结合构造了新型索引结构Keyword B~+树,并采用函数隐藏加密方案对其加密,可以在保证数据安全和查询隐私的前提下对密文进行高效的搜索和更新,并可以将搜索结果按相关度进行排序。由于树状结构索引多分支的特性,使I/O效率得到提高,这一点非常适用于大规模云数据场景。我们对方案进行了全面的安全分析,可以证明我们的方案在允许有限信息泄露的条件下是自适应语义安全的,并能够更好地保护搜索模式。真实数据的实验结果表明本方案比现有方案的性能更好;(2)提出一种对加密图数据的最短距离查询方案。由于很多大规模的网络数据可以建模为图,图数据库得到了广泛的应用;在云计算中,图数据库在外包之前也需要先被加密以保护用户隐私,这使得图中的查询问题变得富有挑战性。针对这一问题,我们提出了一种对加密图中的最短距离查询方案。在方案中,我们首先利用对称加密方法和矩阵索引相结合,实现了对最短距离高效准确查询的简单构造,但是存在预处理时间长以及索引空间过大的问题;针对这些问题,我们提出第二种方案,将部分同态加密方法和Distance Oracle索引相结合,可以实现近似最短距离的查询过程,缩短了预处理时间并减小了索引空间。最后证明了方案在允许有限信息泄露的条件下是自适应语义安全的,并通过实验展示了方案在索引构造时间和查询时间上的高效性;(3)提出一种针对高结构化输入的模糊测试方法。传统的模糊测试方法无法处理具有高结构化输入的程序,测试用例会在程序验证阶段被丢弃。针对这一问题,我们提出一种新的基于语法的模糊测试方案。在方案中,我们通过把现有的测试用例分解为多个语法片段,并推导其语法结构,构造一系列新的测试用例,这些测试用例可以通过程序验证,到达在目标程序中未曾到过的位置。我们在通用的模糊测试框架中实现了这一方法。传统的基于语法的测试器只针对特定语言生成测试用例,与之相比,我们的设计不依赖于特定语言的语法,各种具体语言的模糊测试器都可以构建于我们的框架基础之上。实验表明,我们的测试框架与其它黑盒模糊测试工具相比,代码覆盖率更高。(本文来源于《西安电子科技大学》期刊2016-09-01)

张赫男[7](2016)在《基于蚁群算法的非结构化P2P网络资源搜索研究》一文中研究指出对等网络(P2P)技术有效整合互联网的资源,为人们在大规模信息中获取目标资源提供了更有效的途径。其中非结构化P2P网络具有网络拓扑简单,容易维护,支持模糊查询等优点,但由于其拓扑结构简单、松散,其资源搜索与定位效率一直是研究和关注的问题。传统的非结构化P2P网络资源搜索算法使用泛洪算法(Flooding)来定位资源,但随着网络规模的扩大,这种通过Flooding来定位资源的方法会产生大量的冗余信息,使得网络负载加大,导致搜索效率较低。为了解决非结构化P2P网络资源搜索的效率问题,一种可行的方法是精确的选择邻居节点进行查询转发,从而减少冗余信息的产生,降低搜索时间,最终提高搜索算法效率。蚁群算法起源于对蚂蚁觅食行为的观察,是一种模拟进化算法,它具有正反馈机制,这种机制可以使算法精确的选择邻居节点进行查询转发,提高搜索效率。论文在对传统蚁群算法解决非结构化P2P网络资源搜索问题研究的基础上,给出了一种基于改进蚁群算法的非结构化P2P网络资源搜索算法。传统的蚁群算法只有一种信息素指导查询转发,没有考虑节点之间的联系,并且在搜索后期,由于信息素的累积,算法只会对局部网络资源进行搜索,使搜索过早陷入停滞状态。针对以上问题,论文对传统的蚁群算法进行了以下两点改进:(1)设置了节点兴趣信息素。在传统蚁群算法的关键字信息素的基础上,引入了节点兴趣信息素。关键字信息素反映了节点对于某一关键字的历史搜索行为;节点兴趣信息素反映了节点之间的通信频率和节点拥有资源的相似性。用这两种信息素指导查询转发,考虑了节点之间的联系,同时通过这种正反馈机制,能够精确的选择邻居节点进行查询转发,减少冗余信息的产生。(2)加入了伪随机比例规则,平衡了蚂蚁在利用已有历史信息和探索新的网络资源之间的关系,从而避免了算法陷入只对局部进行搜索,过早陷入停滞状态的困境。论文利用PeerSim网络仿真模拟器对该算法进行仿真实验,并且把该算法与传统的非结构化P2P资源搜索算法——泛洪算法和随机漫步算法进行对比,实验结果表明该算法提高了搜索成功率,并且在搜索效果相同的情况下,减少了冗余信息包在网络中的传播。(本文来源于《北京交通大学》期刊2016-05-01)

朱国晖,张武强,鲁春兰[8](2016)在《一种基于社会行为的非结构化P2P搜索算法》一文中研究指出针对非结构化对等网络(P2P)中信息资源搜索效率低的问题,给出一种基于社会行为的单跳算法。为网络中每个节点引入朋友列表和查询记录列表,记录过去的搜索经验,用于同伴选择和路线查询,之后排列节点价值,更新列表。利用基于推荐节点搜索、基于有用的朋友节点搜索和基于邻居节点搜索3种机制,搜索所需资源。仿真结果表明,所给算法可减少搜索跳数,提高搜索成功率,减少冗余消息,节省内存空间。(本文来源于《西安邮电大学学报》期刊2016年02期)

涂振宇,曾瑄[9](2016)在《一类非结构化对等网资源搜索问题的蚁群算法机制研究》一文中研究指出在基于蚁群算法的非结构化对等网络资源搜索算法研究中,常用查询要求与目标节点共享资源的相似度来表征信息素的大小,信息素的更新机制是在搜索寻优中要考虑的重要因素。研究其信息素的挥发和扰动算法,可以有效地防止算法早熟,提高资源搜索的成功率,缩短查询时间。(本文来源于《南昌工程学院学报》期刊2016年01期)

黄璐璐[10](2016)在《非结构化P2P网络基于动态贪心策略的资源搜索算法研究》一文中研究指出互联网在人们生活中越来越重要,成为人们获取资源的重要来源。网络信息爆发式增长,使得传统以服务器为核心的网络服务模式出现很多不足之处。对等网络(P2P)技术以其独特的特点,普遍应用于资源共享、协同工作及实时通讯等领域,成为互联网的研究热点。P2P网络中每个节点地位平等,既可以是服务器也可以是客户端,节点间的数据传出不再依靠中心服务器。在非结构化P2P网络中节点不停的变化,如何高效、准确的定位资源是P2P网络资源共享面临的一个难题。现在主流的资源搜索算法主要以洪泛算法、随机游走以及基于上述算法的改进算法为主,存在搜索效率低和大量冗余包两个问题。论文分析了在使用洪泛算法进行网络资源搜索时产生的请求冗余、搜索效率低的问题,并设计出一种基于贪心策略的优化搜索算法。首先对非结构化P2P网络资源建立网络模型,抽象出初始节点、响应节点、资源权重和路径费用4个元素,并在贪心算法的基础上,引入动态规划模型,将动态优化思想应用到资源搜索的路径选择问题中,通过求解模型中最小路径得出资源搜索方案。通过该算法可以快速、准确的查找到目标资源,并且进行网络的正常通信。仿真实验表明,相较于传统的泛洪算法,该算法可以通过较少的搜索跳数获得资源路径,提高资源搜索成功率。(本文来源于《北京交通大学》期刊2016-02-22)

结构化搜索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

[目的/意义]搜索引擎作为互联网的核心技术与应用之一,代表了互联网发展的水平。了解当前搜索引擎的发展情况,有利于更好地把握技术前沿动态。[方法/过程]文章首先阐述搜索引擎的发展历史,然后重点介绍基于结构化数据的搜索引擎的原理、应用场景,揭示这一类搜索引擎的特征。[结果/结论]基于数据的搜索引擎是互联网发展过程中的必然结果,也是互联网发展的一个亮点。搜索引擎会继续将互联网的精英技术和理念收揽其中,在人们的学习、生活中发挥更加突出的作用。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

结构化搜索论文参考文献

[1].李利达.非结构化众智交易网络商品搜索算法研究与仿真[D].北京交通大学.2019

[2].姜恩波,覃琳.基于结构化数据的搜索引擎[J].现代情报.2019

[3].庄伟.基于节点兴趣非结构化P2P网络搜索机制研究[J].计算机技术与发展.2018

[4].庄伟.基于节点兴趣的非结构化P2P网络搜索机制的研究[D].南京邮电大学.2017

[5].金运志.基于本体语义与对象特征的非结构化信息搜索研究[D].云南大学.2017

[6].燕敬博.针对结构化数据的安全搜索和模糊测试研究[D].西安电子科技大学.2016

[7].张赫男.基于蚁群算法的非结构化P2P网络资源搜索研究[D].北京交通大学.2016

[8].朱国晖,张武强,鲁春兰.一种基于社会行为的非结构化P2P搜索算法[J].西安邮电大学学报.2016

[9].涂振宇,曾瑄.一类非结构化对等网资源搜索问题的蚁群算法机制研究[J].南昌工程学院学报.2016

[10].黄璐璐.非结构化P2P网络基于动态贪心策略的资源搜索算法研究[D].北京交通大学.2016

标签:;  ;  ;  ;  

结构化搜索论文-李利达
下载Doc文档

猜你喜欢