一、基于元搜索的专题式Web搜索引擎的实现(论文文献综述)
李春婕[1](2020)在《网络媒体舆情检测与分析系统设计与实现》文中提出网络舆情是互联网与社会发展相结合后而生成的特殊现象,公众针对公共问题及社会管理者形成的信念及价值观、社会的政治态度等都属于网络舆情的范畴。文章中主要研究的是针对网络媒体进行舆情的检测以及分析研究的系统,针对当前的舆论发展以及规范处理的问题所推出的。在这个系统中,能够明确的了解到不同的网站门户出现的网络新闻舆情消息,其中门户网站包括凤凰、腾讯、新华以及新浪等等,将针对一个问题的报道进行汇总,而且能够对此类的舆情信息进行进一步的跟踪报道,以此对此话题进行分析,对其发展的趋向进行研究,最终研究各种事件针对网络舆情中的发展以及变化的机制,最后给予决策人员准确的数据,以此能够掌握网络舆论的主动权,可以对网上的舆论进行明确的引导。在本次研究中对网络爬虫进行了有效整合,首先对舆情监测的实际情况做了介绍,阐述了研究现状,并介绍了目前市场上的相关商品。在网络爬虫技术的基础上,将信息过滤和抓取功能相结合,利用搜索引擎实现网页数据的采集;通过网页去噪技术、网页排重技术和特征选取技术完成对网页和信息的预处理,以信息检索算法为基础,结合话题追踪和情感挖掘两种方法对网络舆情进行分析,了解其需求以及发展的趋向,对当前商业产品的不足之处进行把握,以此推出事件情感追踪、话题追踪的舆情监测系统;对于网页中的舆情以及热点的分布和来源进行深层次挖掘,和用户做出进一步的交互,按照客户的反馈形成对应的用户舆情模型库。然后针对舆情监测的系统原型进行进一步的分解,确定技术重点;以上述理论和技术重点为基础框架,设计了一款网络舆情监测系统,该系统包括舆情采集、网页预处理、话题追踪、舆情分析几个模块,针对网页爬虫的性能和舆情文本的数据做了分析以及测定,最终结果表明,本文所设计的网络媒体舆情检测与分析系统精准性和实用性良好。
周小龙[2](2018)在《时空与主题约束的不动产舆情信息获取与分析方法》文中指出国土部门需要通过网络舆情监控了解制度改革民意,及时解决和控制社会矛盾,推进不动产相关工作的稳步推进。通用的舆情采集与分析方法针对较小主题类型的舆情信息不具有较好效果,如何快速准确的获取不动产舆情信息,如何多元化分析不动产舆情信息是解决相关政府部门舆情管控问题的关键所在。本文针对互联网空间中的新闻网站、微博贴吧等平台上的新闻与评论信息,从时间、空间、主题三个角度,研究不动产舆情信息的获取、解析和多元化分析方法,进而为国土部门提供决策支持。本文的主要研究内容和结论包括以下几个方面:(1)不动产舆情信息表达模型分析不动产舆情信息的基本描述特征,提出了不动产舆情信息分类体系;分析了不动产舆情信息的内容要素及其文本描述特点,总结了网络舆情内容六要素,提出了不动产舆情信息表达模型。(2)时空与主题约束的不动产舆情信息获取从不同类型不动产实体的通用主题出发,借助词语关联度计算方法,构建不动产舆情主题层次模型;结合时间模式与地名区域词典,通过多种采集方法进行不动产舆情信息获取;参考自然语言文本信息抽取方法,结合舆情信息描述特征对相关方法进行改进,抽取了不动产舆情信息的内容要素。(3)不动产舆情时空与主题分析方法在地名空间化、日期序列化的基础上,基于时间、空间与主题三个不同维度,对不动产舆情进行了多元化分析。在传统主题热点分析与情感倾向分析的基础上,总结了不动产舆情信息的时空分布规律,刻画了不同时空区间本身的主题语义特征,分析了不同时空范围在语义空间中的关联性。以云南省不动产数据为案例,对相关方法进行了验证,研发了原型系统并在国土部门不动产云平台上进行了测试与应用。研究结果表明,在充分考虑网络舆情信息特征的基础上,不动产舆情信息表达模型能较好的实现信息的管理与存储;基于时空与主题约束的舆情信息采集方法能够有效、准确地检索并获取主题范围较小的特定领域的网络舆情信息;改进和优化的信息抽取方法能较好的完成不动产舆情信息的要素抽取,形成结构化的舆情信息;不动产时空与主题分析方法能够较准确的分析给定舆情主题、时空范围下的热点话题、情感倾向、舆情时空分布以及不同时空区间的语义关联性。
陈万志[3](2015)在《互联网泛在地理信息自动发现关键技术研究》文中指出地理信息服务的网络(网格)化已成为GIS发展的必然趋势,特别是在移动互联网、物联网等为代表的无线网络环境支撑下地理情景感知式的“全民测绘,,更加体现了泛在地理信息服务的特征,而这种智能、实时、高效地为用户提供所见即所得式个性化地理信息服务的领域性本质就是以互联网(泛在网)泛在地理信息自动发现为基础的全球海量空间信息更新关联与主动服务.如何在地理信息互联网泛在化的趋势下系统地描述泛在地理信息,快速、自动、准确地在当前互联网地理信息服务的空间数据库中发现目标地理信息,已成为网络地理信息能够快捷、方便、可靠地为广大公众提供信息共享与服务的同时又确保地理信息安全与准确有效的瓶颈问题.本文在国家高技术研究发展计划的支持下,通过使用信息检索、地理分析与计算、人工智能和数据挖掘等领域的相关技术和方法,从互联网泛在地理信息的理论与技术框架、表达与判别模型、面向互联网地理信息服务的元搜索模型、搜索与挖掘算法四个层次进行了深入研究.在GIS泛在化研究热点中有关互联网泛在地理信息自动发现的理论方法和关键技术方面取得了一些成果,主要工作如下:(1)从GIS的发展演变角度出发,以国内外相关研究现状与分析为基础,对地理信息互联网泛在化的发展趋势和特征进行了剖析,明确了GIS正逐步从特定专业应用演化成在移动互联网、物联网等为代表的下一代互联网和以云计算为代表的普适计算为依托背景下地理信息泛在化服务的领域性特征;通过实例的形式解析精炼了泛在地理信息服务的体系结构,阐述了其主要内容、关键技术及实现方法;从internet GIS是泛在地理信息服务初级阶段技术实现的角度描述了互联网泛在地理信息的形式化定义与实质内涵;(2)针对互联网泛在地理信息表达与判别问题,提出了运用地理本体构建面向主题地理信息对象的解决思路,给出了由分类样本库、分类谱系库、分类因子库、类型识别模型库和评价决策树数据构成的互联网泛在地理信息判别知识库,并初步完成了判别模型与判别知识库、分类评价因子与分类谱系和判别处理过程的研究;(3)针对互联网泛在地理信息自动发现的核心技术难题,构建了面向互联网地理信息服务的元搜索引擎框架模型,给出了面向互联网信息服务的元搜索模型解决方案、设计思路和详细的实现过程及海量互联网地理数据存储的方法:(4)针对元搜索引擎框架模型中Web地理信息空间数据库柔性查询支持不佳、智能化程度不高以及算法执行效率较低的实际问题,从语义相似度、上下文偏好、决策树及模糊理论等不同角度提出了相关解决思路和搜索与挖掘算法;(5)以数据表示、框架模型和算法研究为基础,针对不同数据源进行了原型实验系统的测试、分析与评价,进而设计研发了原型系统,并通过应用与示范工程从实际业务功能的角度详细描述了典型业务节点架构、运行环境、已部署的应用模块及其主要性能指标,分析了原型系统应用示范的效果,验证说明了本文提出的相关理论、技术和方法的有效性和可实施性.
李红梅[4](2009)在《智能元搜索引擎关键技术研究》文中研究说明现有的搜索引擎存在覆盖率低和查准率低的缺陷,无法充分满足用户对信息的快速性与有效性要求。元搜索引擎通过调用多个搜索引擎来实现搜索,能较好解决现有搜索引擎的缺陷,但仍然存在智能化程度低、搜索结果的易用性差、无法满足个性化需求等问题。本文系统综述了智能元搜索引擎技术的研究现状和发展趋势,设计了一个基于Multi-Agent的智能元搜索引擎系统结构模型,并对其中的关键技术进行了研究。数据挖掘能够提取数据中隐含的知识,Web数据挖掘技术应用于搜索引擎中,为Web信息的利用提出了新的解决方案。Agent技术的发展日趋成熟,可有效应用于用户个性化智能信息检索中。因此,Web数据挖掘技术、智能Agent技术与元搜索引擎技术相融合,可提高元搜索引擎的智能化水平,使元搜索引擎技术上升到一个新的高度。本文的主要创新性成果如下所述:1.在元搜索引擎中吸收了聚类搜索引擎和个性化检索的关键元素,提出了一个基于Multi-Agent的智能元搜索引擎系统结构模型。采用移动Agent和常驻Agent相结合的搜索机制使系统具有更强的适应性,利用并行约简算法实现了常驻Agent对搜索结果的动态合并,可有效避免在结果合成Agent处产生瓶颈。给出了用户个性化模式的表示机制和更新机制,运用个性化检索和聚类浏览相结合的检索方式既能满足用户的个性化要求,提高用户查询的查准率,又能实现对搜索结果的结构化组织,便于用户快速定位有效信息。2.提出了一种基于虚拟语言模型的成员搜索引擎选择算法。采用将成员搜索引擎数据库与概念相关联的技术,通过静态学习得到数据库与各个概念之间的相关度,并建立数据库的特征描述。对于用户查询,先将其映射到相关概念,然后利用虚拟语言模型计算查询与成员搜索引擎数据库之间的相关性,结合用户对搜索引擎的偏好度实现个性化的成员搜索引擎调度策略。本算法可以弥补Web信息检索中短查询存在的问题,同时提高数据库选择的速度。实验结果表明该算法在搜索结果的查询精度上比采用CORI算法有明显的提高。3.针对结果合成算法中搜索引擎性能不均衡带来的问题,提出了一种基于群决策的合成算法。对搜索结果的排序位置和文本信息进行规范化处理得到文档的相关分值,平衡搜索引擎之间的差异。利用搜索引擎的性能评价,提出改进的影子文档方法估算非相关文档的分值。考虑成员搜索引擎对用户查询意图的相关程度因素,引入群决策思想实现对搜索结果的排序,将与用户查询意图密切相关的结果排在搜索结果的前面,从而提高查准率。该算法充分利用搜索结果的信息,计算简单、易于实现。实验结果表明与成员搜索引擎相比,其平均相关性有明显提高,并且优于Round-robin、CombSum和CombMNZ三种合成算法。4.为了获得明确的聚类主题,提出了一种基于概念分组的Web搜索结果聚类算法。对概念分组算法进行了改进,突破了其对查询特征项的限制,利用特征词的同现文档频率来建立概念分组,进而挖掘Web搜索结果之间的语义关联,产生对查询主题的概念描述,实现对搜索结果的聚类。类别标签的选择综合考虑了特征词在类内和文档集中的重要性,使得标签具有较强的文档区分性。算法中对特征词选择进行了优化,保证了产生的类别标签具有明确的含义;通过对搜索结果的语义挖掘,实现了对Web搜索结果的主题发现,同时,具有对同义词的扩展能力。该算法具有较低的时间复杂度,能够满足实时的、语义的、重叠聚类的要求。实验结果表明该算法聚类性能较好,明显优于K-means聚类算法,并且具有较强的自适应性。与中文聚类搜索引擎比比猫相比,在聚类质量和类别标签上都与之相近,但能够产生含义更为明确的类别标签。
刘东飞[5](2009)在《智能双语搜索方法及搜索引擎的研究》文中认为随着我国经济与对外交流的不断发展,翻译市场规模迅速扩大,利用计算机软件等翻译工具越来越受到用户的青睐,各类机器翻译的技术和方法层出不穷。机器翻译的方法主要分为两大类,分别是基于规则的方法和基于语料库的方法。基于规则的机器翻译最大的难题就是语言歧义的消解;基于语料库的方法是采取翻译记忆的模式,用户利用已有的原文和译文,建立起一个或多个语料库,在翻译过程中,系统自动搜索库中相同或相似的翻译资源,并给出参考译文。但是,目前大量基于翻译记忆模式的翻译软件所依赖的语料库都是人工构建的,语料库容量有限,且更新缓慢。随着因特网的发展,基于Web的全文搜索引擎越来越成为信息检索的主要手段,若能将翻译技术与Web信息搜索技术结合起来,就可以为用户提供完善的、实时的和动态的翻译服务。从研究对象的角度来看,Internet所包含的数据呈现出海量性、半结构化、多样性、动态性、分布式和异构性的特点。特别是经过多年的积累,Internet网站上存储了海量的中英文双语网页资源。双语语料库对机器翻译、机器辅助翻译、双语词典编纂、双语术语自动提取、双语对比研究以及双语教学的巨大价值已经得到越来越多的认可。对于机器翻译或机器辅助翻译而言,双语语料库主要在两方面发挥作用。一方面,双语语料库可以持续不断地为基于记忆的翻译引擎提供翻译实例,另一方面,双语语料库又是一个宝藏,可以从中挖掘学习各种细粒度翻译知识,供机器翻译、机器辅助翻译使用,这些翻译知识对翻译任务的各个环节都会起到积极作用本课题的研究目的是通过对网络搜索引擎、自动积累双语语料库、机器翻译的研究,利用网络机器人技术、网页噪音过滤技术、语句匹配入库算法、数据挖掘、分词技术、双语对齐技术、智能用户接口技术、个性化搜索技术、元搜索及结果融合与排序算法、全文检索技术以及JAVA应用等多项技术,研究基于网络大规模语料库和双语网页搜索的智能双语搜索方法和搜索引擎。这既可以为专业人员提供自动的双语网页资源,又可以为用户提供高质量的辅助翻译,避免翻译的重复劳动,提高翻译质量,具有很好的市场价值和社会效益。本文在研究过程中,主要的创新工作如下:(1)在互联网海量信息中,专门针对含有中英双语信息的单页文本和双页对照文本进行研究。根据两者不同的特点,对双页双语文本首次提出了双页双语语料挖掘算法DBWCM(Double Bilingual Wepage Corpus Mining);对单页双语文本设计了分步处理算法,提出了识别与净化单页双语文本的算法IPSBW(Identification and Purification of the Single Bilingual Webpage)和双语句对匹配与语料挖掘算法BSMCM(Bilingual Sentences Matching and Corpus Mining)。通过执行它们提取网页中大量存在的双语平行翻译语料,形成大规模的语料库,为辅助翻译搜索打下坚实基础。(2)针对当前搜索引擎的用户界面现状,利用概念检索和潜在语义分析的思想,通过建立双语同义词词典对查询关键词进行双语扩展,并为用户输入提供扩展提示,实现良好的用户界面,提高了双语辅助搜索的智能性和查全率。同时为提高查询的准确率,满足用户的个性化需求,研究了显式和隐式两种获取与更新用户个性化信息的方法,提出了双语关键词个性化扩充算法PEBK(Personalized Expansion of the Bilingual Keyword)和双语查询结果的个性化排序算法PSBR(Personalized Sort of the Bilingual Results),以便使查询结果达到因时因人因地的不同,得到用户真正想看到的结果。(3)为了扩大双语搜索的范围,将元搜索技术应用在双语翻译搜索中,通过分析元搜索的结果融合方法,针对使用PageRank算法的问题,提出了结合相关度的改进算法RSBS(Results Sort of the Bilingual Search),并对算法的效果进行验证。(4)最后,在形成双语语料库的基础上,基于Java和Lucene工具,设计网络机器人模块、网页识别与净化模块、语料匹配入库模块、索引模块、检索模块、个性化查询模块,用户接口等七个主要模块,实现双语搜索,为用户提供辅助翻译服务。智能双语辅助翻译搜索涉及的研究领域非常广泛,它涵盖了人工智能、语言学、机器翻译、搜索引擎、Web数据挖掘、数据库等多个领域知识。本文所做的工作尽管为利用网络实现辅助翻译提出了一些可行方法,但是,对于构建一个高效且智能化程度高的基于网络的辅助翻译系统还有许多问题有待进一步研究。
刘义亮[6](2008)在《基于元搜索调度算法的领域搜索模型研究》文中提出随着互联网和技术的不断发展,搜索引擎凭借自身的特殊优势,在前进的道路上扮演着越来越重要的角色,同时也成为人们关注的热点。由于互联网上信息的海量化,异构及动态特性的不断升级,通用搜索引擎在解决网页搜索问题时越来越不能令人满意,于是出现了元搜索引擎。元搜索引擎是一种上应用的信息检索的软件系统,它通过将用户的查询请求转发给成员搜索引擎,然后将各个成员搜索引擎返回的结果进行处理后提交给用户。元搜索在一定程度上提高了查全率,然而在面临用户准确查询时也会面临困难。针对目前信息查询中遇到的问题,本文提出了一种面向领域的搜索模型,这种模型以元搜索技术为基础,在提高查全率的同时,通过引入领域词加权模块,为用户的标准查询表达式额外再生成一个领域查询表达式,这两个表达式合取并作为通用搜索引擎接口的输入,最后采用基于扩展布尔模型的排序算法对返回的文献结果集进行相关度排序并将最终排序结果返回用户。本文主要研究内容:1、对元搜索调度策略进行了深入研究,分析其优缺点,找出其存在的不足,最后提出了一种基于学习的元搜索混合调度模型,这种模型从查全率、查准率、平均响应时间、用户兴趣偏好四个方面出发,综合考虑影响成员搜索引擎调度的各个因素,最后对该算法进行了相关分析。2、针对当前领域搜索引擎在构建自己的索引数据库方面的限制等,本文构建了一种基于元搜索的领域搜索模型(DOSM),这种模型以传统的通用搜索引擎为基础,引入功能模块,通过各个模块分工合作,使整个搜索模型在提高用户查询方面获得了很好的效果。3、构建了一种基于领域知识库的领域词加权模块,通过对用户查询信息分析统计和注册用户信息反馈,从而对领域知识库中的领域词及其层次结构进行动态更新,使领域知识库具备一定的学习能力。4、在分析现有检索模型优劣的基础上,采用了基于扩展布尔模型的排序算法对成员搜索引擎的返回结果进行相似度排序,以提高用户满意度,最后设计并实现了一个基于元搜索调度策略的面向特定领域的搜索引擎。
杨丹波[7](2009)在《应用Web数据挖掘的主题元搜索引擎设计与实现》文中提出本论文介绍了应用Web数据挖掘,基于开源搜索引擎Nutch 0.9及相关软件包,结合主题搜索引擎和元搜索引擎的特点,设计和实现一个主题元搜索引擎TSMSE,借以改善通用全文搜索引擎的查全率和查准率。论文首先开发了主题提取器TopicDistiller,应用Web内容挖掘和Web链接分析,从通用搜索引擎检索结果网页集中提取主题词集和种子站点用于主题表示,为后续主题元搜索引擎的主题判断和主题度计算提供了依据。论文接着提出了具有独立数据库的主题元搜索引擎TSMSE的设计思想,将元搜索引擎综合各个独立搜索引擎检索结果,提高查全率的特点和主题搜索引擎按主题搜索、索引文档,提高查准率的特点结合起来。论文然后应用Nutch爬虫的不同工作方式,将从指定种子站点爬行到的网页集和从各独立搜索引擎爬行到的网页集融合在一起。再开发主题解析和主题索引插件,对爬行到的网页进行主题词提取,确定页面主题,计算主题度,并依照主题和主题度,为用户提供检索服务,从而提高了查准率。由于融合了各个搜索引擎的查询结果,同时也提高了查全率。论文接下来对Nutch 0.9的检索功能和界面进行了增强,实现了具有独立数据库的主题元搜索引擎TSMSE,为用户提供分主题、按主题度排序的检索结果输出。并可根据检索历史记录对用户输入的检索关键字进行智能扩展提示,同时为搜索引擎返回结果的增加了自动聚类和分页浏览功能。论文最后分别采用六个不同的搜索主题,对TSMSE主题元搜索引擎进行了简单的性能测试。结果表明,检索结果的查全率和查准率都有一定提高。
刘炜[8](2007)在《智能元搜索引擎中个性化模式库的研究》文中指出元搜索引擎具有建立在独立搜索引擎之上的特性,能够为用户提供更好的检索帮助,从而近年来获得了较为广泛的应用。但是随着时代的发展,人们需要元搜索引擎能为每个用户提供“量身定制”的个性化服务,并且更进一步期望含义模糊的检索要求能够得到有效服务,以帮助用户廓清其真实的检索需求。针对这两个问题,本文首先围绕元搜索引擎、个性化模式、推理等一系列相关内容深入进行了研究综述;接着在分析了一般元搜索引擎模型的基础上,设计了一个基于Agent的智能元搜索引擎模型(M.Meta-search Engine,MMSE)并研究了一些主要实现技术;然后针对用户的个性化、智能化检索需求,从理论上给出一种树图和基于本体的模式空间图的两层概念层次表示的个性化模式库建模方法,并且研究了模式库的建立与更新算法;随后为满足用户特殊的模糊检索需求,提出了建立在个性化模式库基础上的一种推理机制,给出推理算法并进行了理论分析;最后为了体现上述工作对信息检索的重要作用,设计了本系统的分类逐层深入检索交互界面原型。本文的创新性尝试主要有:1)在对现有元搜索引擎一般结构深入分析的基础上,设计了一个基于Agent的智能元搜索引擎模型(MMSE),该模型具有一定的实用价值;研究了一种基于搜索引擎知识库的新的成员搜索引擎调度策略,依据收集并储存于基于特征词条的权值向量矩阵等结构中的各引擎重要信息来进行成员搜索引擎的调度选择;在基于概率模型的基础上,研究了分类相关度排序法,分类思想的使用不仅能使用户更快地找到所需信息,还便于系统收集用户反馈信息,并由此设计了分类逐层深入检索交互界面原型。2)提出了一种树图和基于本体的模式空间图的两层概念层次表示的模式库建模方法。树图的初始值是依据杜威十进分类法,并对其做了扩展的基础上而来,从树图中查找以选择模式空间图,能使系统整体上有一个提纲挈领的作用;深入研究了基于本体的模式空间图,在空间图中建立本体节点,并引入区间值模糊集理论,给出节点的本体表示及一系列相关的定义与公式,构建了相应的数学模型。这种建模方法对改进传统树型建模的不足有一定益处,更利于建立、使用和完善用户个性化模式。最后提出了模式库的建立与更新算法,设计了一系列相关的数据结构和隶属函数,理论和实验分析证明该算法具有正确性、有效性并且复杂度低的特点。3)提出了建立在个性化模式库基础上的一种推理机制以及个性化模式库的推理算法。个性化模式的全体构成了用户信息检索时的行为背景,从心理学以及人工智能角度的分析支持了该背景提法对推理用户真实检索需求具有可行性。推理机制是为了解决用户的一些特殊需求(比如用户对检索需求认识不清等)而提出的,理论分析证明了该算法具有正确性、有效性并且复杂度低的特点。本文在教育部科技研究重点项目“基于Agent的个性化Web信息检索技术的研究”、以及两项山西省自然科学基金项目“个性化Web信息检索及其代理技术的研究”和“图像情感语义的本体描述方法研究”的支持下,选择了元搜索引擎的个性化与智能化作为研究内容,针对每一个用户的独特信息需求进行有针对性的服务,满足用户的个性化、智能化检索需求,从而提供和完善一种合理的信息服务方式,对充分利用Internet上的资源进行信息检索,提高资源的利用率和检索的效率,实现信息时代人们的个性化需求,具有重要的理论意义和实用价值。本文研究的内容是信息检索的发展趋势和热点方向,故具有一定的前沿性与创新性。
段雪英[9](2007)在《基于.NET的气象主题搜索引擎系统的研究与实现》文中研究指明随着网络信息资源的集聚增长,搜索引擎成为人们获取海量网络信息的首要工具,是网络研究和应用的关键内容。目前Internet信息的多元化的发展,主题搜索引擎正处于十分活跃的阶段。本文就中文web主题信息获取与检索技术进行了一些研究,设计和实现了一个基于元搜索引擎的主题信息采集为核心的气象主题搜索引擎系统。本文首先介绍了目前通用搜索引擎的发展、现状、分类、工作原理,对主题搜索引擎产生的背景并对工作方式作了概述,引出了本系统的设计方案,本课题为在气象学专业背景下,使用.NET以及SQL Server 2000数据库技术,在基于元搜索引擎的主题式智能信息检索系统的研究的同时,给出了其框架的具体实现,构建了一个气象主题搜索引擎系统。重点探讨了系统功能模块及其实现中的关键技术如元搜索引擎接口技术、结果融合、过滤、排序技术等。该系统面向气象领域,保证了对气象信息知识的完全收录与及时更新,避免了强大的搜索噪音,提高了检索效率及精度,能快、全、准地提供气象专题信息查询。为气象专业下的用户在web网络中检索所需的有效信息提供了较好的方案。目前,该系统已经能够实验性运行且效果良好,达到了预期学习和实践的目的,为进一步研究主题搜索引擎技术并开发主题搜索引擎系统奠定了基础。
魏振达[10](2006)在《基于服务的元搜索引擎研究》文中指出随着Internet技术的飞速发展,人们越来越多地依赖网络这个巨大的知识平台。作为用户利用网络信息的重要接口,搜索引擎的发展自Web诞生之日起就一直没有停息。同时,计算机的日益普及和人们运用电脑阅读要求的提高使得数字图书馆及相关技术得以兴起和成长。从搜索引擎获取知识已经是人们获取知识的一种常见途径。另外,也常用作各种信息系统的信息来源组件。但是搜索引擎的查全率一直不理想,元搜索引擎的出现较好的解决了这个问题。因此,元搜索引擎也成了各种信息系统的基础的信息来源组件。 在本文中,我们对作为信息源组件的元搜索引擎的特征进行了分析,完成了基于服务的元搜索引擎系统设计和原型开发,并着重对搜索引擎查询能力进行了建模研究。 在系统设计中,采用了基于服务和消息中间件的实现方式,把成员搜索引擎代理以独立的模块实现,极大地降低了耦合度,使其内部模块可随意装卸,而对外部而言,提供的是WEB SERVICE服务接口,不需要对内部结构有深入了解,直接进行调用即可。同时,我们采用了动态挂接多个领域知识库的方法以满足对多个不同领域进行检索的需求。 我们在对元搜索引擎的成员搜索引擎查询参数集的综合考察的基础上,对查询代理方法及查询转换方法作了深入研究,建立了对成员搜索引擎的查询表达能力的评价模型,并给出了评价方法。最后我们在所建模型的基础上进行了实验,确定了一个相对最佳的元搜索引擎查询参数集,在降低转换复杂度的同时,确保精度不会有太大的降低。
二、基于元搜索的专题式Web搜索引擎的实现(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于元搜索的专题式Web搜索引擎的实现(论文提纲范文)
(1)网络媒体舆情检测与分析系统设计与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 研究内容 |
1.4 论文组织结构 |
第二章 网页数据采集及信息预处理 |
2.1 搜索引擎 |
2.1.1 搜索引擎的发展及原理分析 |
2.1.2 垂直搜索引擎 |
2.2 通用网络爬虫技术 |
2.2.1 网络爬虫工作原理 |
2.2.2 爬虫爬行策略 |
2.3 垂直元搜索采集技术 |
2.3.1 元搜索引擎 |
2.3.2 元搜索工作流程 |
2.4 网页去噪技术 |
2.4.1 编写网页的常用语言 |
2.4.2 HTML/XML文件树型逻辑结构 |
2.4.3 数据路径描述方法 |
2.5 网页排重技术 |
2.5.1 网页重复特点分析 |
2.5.2 网页文本特征的提取方式 |
2.5.3 网页去重的方法研究 |
2.6 文本形式化表示与特征选取技术 |
2.6.1 特征降维方法 |
2.6.2 权重计算方法 |
2.7 本章小结 |
第三章 舆情分析 |
3.1 信息检索模型 |
3.2 信息检索算法 |
3.2.1 基于内容的检索算法 |
3.2.2 基于超链分析的检索算法 |
3.2.3 k-means聚类算法的改进 |
3.3 话题追踪方法 |
3.3.1 Rocchio方法 |
3.3.2 朴素贝叶斯 |
3.3.3 最近邻算法 |
3.3.4 支持向量机(SVM) |
3.4 情感挖掘方法 |
3.4.1 情感倾向性计算 |
3.4.2 情感挖掘流程 |
3.5 本章小结 |
第四章 网络舆情信息系统应用 |
4.1 系统整体设计 |
4.1.1 系统体系结构设计 |
4.1.2 系统功能设计 |
4.1.3 系统功能用例分析 |
4.1.4 子系统功能用例分析 |
4.1.5 系统数据库设计 |
4.1.6 系统模块划分 |
4.1.7 系统部署图 |
4.2 舆情采集模块 |
4.3 网页预处理模块 |
4.3.1 网页去噪模块 |
4.3.2 网页排重模块 |
4.3.3 特征抽取模块 |
4.4 话题追踪模块 |
4.5 舆情分析模块 |
4.6 本章小结 |
第五章 系统测试结果分析 |
5.1 系统测试结果 |
5.2 本章小结 |
第六章 总结和展望 |
参考文献 |
(2)时空与主题约束的不动产舆情信息获取与分析方法(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 网络舆情研究现状 |
1.2.2 不动产舆情研究现状 |
1.2.3 存在问题分析 |
1.3 研究目标和研究内容 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.3.3 拟解决的关键问题 |
1.4 技术路线 |
1.5 论文组织结构 |
第2章 不动产舆情信息表达模型 |
2.1 不动产舆情信息描述特征分析 |
2.1.1 不动产舆情概念 |
2.1.2 不动产舆情分类 |
2.1.3 不动产舆情信息描述特征 |
2.2 不动产舆情信息要素分析 |
2.2.1 不动产舆情信息要素分析 |
2.2.2 不动产舆情信息要素描述特点 |
2.3 不动产舆情信息表达模型 |
2.4 本章小结 |
第3章 时空与主题约束的不动产舆情信息获取 |
3.1 不动产舆情主题词库构建 |
3.1.1 主题种子词 |
3.1.2 多策略融合的主题词扩展 |
3.1.3 实验评估 |
3.2 时空与主题约束的不动产舆情网页文本获取 |
3.2.1 时空约束的主题网页检索 |
3.2.2 基于通用主题爬虫的网页获取 |
3.2.3 基于元搜索引擎的网页获取 |
3.3 不动产舆情网页解析 |
3.4 不动产舆情网页主题可信度评价 |
3.5 不动产舆情信息要素抽取 |
3.5.1 时间信息抽取 |
3.5.2 地名信息抽取 |
3.5.3 人名与机构名抽取 |
3.5.4 舆情关键词抽取 |
3.6 本章小结 |
第4章 不动产舆情时空与主题分析 |
4.1 不动产舆情热点分析 |
4.1.1 热点指数定义 |
4.1.2 热点指数计算 |
4.1.3 热点词汇分析 |
4.2 不动产舆情情感倾向分析 |
4.3 不动产舆情时空分布分析 |
4.4 不动产舆情时空语义分析 |
4.4.1 时空范围主题特征表达 |
4.4.2 时空区间主题相似性分析 |
4.5 本章小结 |
第5章 原型系统与应用案例 |
5.1 原型系统 |
5.1.1 系统体系架构 |
5.1.2 数据库设计 |
5.1.3 系统主要功能模块 |
5.2 应用案例 |
5.2.1 应用案例 |
5.2.2 评估分析 |
5.3 本章小结 |
第6章 结论与展望 |
6.1 研究结论 |
6.2 展望 |
参考文献 |
在读期间的科研工作与成果 |
致谢 |
(3)互联网泛在地理信息自动发现关键技术研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
1 绪论 |
1.1 研究背景 |
1.2 国内外相关研究现状与分析 |
1.2.1 地理信息智能搜索 |
1.2.2 互联网地理信息搜索 |
1.2.3 空间数据挖掘 |
1.2.4 决策知识挖掘 |
1.2.5 地理信息语义分析 |
1.2.6 自发地理信息与众包地理知识 |
1.3 研究目标与意义 |
1.4 本文主要内容与工作 |
2 泛在地理信息的理论与技术 |
2.1 泛在地理信息的内涵与发展 |
2.1.1 计算技术的演化 |
2.1.2 信息与通信技术的演化 |
2.1.3 地理信息系统的演化 |
2.1.4 普适GIS的发展 |
2.2 泛在地理信息的特征 |
2.3 泛在地理信息服务的体系结构 |
2.4 泛在地理信息服务的技术实现 |
2.5 小结 |
3 互联网泛在地理信息表达与判别方法 |
3.1 面向主题的地理对象本体构建方法 |
3.1.1 构建本体的常用方法与原则 |
3.1.2 面向主题的地理对象本体构建过程 |
3.1.3 面向主题的移动对象地理本体构建实例 |
3.2 地理信息的地理语义互操作标准化 |
3.3 互联网泛在地理信息分类评价因子与分类谱系 |
3.4 互联网泛在地理信息判别知识库构建与更新 |
3.5 互联网泛在地理信息判别处理过程 |
3.6 小结 |
4 面向互联网地理信息服务的元搜索模型 |
4.1 总体设计 |
4.2 元搜索引擎框架设计 |
4.2.1 元搜索引擎架构 |
4.2.2 全球动态地理对象库 |
4.2.3 多代理协同工作与任务分发 |
4.2.4 特征词库 |
4.3 基于模糊推理的置信度计算方法 |
4.4 海量互联网地理数据的存储技术 |
4.4.1 基于MongoDB的移动对象数据库系统 |
4.4.2 基于HBase和Neo4J的空间数据云存储 |
4.5 小结 |
5 互联网泛在地理信息的查询与挖掘方法 |
5.1 相关算法和技术基础 |
5.2 基于语义相似度的自适应查询松弛算法 |
5.3 基于上下文偏好的多查询结果排序算法 |
5.4 基于决策树的多查询结果分类算法 |
5.5 基于知识的模糊查询算法 |
5.6 小结 |
6 原型系统与应用示范 |
6.1 原型实验系统测试与分析 |
6.1.1 实验环境 |
6.1.2 基于OpenStreetMap数据源的测试与分析 |
6.1.3 基于不同数据源的测试与分析 |
6.2 应用示范工程 |
6.2.1 典型业务节点架构 |
6.2.2 运行环境 |
6.2.3 系统应用说明 |
6.2.4 主要性能指标 |
6.2.5 应用示范效果 |
6.3 小结 |
结论 |
参考文献 |
作者简历 |
学位论文数据集 |
(4)智能元搜索引擎关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 成员搜索引擎数据库选择研究 |
1.2.2 搜索结果合成处理研究 |
1.2.3 元搜索引擎的个性化和智能化研究 |
1.3 论文结构安排 |
1.4 论文创新点 |
第二章 智能元搜索引擎技术的相关理论 |
2.1 向量空间模型 |
2.1.1 文档的向量化表示 |
2.1.2 相似度计算 |
2.2 搜索引擎 |
2.2.1 搜索引擎的结构 |
2.2.2 搜索引擎的分类 |
2.2.3 搜索引擎结果排序 |
2.3 元搜索引擎 |
2.3.1 元搜索引擎的体系结构 |
2.3.2 元搜索引擎的分类 |
2.3.3 元搜索引擎的技术难点 |
2.3.4 元搜索引擎的发展趋势 |
2.4 聚类浏览技术 |
2.4.1 文本聚类的概念 |
2.4.2 常用文本聚类方法 |
2.4.3 聚类浏览技术的基本要求 |
2.4.4 聚类浏览技术的分类 |
2.4.5 聚类浏览技术的评价方法 |
2.4.6 聚类浏览技术的发展方向 |
2.5 小结 |
第三章 基于Multi-Agent的智能元搜索引擎模型设计 |
3.1 引言 |
3.2 Agent技术 |
3.2.1 Agent的内涵 |
3.2.2 Multi-Agent系统 |
3.2.3 移动Agent与传统分布式技术的比较 |
3.3 基于Multi-Agent的智能元搜索引擎系统模型整体设计 |
3.3.1 MAIME系统的ASM设计 |
3.3.2 MAIME系统的Agent结构设计 |
3.3.3 MAIME模型的系统结构 |
3.3.4 基于Petri网的MAIME建模 |
3.4 模型的技术分析 |
3.4.1 移动Agent和常驻Agent相结合的搜索机制 |
3.4.2 个性化和聚类浏览相结合的检索方式 |
3.5 小结 |
第四章 成员搜索引擎选择算法研究 |
4.1 引言 |
4.2 典型的成员搜索引擎选择算法 |
4.2.1 定性方法 |
4.2.2 定量方法 |
4.2.3 基于学习的方法 |
4.3 基于虚拟语言模型的成员搜索引擎选择算法 |
4.3.1 算法设计思路 |
4.3.2 基于主题概念的数据库特征描述 |
4.3.3 基于虚拟语言模型的数据库选择算法 |
4.3.4 算法小结 |
4.4 实验结果与分析 |
4.4.1 数据集合构建 |
4.4.2 评价方法 |
4.4.3 实验结果 |
4.5 小结 |
第五章 元搜索引擎结果合成算法研究 |
5.1 引言 |
5.2 典型的结果合成算法 |
5.2.1 基于位置信息的合成算法 |
5.2.2 基于分值的合成算法 |
5.2.3 基于内容的合成算法 |
5.2.4 重叠文档在结果合成中的处理方法 |
5.2.5 实际应用中元搜索引擎的合成算法 |
5.3 搜索结果合成的预处理技术 |
5.3.1 无效链接检查 |
5.3.2 查询结果消重 |
5.4 基于群决策的结果合成算法 |
5.4.1 相关分值的规范化 |
5.4.2 非相关文档的相关分值估算 |
5.4.3 相关分值合并 |
5.4.4 算法小结 |
5.5 实验结果与分析 |
5.5.1 数据集合构建 |
5.5.2 评价方法 |
5.5.3 实验结果 |
5.6 小结 |
第六章 搜索结果聚类算法研究 |
6.1 引言 |
6.2 典型搜索结果聚类算法 |
6.2.1 传统聚类算法的应用 |
6.2.2 典型Web Snippets聚类算法 |
6.3 基于概念分组的聚类算法 |
6.3.1 概念分组技术 |
6.3.2 概念分组算法的改进 |
6.3.3 Web搜索结果聚类算法的步骤 |
6.3.4 算法小结 |
6.4 实验结果与分析 |
6.4.1 评价数据集合构建 |
6.4.2 评价方法 |
6.4.3 实验结果 |
6.5 小结 |
第七章 总结与展望 |
7.1 研究总结 |
7.2 进一步的研究工作 |
致谢 |
参考文献 |
读博期间的学术论文和参加的科研项目 |
(5)智能双语搜索方法及搜索引擎的研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 引言 |
1.1.1 研究背景 |
1.1.2 国内外研究现状 |
1.2 搜索引擎 |
1.2.1 搜索引擎的分类 |
1.2.2 搜索引擎系统组成 |
1.2.3 搜索引擎的评价 |
1.2.4 网络机器人 |
1.3 WEB挖掘与搜索引擎 |
1.4 辅助翻译技术 |
1.4.1 机器翻译 |
1.4.2 计算机辅助翻译 |
1.4.3 双语辅助翻译搜索 |
1.5 论文研究主要内容与组织结构 |
第2章 双语语料抽取方法 |
2.1 语料库概述 |
2.1.1 网络中的中英文双语语料 |
2.1.2 构建双语语料库的步骤 |
2.2 网页抓取方法 |
2.2.1 网络机器人程序设计方式 |
2.2.2 网络机器人的系统结构 |
2.2.3 语料数据库逻辑结构 |
2.3 双页文本中双语语料的抽取 |
2.3.1 双页双语文本的特征 |
2.3.2 网页预处理算法 |
2.3.3 语料挖掘算法 |
2.4 单页文本中双语语料的抽取 |
2.4.1 识别与净化单页双语文本的算法 |
2.4.2 双语句对匹配与语料挖掘算法 |
2.5 本章小结 |
第3章 基于查询扩展的双语搜索方法 |
3.1 概述 |
3.2 查询扩展方法 |
3.2.1 概念检索 |
3.2.2 潜在语义分析 |
3.2.3 同义词扩展 |
3.3 基于人机交互的查询扩展 |
3.3.1 群体用户行为 |
3.3.2 用户点击与查询词的关系 |
3.4 实验结果分析 |
3.5 本章小结 |
第4章 个性化双语搜索方法 |
4.1 概述 |
4.2 用户个性化信息的获取方法 |
4.2.1 用户兴趣个性化信息的收集方法 |
4.2.2 用户兴趣个性化信息的更新方法 |
4.3 个性化搜索实现方法 |
4.3.1 用户兴趣库的构建 |
4.3.2 查询关键词的个性化扩充 |
4.3.3 查询结果个性化处理 |
4.4 实验结果分析 |
4.4.1 实验目标 |
4.4.2 实验结果分析 |
4.5 本章小结 |
第5章 双语元搜索方法 |
5.1 元搜索概述 |
5.2 元搜索的结果处理方法 |
5.2.1 结果的提取方法 |
5.2.2 结果的去重复方法 |
5.3 元搜索的结果排序优化方法 |
5.3.1 相关度排序法 |
5.3.2 基于网络链接的算法 |
5.3.3 使用PageRank算法的问题 |
5.3.4 算法的公式改进 |
5.3.5 结合相关度的优化算法 |
5.4 实验结果分析 |
5.4.1 实验目标 |
5.4.2 实验分析 |
5.5 本章小结 |
第6章 双语辅助翻译搜索引擎的设计与实现 |
6.1 系统总体设计 |
6.2 LUCENE工具 |
6.3 索引模块设计 |
6.3.1 基于Lucene建立索引 |
6.3.2 建立语料库索引 |
6.3.3 实现辅助翻译检索 |
6.4 结果示例 |
6.5 本章小结 |
第7章 总结与展望 |
7.1 结论 |
7.2 未来展望 |
参考文献 |
致谢 |
攻读博士学位期间发表的论文 |
(6)基于元搜索调度算法的领域搜索模型研究(论文提纲范文)
摘要 |
Abstract |
1 引言 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 元搜索的当前发展概要 |
1.2.2 元搜索引擎调度策略国内外研究现状 |
1.2.3 领域搜索模型相关技术国内外现状 |
1.3 研究内容 |
1.4 论文的组织结构 |
2 元搜索引擎相关理论分析 |
2.1 元搜索引擎概述 |
2.1.1 元搜索引擎的原理 |
2.1.2 元搜索引擎的分类 |
2.1.3 元搜索的特点 |
2.2 元搜索引擎与其它搜索引擎的比较 |
2.2.1 元搜索引擎与独立搜索引擎的比较 |
2.2.2 元搜索引擎和分布式搜索引擎的比较 |
2.2.3 元搜索引擎与集成搜索引擎的比较 |
2.3 元搜索引擎调度模型 |
2.3.1 SavvySearch方法 |
2.3.2 ProFusion方法 |
2.3.3 决策树归纳分类算法 |
2.3.4 基于用户兴趣的个性化调度模型 |
2.4 元搜索引擎的优势和评价指标 |
2.5 本章小结 |
3 元搜索混合调度模型研究 |
3.1 混合调度算法 |
3.1.1 模型定义 |
3.1.2 查全率置信度 |
3.1.3 查准率置信度 |
3.1.4 成员搜索引擎的平均响应时间 |
3.1.5 成员搜索引擎的用户兴趣偏好权重 |
3.2 成员搜索引擎的综合评价 |
3.3 元搜索引擎的调度过程 |
3.4 本章小结 |
4 基于元搜索调度算法的领域检索模型研究 |
4.1 领域知识库的构建 |
4.1.1 领域知识的表示 |
4.1.2 领域知识库的建立 |
4.2 查询请求转换和查询表达式生成 |
4.3 领域特征属性加权 |
4.4 文献排序 |
4.4.1 信息检索模型 |
4.4.2 扩展布尔模型 |
4.5 本章小结 |
5 领域搜索模型系统的设计与实现 |
5.1 系统开发工具和平台 |
5.2 系统总体框架 |
5.3 数据库系统设计 |
5.3.1 关键词数据库 |
5.3.2 网页数据库 |
5.3.3 索引数据库 |
5.4 实验结果与分析 |
5.4.1 检索效果评价方法 |
5.4.2 检索实例 |
5.5 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表学术论文情况 |
致谢 |
(7)应用Web数据挖掘的主题元搜索引擎设计与实现(论文提纲范文)
摘要 |
Abstract |
第1章 概述 |
1.1 搜索引擎日益重要 |
1.2 搜索引擎面临挑战 |
1.3 元搜索引擎提高查全率 |
1.4 主题搜索引擎提高查准率 |
1.5 论文组织 |
第2章 相关技术综述 |
2.1 搜索引擎发展历史 |
2.2 搜索引擎相关技术 |
2.3 从数据挖掘到Web挖掘 |
2.4 主题搜索引擎与元搜索引擎 |
2.5 开源搜索引擎及相关软件包 |
2.6 本章小结 |
第3章 主题元搜索引擎设计 |
3.1 Nutch 开源搜索引擎简介 |
3.2 Nutch 搜索引擎的架构和扩展方法 |
3.3 结合主题搜索引擎与元搜索引擎 |
3.4 基于Nutch0.9 设计主题元搜索引擎 |
3.5 主题元搜索引擎架构和工作流程 |
3.6 本章小结 |
第4章 主题元搜索引擎的实现 |
4.1 主题词和种子站点提取 |
4.2 页面主题度计算 |
4.3 主题元搜索引擎页面爬行及索引策略 |
4.4 主题元搜索引擎搜索及排序优化 |
4.5 主题元搜索引擎的界面设计 |
4.6 本章小结 |
第5章 主题元搜索引擎测试 |
5.1 开发及测试软硬件环境 |
5.2 中文分词与Web 页面解析测试 |
5.3 主题元搜索引擎查全率测试 |
5.4 主题元搜索引擎查准率测试 |
5.5 本章小结 |
第6章 结论和展望 |
6.1 主题元搜索引擎工作总结 |
6.2 论文工作中的不足和教训 |
6.3 未来展望和下一步工作努力的方向 |
参考文献 |
致谢 |
个人简历 |
(8)智能元搜索引擎中个性化模式库的研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
摘要 |
1.1 引言 |
1.1.1 Internet的发展简史 |
1.1.2 搜索引擎的发展现状 |
1.2 元搜索引擎 |
1.2.1 元搜索引擎的发展现状 |
1.2.2 元搜索引擎研究概述 |
1.3 个性化模式 |
1.3.1 个性化模式研究概述 |
1.3.2 现有个性化模式研究的不足 |
1.4 推理机制 |
1.4.1 搜索引擎智能化与推理研究概述 |
1.4.2 现有研究存在的问题 |
1.5 相关技术介绍 |
1.5.1 本体简介 |
1.5.2 区间值模糊集简介 |
1.6 研究目的与主要内容 |
1.6.1 研究目的与主要创新点 |
1.6.2 主要内容与组织结构 |
第二章 基于Agent的智能元搜索引擎系统模型(MMSE)设计 |
摘要 |
2.1 引言 |
2.2 Agent技术简介与元搜索引擎的一般模型 |
2.2.1 Agent技术简介 |
2.2.2 元搜索引擎的一般模型 |
2.3 基于Agent的元搜索引擎系统模型(MMSE)整体设计 |
2.3.1 MMSE系统模型结构设计思想 |
2.3.2 MMSE系统模型结构图与各模块功能介绍 |
2.3.3 MMSE系统模型流程图 |
2.4 一些关键技术 |
2.4.1 文档表示 |
2.4.2 用户反馈结果聚类 |
2.4.3 成员搜索引擎调度策略 |
2.4.4 相关度排序 |
2.5 小结 |
第三章 用户个性化模式库建模方法 |
摘要 |
3.1 引言 |
3.2 个性化模式 |
3.2.1 个性化概念 |
3.2.2 个性化模式建立方式 |
3.2.3 个性化模式表示方式 |
3.3 一种基于本体的两层概念层次表示的模式库建模方法 |
3.3.1 建模思想 |
3.3.2 第一概念层次——树图 |
3.3.3 第二概念层次——基于本体的模式空间图 |
3.4 模式库的建立与更新算法 |
3.4.1 算法 |
3.4.2 数据结构与隶属函数设计 |
3.4.3 算法分析 |
3.4.4 实验分析 |
3.5 小结 |
第四章 个性化模式库中的推理机制 |
摘要 |
4.1 引言 |
4.2 推理机制背景及任务分析 |
4.2.1 心理学及人工智能背景 |
4.2.2 推理任务分析 |
4.3 推理机制 |
4.3.1 推理方法 |
4.3.2 实例 |
4.4 个性化模式库的推理算法 |
4.4.1 算法 |
4.4.2 算法分析 |
4.5 小结 |
第五章 分类逐层深入的人机交互界面原型 |
摘要 |
5.1 引言 |
5.2 人机交互界面的发展历史与未来 |
5.3 分类逐层深入的人机交互界面原型 |
5.3.1 人机界面原型设计思想 |
5.3.2 人机界面原型设计 |
5.3.3 人机界面原型交互过程 |
5.4 小结 |
第六章 总结与展望 |
参考文献 |
致谢 |
攻读博士学位期间完成的论文 |
(9)基于.NET的气象主题搜索引擎系统的研究与实现(论文提纲范文)
摘要 |
Abstract |
目录 |
第一章 绪论 |
1.1 本文研究的背景 |
1.2 课题研究的主要目的和内容 |
第二章 搜索引擎 |
2.1 搜索引擎概述 |
2.1.1 通用搜索引擎的产生与现状 |
2.1.2 主题搜索引擎——第四代搜索引擎 |
2.2 通用搜索引擎的的工作原理 |
2.3 通用搜索引擎的分类 |
2.3.1 第一种分类 |
2.3.2 第二种分类 |
2.3.3 第三种分类 |
2.4 通用搜索引擎的发展趋势 |
第三章 主题搜索引擎 |
3.1 主题搜索引擎概述 |
3.2 主题搜索引擎产生的背景 |
3.3 主题型搜索引擎与通用搜索引擎的比较 |
3.3.1 主题搜索引擎的优势 |
3.3.2 主题型搜索引擎的实现难点 |
3.4 目前研究状况 |
第四章 气象主题搜索引擎系统设计方案 |
4.1 概述 |
4.2 平台的设计与实现 |
4.2.1 元搜索引擎(Meta Search Engine) |
4.2.1.1 元搜索引擎的分类 |
4.2.1.2 元搜索引擎的特点 |
4.2.1.3 元搜索引擎的典型工作过程 |
4.2.2 AGENT概述 |
4.3 系统模块构成及其功能 |
4.3.1 图形化用户接口模块 |
4.3.2 信息查询模块 |
4.3.2.1 查询预处理器 |
4.3.3 元搜索引擎接口模块 |
4.3.4 成员搜索引擎调度器 |
4.3.5 查询分发器 |
4.3.6 查询代理模块 |
4.3.7 信息处理模块 |
4.3.8 查询结果提交模块 |
4.3.9 数据库模块 |
4.3.9.1 主题专业词库 |
4.3.9.2 气象专业站点库 |
4.3.9.3 用户信息知识库 |
4.3.9.4 系统维护信息库 |
4.3.9.5 数据库结构设计 |
第五章 气象主题搜索引擎系统关键技术的研究 |
5.1 概述 |
5.2 元搜索引擎接口维护技术 |
5.3 成员搜索引擎的调度技术 |
5.4 结果融合技术 |
5.5 信息过滤技术 |
5.5.1 Boolean模型 |
5.5.2 VSM模型算法 |
5.6 网页排序技术 |
5.6.1 PageRank算法 |
5.6.2 HITS算法 |
第六章 主题搜索引擎系统技术实施 |
6.1 系统开发环境及相关技术 |
6.1.1 开发平台Microsoft.NET |
6.1.1.1 .NET框架的优点 |
6.1.2 开发语言:C# |
6.1.3 ASP.NET技术 |
6.1.4 数据库访问技术ADO.NET及访问SQL Server原理 |
6.2 系统设计模式开发 |
6.2.1 开发结构:B/S |
6.2.2 MVC模式 |
6.2.2.1 ASP.NET中MVC模式的实现 |
6.2.3 系统业务流程设计——UML |
6.3 系统初始化 |
6.4 系统开发运行环境 |
6.5 系统应用界面 |
第七章 总结和展望 |
7.1 已经完成的主要工作 |
7.2 论文创新点 |
7.3 本系统有待继续研究的内容 |
参考文献 |
附录1 核心代码:main.aspx.cs |
附录2 核心代码:CatchPat\baidu.cs |
致谢 |
硕士在读期间发表的论文清单 |
(10)基于服务的元搜索引擎研究(论文提纲范文)
第一章 绪论 |
1.1 研究背景 |
1.2 研究动机和目的 |
1.3 论文架构 |
第二章 元搜索引擎的基本理论 |
2.1 信息检索的基本理论模型 |
2.1.1 信息检索的概念 |
2.1.2 信息检索的过程及组成 |
2.1.3 信息检索的数学模型 |
2.2 搜索引擎的基本模型及现状 |
2.2.1 网络机器人 |
2.2.2 数据维护系统 |
2.2.3 用户查询系统 |
2.2.4 搜索引擎的优势和缺陷 |
2.3 元搜索引擎 |
2.3.1 元搜索引擎的分类 |
2.3.2 元搜索引擎的框架与结构 |
2.3.3 数据源的选择 |
2.3.4 查询转换 |
2.3.5 结果合成 |
2.4 本章小结 |
第三章 基于Web Service的组件式元搜索引擎系统设计 |
3.1 J2EE平台架构 |
3.1.1 JAVA消息中间件 |
3.2 Web Service和消息中间件 |
3.2.1 Web Service的构架 |
3.2.2 Web Service的工作流程 |
3.3 基于Web Service和消息中间件的系统结构 |
3.3.1 系统结构 |
3.3.2 系统的数据流传递和状态转换 |
3.3.3 原型实现 |
3.4 本章小结 |
第四章 查询参数表达能力建模设计 |
4.1 查询转换的相关工作和设计目标 |
4.2 成员搜索引擎查询参数表达能力建模设计 |
4.2.1 Boolean模型 |
4.2.2 向量模型 |
4.3 成员搜索引擎查询变量表达能力分析 |
4.3.1 查询变量的分类 |
4.3.2 查询参数映射选择分析 |
4.3.3 查询参数的实验设计与分析 |
4.3.4 元搜索引擎查询参数集设计 |
4.4 本章小结 |
第五章 总结与展望 |
成果目录 |
致谢 |
四、基于元搜索的专题式Web搜索引擎的实现(论文参考文献)
- [1]网络媒体舆情检测与分析系统设计与实现[D]. 李春婕. 内蒙古大学, 2020(04)
- [2]时空与主题约束的不动产舆情信息获取与分析方法[D]. 周小龙. 南京师范大学, 2018(05)
- [3]互联网泛在地理信息自动发现关键技术研究[D]. 陈万志. 辽宁工程技术大学, 2015(12)
- [4]智能元搜索引擎关键技术研究[D]. 李红梅. 西安电子科技大学, 2009(03)
- [5]智能双语搜索方法及搜索引擎的研究[D]. 刘东飞. 武汉理工大学, 2009(01)
- [6]基于元搜索调度算法的领域搜索模型研究[D]. 刘义亮. 大连理工大学, 2008(05)
- [7]应用Web数据挖掘的主题元搜索引擎设计与实现[D]. 杨丹波. 清华大学, 2009(03)
- [8]智能元搜索引擎中个性化模式库的研究[D]. 刘炜. 太原理工大学, 2007(05)
- [9]基于.NET的气象主题搜索引擎系统的研究与实现[D]. 段雪英. 南京信息工程大学, 2007(06)
- [10]基于服务的元搜索引擎研究[D]. 魏振达. 南华大学, 2006(11)