导读:本文包含了特定领域搜索引擎论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:搜索引擎,分词,索引,领域,网络,人工智能,中文。
特定领域搜索引擎论文文献综述
侯锐[1](2008)在《基于TSE的特定领域搜索引擎研究及实现》一文中研究指出搜索引擎(Search Engine)是随着Web信息的迅速增加,在近些年才逐渐发展起来的技术。搜索引擎以一定的策略在互联网中搜集、发现信息,并对信息进行理解、提取、组织和处理,为用户提供检索服务,从而起到信息导航的作用。目前搜索引擎已经成了人们在浩如烟海的网络上寻找目的地的必要工具,它在人们的生活中扮演着越来越重要的作用。因而搜索引擎技术成为计算机工业界和学术界争相开发、研究的对象。面向领域的搜索引擎(又称垂直搜索引擎)是信息检索领域的一个重要研究课题。虽然该领域已经取得许多研究成果,但目前相应的系统应用和检索效果却并不乐观。鉴于目前在国内,基于历史学学科特定知识领域的信息检索少有所闻,所以本论文将对历史学科的搜索引擎系统进行深入的研究及实现。TSE(Tiny Search Engine)是基于北大天网为模型开发的一个在Linux环境下运行的小型搜索引擎。其源码开放,是北大网络实验室的闫宏飞老师专门为搜索引擎爱好者提供的学习产品。由于TSE是一个通用的搜索引擎系统,针对特定领域的问题搜索时,在准确性和效率方面都有一定的不足。本文在构建TSE的基础上将历史学的领域知识加入此系统,改善其分词和索引功能:(1)加入历史学科特定词库。(2)改进TSE的分词算法。(3)更改TSE爬取网页时相关参数的设置以便更适应于特定领域的网页搜集。为了测试改进后的系统的性能,我们利用东北师范大学理想信息技术研究院在历史学科方面的整合资源,建立了一个历史学测试集(大约200篇文档,50个问题及答案)。利用此测试集对TSE及改进后的系统进行测试并对结果进行了深入分析。改进后的系统性能是令人满意的。(本文来源于《东北师范大学》期刊2008-06-01)
胡晓博[2](2006)在《面向特定领域的专业搜索引擎的架构与实现方法》一文中研究指出随着互联网技术的飞速发展,互联网络上的信息量正在以几何级数的增长速度增长,因此,对网络上信息的高效检索成为互联网发展必须要解决的问题,搜索引擎技术得到了特别的重视并且正在飞速的发展。目前,如Google、Baidu等综合型搜索引擎系统已经取得了极大的成功,但是,当使用综合型搜索引擎来检索专业内容时,往往找不到专家们需要的内容。因此,有必要研究并开发面向特定领域的面向特定领域搜索引擎系统来满足某一领域信息检索的需要。该文研究并设计了一个具有通用性的面向特定领域搜索引擎,若想改变应用领域,则只需修改领域词汇的词库文件。为了实现该面向特定领域搜索引擎系统,该文引入了综合型搜索引擎系统的架构模型,即网络蜘蛛、索引器和检索器,并且在该模型中增加了中文分词模块,信息过滤模块。该搜索引擎系统基于开源搜索系统Nutch和全文索引引擎Apache Lucene构建。在设计和开发的过程中,严格按照软件工程代码重用的要求重用了Nutch和Lucene的大量源码,并在此基础上做了改进和扩充。该文介绍了系统集成方案,并且详细讲解了中文分词器、信息过滤器、信息检索器以及用户接口的设计和实现技术,重点讨论了中文分词部分应用的正向最大匹配分词与逆向最大匹配分词相结合的分词算法。最后,该文介绍了该面向特定领域搜索引擎的相关性能数据以及实验验证结果。该文所设计的面向特定领域搜索引擎与现有的主流搜索引擎的主要不同体现在:首先是其面向领域的特性,其次是应用领域可定制的特性。相信该搜索引擎能为需要特定领域搜索的专家学者提供很大的方便和帮助。(本文来源于《哈尔滨工程大学》期刊2006-12-01)
佟晓筠,王翥[3](2004)在《一种特定领域智能搜索引擎技术的研究》一文中研究指出对现有的搜索引擎技术进行了详细比较分析,并提出了用于特定领域如电子商务智能搜索引擎技术的研究思路。采用知识库等人工智能新技术来设计搜索引擎,从而实现将搜索的信息转化为有用的知识,提高搜索技术的智能水平,并实现推送Push技术,为电子商务提供服务。(本文来源于《计算机应用研究》期刊2004年05期)
杨现峰,郑晓雯,任建春,陈龙,王仝杰[4](2001)在《面向机械产品特定领域搜索引擎的总体设计》一文中研究指出针对机械产品这一特定领域搜索引擎进行初步探讨 ,得出不同于目前通用搜索引擎的特殊性 ,给出了设计的总体构架 ,最后对建立过程中的关键技术进行了探讨(本文来源于《煤矿机械》期刊2001年06期)
特定领域搜索引擎论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着互联网技术的飞速发展,互联网络上的信息量正在以几何级数的增长速度增长,因此,对网络上信息的高效检索成为互联网发展必须要解决的问题,搜索引擎技术得到了特别的重视并且正在飞速的发展。目前,如Google、Baidu等综合型搜索引擎系统已经取得了极大的成功,但是,当使用综合型搜索引擎来检索专业内容时,往往找不到专家们需要的内容。因此,有必要研究并开发面向特定领域的面向特定领域搜索引擎系统来满足某一领域信息检索的需要。该文研究并设计了一个具有通用性的面向特定领域搜索引擎,若想改变应用领域,则只需修改领域词汇的词库文件。为了实现该面向特定领域搜索引擎系统,该文引入了综合型搜索引擎系统的架构模型,即网络蜘蛛、索引器和检索器,并且在该模型中增加了中文分词模块,信息过滤模块。该搜索引擎系统基于开源搜索系统Nutch和全文索引引擎Apache Lucene构建。在设计和开发的过程中,严格按照软件工程代码重用的要求重用了Nutch和Lucene的大量源码,并在此基础上做了改进和扩充。该文介绍了系统集成方案,并且详细讲解了中文分词器、信息过滤器、信息检索器以及用户接口的设计和实现技术,重点讨论了中文分词部分应用的正向最大匹配分词与逆向最大匹配分词相结合的分词算法。最后,该文介绍了该面向特定领域搜索引擎的相关性能数据以及实验验证结果。该文所设计的面向特定领域搜索引擎与现有的主流搜索引擎的主要不同体现在:首先是其面向领域的特性,其次是应用领域可定制的特性。相信该搜索引擎能为需要特定领域搜索的专家学者提供很大的方便和帮助。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
特定领域搜索引擎论文参考文献
[1].侯锐.基于TSE的特定领域搜索引擎研究及实现[D].东北师范大学.2008
[2].胡晓博.面向特定领域的专业搜索引擎的架构与实现方法[D].哈尔滨工程大学.2006
[3].佟晓筠,王翥.一种特定领域智能搜索引擎技术的研究[J].计算机应用研究.2004
[4].杨现峰,郑晓雯,任建春,陈龙,王仝杰.面向机械产品特定领域搜索引擎的总体设计[J].煤矿机械.2001