超链分析论文开题报告文献综述

超链分析论文开题报告文献综述

导读:本文包含了超链分析论文开题报告文献综述、选题提纲参考文献,主要关键词:主题,信息检索,评价,发现,爬虫,主题词,相关网页。

超链分析论文文献综述写法

陈志雄,朱向庆[1](2011)在《基于内容评价与超链分析的主题爬虫策略》一文中研究指出分析当前主题爬虫策略的优点和不足,提出基于内容评价与超链分析的主题爬虫策略。实验结果表明,基于该策略的主题爬虫准确率和召回率均优于基于内容评价策略的主题爬虫。(本文来源于《广西轻工业》期刊2011年03期)

吕克强[2](2008)在《Web超链分析及其在搜索引擎中的应用研究》一文中研究指出随着Internet的高速发展和快速普及,Web上可以获取的信息也在急剧增加。由于无法浏览全部的Web文档,所以人们往往求助于搜索引擎来查找所需的信息。Web超链分析技术可以提高搜索引擎的查准率,因此成为网络应用和信息检索方向的研究热点。介绍了搜索引擎的分类、发展历程、原理和评价指标,概括了超链分析技术在搜索引擎中的重要作用。阐述了目前最着名的超链分析算法PageRank和HITS,分析了它们存在的问题,发现主题漂移是影响性能的主要因素。与HITS相比,PageRank在稳定性和适用性上更胜一筹,更适合于大规模的搜索引擎。因此PageRank算法是本文的重点研究对象。对PageRank算法进行了深入的探讨,在分析了国内外主要的改进算法的基础上,对PageRank缺点和改进方法进行总结归纳,从不同的角度提出了两种改进方法。从超链的创建动机和实际作用进行分析,发现超链的实际作用差别比较大。同时受到网页分类的启发,引入了超链分类概念。根据不同的类别分配不同加权,提出了基于超链分类的HC-PageRank改进算法。为了验证算法,在Nutch上开发了基于HC-PageRank的链接分析工具,实验证明,HC-PageRank的查准率高于传统的PageRank算法。在对PageRank计算过程研究的基础上,发现PageRank值不具备语义性。根据HITS在线聚类原理,在查询时根据查询词的语义进行PageRank调整,提出了基于超链内容PageRank调整算法。为了验证算法,在Nutch上开发了基于超链内容PageRank调整算法的聚类插件。实验证明,基于超链内容的PageRank调整算法可以提高搜索引擎的查准率。(本文来源于《中国石油大学》期刊2008-05-01)

黎斌,鲜明[3](2008)在《web超链分析技术》一文中研究指出随着互联网的不断发展,网络己成为人们发布和获取信息的主要平台。由于互联网是一个高速增长、完全不受控制的异构信息集合,因而无论是web信息资源的利用,还是web拓扑建模,经典的信息挖掘技术和数据建模方法都很难得到有效应用,而超链分析的引入和应用为这些问题的解决提供了一条崭新的思路。本文在对超链分析思想进行初步分析的基础上,着重就超链分析原理、方法及应用进行了简要的分析。(本文来源于《科技信息(学术研究)》期刊2008年09期)

胡一俊[4](2005)在《web超链分析应用研究》一文中研究指出随着互联网的不断发展,网络已成为人们发布和获取信息的主要平台。由于互联网是一个高速增长、完全不受控制的异构信息集合,因而无论是web信息资源的利用,还是web拓扑建模,经典的信息挖掘技术和数据建模方法都很难得到有效应用,而超链分析的引入和应用为这些问题的解决提供了一条崭新的思路。本论文在对超链分析思想进行初步分析的基础上,着重就超链分析在web信息资源检索、web资源发现以及web拓扑结构建模等方面的应用进行了详细的研究。 由于超链接关系和引文关系在形式和功能上极其相似,因而引文分析的方法和思路被广泛应用于超链分析之中,但互联网动态、异构分布、无序增长等特点使得超链分析所需解决的问题更为复杂。因而,超链分析方法不仅仅只是简单的从算法上进行实现,还需要融合社会网络分析方法、复杂系统理论以及拓扑建模等技术,系统地对web超链接结构和web信息实体行为之间的关系进行研究。 对于一个特定的信息检索系统,影响检索效率的因素主要是系统对特定信息的覆盖率和对信息相关性判定的准确性。而在web环境下,信息检索的主要问题已不是覆盖率,而是如何能够滤出与查询无关的噪音,以获取准确、有用的信息。超链分析为此提供了一个量化“相关性”的自然方法。本论文的第二章对超链分析在网页爬行、关联网页发现、网页排序优化以及检索结果聚类等领域的应用情况进行了分析,并从超链分析和传统信息检索理论相结合、超链分析和用户网络行为分析相结合、以及超链分析之间的融合叁个方面探讨了超链分析在web信息检索中的发展趋势,研究认为不断优化的超链分析方法丰富了现代信息检索理论,它能够有效地提高网络信息检索效率和改进搜索引擎的质量。 网页作者创建链接的过程并不是随意和无序的,而是以此作为扩展信息传播和交流空间的平台,并以相近社会背景或学科背景联结在一起,在极度分散和无序的web中,形成一个个的主题集合,并以这些主题为核心聚集了成千上万个的虚拟社区。可以说,以结构挖掘为基点的超链分析方法,为网络资源发现提供了一个量化资源“权威性”和虚拟社区发现的自然机制。本论文的第叁章从一般网络主题发现方法、权威性网络主题发现方法、以及网络社区发现等叁个方面对(本文来源于《武汉大学》期刊2005-05-01)

吴江[5](2004)在《使用超链分析技术的搜索引擎》一文中研究指出论述使用超链分析技术的搜索引擎的工作原理;以Google为例分析如何提高网站在搜索结果中的排名;最后介绍国 内使用超链分析技术的搜索引擎。(本文来源于《图书情报工作》期刊2004年07期)

陈定权[6](2004)在《基于超链分析的查找相关网页算法》一文中研究指出首先分析了查找相关网页的一些相关算法,然后在标准的HITS算法基础上,提出了基于修正的HITS的查找相关网页算法。最后,通过实验来分析了这些算法的各自特点和不足。对基于超链分析的查找相关网页算法的研究,可以为用户提供一种新的检索和获取的信息的途径。(本文来源于《现代图书情报技术》期刊2004年02期)

陈定权[7](2003)在《基于超链分析的Web资源自动发现技术》一文中研究指出传统的Web资源自动发现是基于Web页面内容实现的。本文试图从超链分析的角度探讨Web资源的自动发现技术。超链分析技术起源于社会网络分析和科学引文分析理论,它只分析页面之间的关系,而不关心页面本身的属性。通过试验证明,单纯使用超链,根据用户提供的网页实例,我们能够自动发现与学科资源相关的网站。该技术可以有效的减少网络爬行器的无谓爬行,提高采集效率,减轻网络负担,在学科资源建设中起了重要的作用。(本文来源于《图书情报工作》期刊2003年09期)

朱炜,王超,李俊,潘金贵[8](2003)在《Web超链分析算法研究》一文中研究指出1.引言万维网WWW(World Wide Web)是一个巨大的、分布全球的信息服务中心,正在以飞快的速度扩展。1998年WWW上拥有约3.5亿个文档,每天增加约1百万的文档,不到9个月的时间文档总数就会翻一番。Web上的文档和传统的文档比较,有很多新的特点,它们是分布的、异构的、无结构或者半结构的,这就对传统信息检索技术提出了新的挑战。传统的Web搜索引擎大多数是基于关键字匹配的,返回的结果是包含查询项的文档,也有基于目录分类的搜索引擎。这些搜索引擎的结果并不令人满意。有些站点有意提高关键(本文来源于《计算机科学》期刊2003年09期)

向桂林[9](2002)在《WEB超链分析及应用》一文中研究指出文章分析了传统的基于文本处理的信息检索算法在处理WEB页面时遇到的问题,指出在处理WEB页面时,应分析页面中超链的意义,给出了超链分析在网络爬行和检索结果排序两个方面的应用及相应的算法。(本文来源于《大学图书馆学报》期刊2002年02期)

张汛涞[10](2001)在《利用超链分析自动获取网页的主题词描述》一文中研究指出本文介绍超级链接(HypertextLink)中超链文字的作用,探讨如何利用超链文字的信息自动获取网页文件的主题词描述,以及该算法在搜索引擎中的相关度评价(relevancejudgement)中的重要作用。(本文来源于《现代计算机(专业版)》期刊2001年10期)

超链分析论文开题报告范文

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着Internet的高速发展和快速普及,Web上可以获取的信息也在急剧增加。由于无法浏览全部的Web文档,所以人们往往求助于搜索引擎来查找所需的信息。Web超链分析技术可以提高搜索引擎的查准率,因此成为网络应用和信息检索方向的研究热点。介绍了搜索引擎的分类、发展历程、原理和评价指标,概括了超链分析技术在搜索引擎中的重要作用。阐述了目前最着名的超链分析算法PageRank和HITS,分析了它们存在的问题,发现主题漂移是影响性能的主要因素。与HITS相比,PageRank在稳定性和适用性上更胜一筹,更适合于大规模的搜索引擎。因此PageRank算法是本文的重点研究对象。对PageRank算法进行了深入的探讨,在分析了国内外主要的改进算法的基础上,对PageRank缺点和改进方法进行总结归纳,从不同的角度提出了两种改进方法。从超链的创建动机和实际作用进行分析,发现超链的实际作用差别比较大。同时受到网页分类的启发,引入了超链分类概念。根据不同的类别分配不同加权,提出了基于超链分类的HC-PageRank改进算法。为了验证算法,在Nutch上开发了基于HC-PageRank的链接分析工具,实验证明,HC-PageRank的查准率高于传统的PageRank算法。在对PageRank计算过程研究的基础上,发现PageRank值不具备语义性。根据HITS在线聚类原理,在查询时根据查询词的语义进行PageRank调整,提出了基于超链内容PageRank调整算法。为了验证算法,在Nutch上开发了基于超链内容PageRank调整算法的聚类插件。实验证明,基于超链内容的PageRank调整算法可以提高搜索引擎的查准率。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

超链分析论文参考文献

[1].陈志雄,朱向庆.基于内容评价与超链分析的主题爬虫策略[J].广西轻工业.2011

[2].吕克强.Web超链分析及其在搜索引擎中的应用研究[D].中国石油大学.2008

[3].黎斌,鲜明.web超链分析技术[J].科技信息(学术研究).2008

[4].胡一俊.web超链分析应用研究[D].武汉大学.2005

[5].吴江.使用超链分析技术的搜索引擎[J].图书情报工作.2004

[6].陈定权.基于超链分析的查找相关网页算法[J].现代图书情报技术.2004

[7].陈定权.基于超链分析的Web资源自动发现技术[J].图书情报工作.2003

[8].朱炜,王超,李俊,潘金贵.Web超链分析算法研究[J].计算机科学.2003

[9].向桂林.WEB超链分析及应用[J].大学图书馆学报.2002

[10].张汛涞.利用超链分析自动获取网页的主题词描述[J].现代计算机(专业版).2001

标签:;  ;  ;  ;  ;  ;  ;  

超链分析论文开题报告文献综述
下载Doc文档

猜你喜欢