导读:本文包含了权威页面论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:页面,权威,权重,奇异,分解,卡洛,搜索引擎。
权威页面论文文献综述
黎远松[1](2010)在《权威Web页面数据挖掘技术初探》一文中研究指出Internet是一个庞大的信息服务中心,这为数据挖掘提供了丰富的资源。然而,Web对有效的资源发现还是具有极大的挑战性的。本文针对如何高效且有效地发现和利用因特网上资源进行初探,重点探讨了HITS算法。(本文来源于《科技信息》期刊2010年26期)
孙原[2](2010)在《基于酉变换的权威页面挖掘算法研究》一文中研究指出因特网目前是一个巨大、分布广泛、全球性的信息服务中心。它涉及新闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其它信息服务。Web包含了丰富和动态的超链接信息,以及Web页面的访问和使用信息,这为数据挖掘提供了丰富的资源。Web挖掘就是从Web文档和Web活动中抽取感兴趣的潜在的有用模式和隐藏的信息。首先,本文对搜索引擎和Web页面挖掘进行了系统性的综述,内容包括搜索引擎的工作原理、搜索引擎分类和Web挖掘分类等方面,并重点分析和总结了经典权威页面挖掘算法的优缺点。然后,对酉变换理论及乘幂法基础知识进行了介绍,详细介绍了奇异值分解变换(简称SVD)和截断奇异值分解变换(简称TSVD),这些内容是本文研究内容的数学理论基础。本文研究的核心内容是Web挖掘技术,将Web内容挖掘与Web结构挖掘两种思想相融合,给出基于截断奇异值分解的权威页面挖掘算法。基于TSVD的权威页面挖掘算法的处理过程主要分为两个部分,在Web结构挖掘基础上结合页面权重的内容挖掘变换算法,得到一个权重链接矩阵,然后对该矩阵进行TSVD变换,得到最终权威页面的排序。已有的文献所采用的权威页面挖掘算法基本上都是只采用一种挖掘机制,其中基于Web内容挖掘的算法较多,研究也比较成熟,基于Web结构挖掘的算法相对较少,两种机制各有优缺点。在此基础上,本文提出的基于TSVD权威页面挖掘算法,实质上是尝试将两种Web挖掘方式结合起来,以一种互补的方式,实现权威页面的挖掘,目的是有效提高查准率和查全率。使用截断奇异值分解变换的目的是能降低计算量,过滤掉冗余的数学计算,提高搜索响应时间。最后,借助matlab仿真工具,对叁种权重计算方案进行比较分析。详细介绍TSVD算法对典型的静态页面链接拓扑结构的权威页面挖掘过程,将经典PageRank算法的排序结果与TSVD算法的排序结果对比。仿真实验表明,本文提出的基于酉变换的权威页面挖掘算法相对于经典PageRank算法具有更好的查询性能和更高的查询准确度。(本文来源于《哈尔滨工程大学》期刊2010-01-01)
周炳[3](2006)在《基于K-L变换的权威页面挖掘的算法》一文中研究指出目前用于信息检索的算法主要可以分为两类:一类是采用矢量空间模型(Vector Space Model),依靠内容相关性的计算来确定关键词与文档之间的匹配程度;另一类采用Web超链接分析算法,依靠不同页面之间引用和被引用的关系来评价页面。基于超链接分析的思想,Sergey Brin和Lawrence Page在1998年提出了Page Rank算法,同年J. Kleinberg提出了HITS算法,一些学者也相继提出了其它的链接分析算法,如SALSA,PHITS,Bayesian等算法。这些算法有的已经在实际的系统中实现和使用,并且取得了良好的效果。离散卡洛(Karhunen-Loeve Transformation)变换是以图像的统计特征为基础的在均方意义下为最佳的正交变换。K-L变换的变换核和基本图像不是固定不变的,而是随着所处理的图像改变而改变,正是由于变换核可针对输入图像而产生,所以该变换在变换域中能量最集中。由于卡洛变换在数据压缩方面的优点,使得该变换在数据压缩、聚类分析、模式识别以及信号处理等诸多领域有着非常广泛的应用。Web上的资源如果采用矩阵的形式表示,矩阵的每一个元素分别代表页面之间的连通程度,而把权威页面看成是某个变换域中能量最集中的部分,可以利用K-L变换的方法来挖掘Web权威页面。基于以上的考虑引入卡洛变换的概念,提出了自己的挖掘算法,并在此基础上与Page Rank算法进行了比较。实验证明,基于卡洛变换的权威页面的挖掘算法能够有效地挖掘出用户兴趣的权威页面。(本文来源于《华中科技大学》期刊2006-05-01)
权威页面论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
因特网目前是一个巨大、分布广泛、全球性的信息服务中心。它涉及新闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其它信息服务。Web包含了丰富和动态的超链接信息,以及Web页面的访问和使用信息,这为数据挖掘提供了丰富的资源。Web挖掘就是从Web文档和Web活动中抽取感兴趣的潜在的有用模式和隐藏的信息。首先,本文对搜索引擎和Web页面挖掘进行了系统性的综述,内容包括搜索引擎的工作原理、搜索引擎分类和Web挖掘分类等方面,并重点分析和总结了经典权威页面挖掘算法的优缺点。然后,对酉变换理论及乘幂法基础知识进行了介绍,详细介绍了奇异值分解变换(简称SVD)和截断奇异值分解变换(简称TSVD),这些内容是本文研究内容的数学理论基础。本文研究的核心内容是Web挖掘技术,将Web内容挖掘与Web结构挖掘两种思想相融合,给出基于截断奇异值分解的权威页面挖掘算法。基于TSVD的权威页面挖掘算法的处理过程主要分为两个部分,在Web结构挖掘基础上结合页面权重的内容挖掘变换算法,得到一个权重链接矩阵,然后对该矩阵进行TSVD变换,得到最终权威页面的排序。已有的文献所采用的权威页面挖掘算法基本上都是只采用一种挖掘机制,其中基于Web内容挖掘的算法较多,研究也比较成熟,基于Web结构挖掘的算法相对较少,两种机制各有优缺点。在此基础上,本文提出的基于TSVD权威页面挖掘算法,实质上是尝试将两种Web挖掘方式结合起来,以一种互补的方式,实现权威页面的挖掘,目的是有效提高查准率和查全率。使用截断奇异值分解变换的目的是能降低计算量,过滤掉冗余的数学计算,提高搜索响应时间。最后,借助matlab仿真工具,对叁种权重计算方案进行比较分析。详细介绍TSVD算法对典型的静态页面链接拓扑结构的权威页面挖掘过程,将经典PageRank算法的排序结果与TSVD算法的排序结果对比。仿真实验表明,本文提出的基于酉变换的权威页面挖掘算法相对于经典PageRank算法具有更好的查询性能和更高的查询准确度。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
权威页面论文参考文献
[1].黎远松.权威Web页面数据挖掘技术初探[J].科技信息.2010
[2].孙原.基于酉变换的权威页面挖掘算法研究[D].哈尔滨工程大学.2010
[3].周炳.基于K-L变换的权威页面挖掘的算法[D].华中科技大学.2006