导读:本文包含了敏感网址论文开题报告文献综述、选题提纲参考文献,主要关键词:数据挖掘,敏感,网址,Web,Robot。
敏感网址论文文献综述写法
李申堂[1](2002)在《Web敏感网址发现技术研究》一文中研究指出随着Web信息资源及其应用的高速增长,Web已经成为世界范围内信息共享和信息传播的最主要渠道之一。一方面,Web信息资源的快速膨胀极大丰富了网络用户的信息来源,但另一方面,随着Web规模的增大,Web所固有的异构性、开放性、动态性、分布性等特性又使得用户对Web信息资源的准确定位与及时获取变得越来越困难,网上搜索引擎已成为人们探索网络空间的有力工具,但仍然需要更加快速的、智能的、可以从内容和语义上指导信息搜索和浏览的手段,敏感信息智能快报技术就是为了解决上述问题而被提出的。 为了实现敏感信息智能快报,我们提出了“敏感网址发现”的课题,它是院批项目“敏感信息智能快报技术研究”的一个子课题。本文在讨论了Web的发展、特点及存在问题的基础上,从实际应用的角度出发,着重研究了实现敏感网址发现系统的几项关键技术:Web Robot技术、Web页面的分析与分类技术、超链的分析与分类技术、站点的结构分析技术、基于内容的文本信息分类技术。 敏感网址发现系统的实现包括了站点信息采集,页面内容和链接的分析,站点结构的分析和建立,站点主题信息的获取,以及根据主题对站点的敏感性进行判定等功能模块。本文别给出各部分的算法流程及相应的数据结构。针对研究过程中遇到的问题,本文在应用相关领域的研究成果基础上,提出了用VSM模型进行敏感网址判定的思想,针对系统相关模块的实现,提出了多个新的算法和判定规则。(本文来源于《中国人民解放军信息工程大学》期刊2002-06-01)
敏感网址论文开题报告范文
敏感网址论文参考文献
[1].李申堂.Web敏感网址发现技术研究[D].中国人民解放军信息工程大学.2002