导读:本文包含了用户访问模式挖掘论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:模式,用户,序列,日志,模型,数据,算法。
用户访问模式挖掘论文文献综述
王志俊[1](2019)在《用户访问模式中数据挖掘的模型与算法》一文中研究指出本文采用E-OEM模型,对用户访问模式的数据源来自于页面拓扑结构、服务器应用逻辑、用户浏览路径等多个方面进行考虑,以此深入研究不同用户访问模式下的数据挖掘模型及算法。(本文来源于《电子技术与软件工程》期刊2019年13期)
夏烈阳[2](2019)在《大数据背景下基于Web日志的用户访问模式挖掘研究》一文中研究指出随着互联网的快速发展,网络用户规模不断扩大,网络用户比例不断增加,网络用户行为也变得越来越复杂。尽管许多学者对Web挖掘技术和用户行为挖掘进行了深入研究,但仍存在一些问题。传统的数据挖掘算法在大数据处理效率方面并不令人满意。与此同时,对于电子商务领域,随着网购越来越流行,网民的不断增加以及新的商品出现,大量的商品和用户没有发生交互数据,系统更倾向于给用户推荐热门商品,导致大多数电子商务平台中都存在重复推荐的情况,无法提供更精准的个性化服务,以及长尾物品的发现和物品的权重调整。同时大量的中小型企业想完成数据驱动服务的升级,包括用户行为挖掘、个性化推荐等。这些问题迫切需要解决。因此,本文选择电子商务领域,基于电子商务后台日志的数据特征,重点分析和研究电子商务用户行为,构建用户行为挖掘的基本模式。本文研究内容主要包括以下几点:首先,在深入了解Web用户行为理论的基础上,基于交互的内容对用户的行为进行分类,同时基于大数据背景,在介绍了传统的一些数据挖掘算法的基础上,做了进一步的优化,以符合现实的商业化需求,对于Web日志来说,在大数据环境以及多样的用户行为的影响下,其采集方法与处理方法变得更加的复杂,本文在此基础上深入研究和理解Web用户的行为特征以及Web日志的数据表示并总结出了互联网用户行为所具有的特征。其次,基于上述研究成果,针对大数据时代的应用场景,在对传统算法改进的基础上进行并行化处理,大幅提高算法的运行效率,同时采用分布式的文件存储结构,提高了系统数据处理的容错性。同时,深入研究了协同过滤推荐算法的优缺点。协同过滤当前有着非常广泛的应用,在不改变协同过滤算法的基础上,引入迁移学习,提出了基于标签共享和用户兴趣的跨域迁移的推荐。实验结果表明,与现有的协同过滤推荐算法相比,基于迁移学习的推荐模型的准确率有一定程度的提高,也有助于解决数据稀疏性引起的冷启动问题。同时对原来系统中已存在的推荐算法,对其算法本身的侵入性非常的小。最后,基于上述研究内容和结果,本文构建的Web用户行为挖掘系统,可进行多维度高效率的挖掘。它通过精准的营销和准确的建议,帮助电子商务商家、内容提供商等了解他们的用户并实现更好的商业价值,完成数据驱动服务的升级。(本文来源于《云南财经大学》期刊2019-06-06)
王子卿,樊楠[3](2015)在《基于GSP算法的Web用户访问序列模式挖掘》一文中研究指出该文以某电子商务网站的Web访问日志为研究对象,利用SQL Server提供的SSIS服务和T-SQL语句进行数据预处理,得到序列数据库,然后用java语言编程实现GSP算法对其进行序列模式的挖掘测试分析,通过对结果分析可以做出对该网站布局和内容(或产品)调整提供参考,使其更好为其用户提供针对性的服务。(本文来源于《电脑知识与技术》期刊2015年30期)
魏旭阳[4](2015)在《基于Web日志的用户访问模式挖掘模型研究》一文中研究指出随着信息技术的迅猛发展,用户需求的不断升级,基于Internet技术的应用以惊人的速度渗透到社会生活的方方面面,Web站点俨然已成为一个巨大的信息集散地。如何快速、高效、准确地从信息海洋中定位用户需求的信息资源是我们亟待解决的问题。基于Web自身的特性,人们将数据挖掘技术应用于Web站点的分析中,形成了Web挖掘技术。作为Web挖掘的一个重要分支,Web日志挖掘旨在对服务器日志数据进行分析,捕获用户的浏览行为和兴趣爱好等信息,从而指导Web站点的重构及优化。本文系统地概述了Web挖掘的相关概念,并从数据采集、数据预处理、模式发现和模式分析四个阶段论述了Web日志挖掘的流程,重点研究了序列模式挖掘方法及其在Web用户访问模式挖掘方面的应用。主要研究内容包括:(1)提出了改进的可变支持度序列模式挖掘算法(Variable Support Sequential Pattern Mining,VS_SPM)。本文简要论述了现有的序列模式挖掘算法,针对其在最小支持度阈值设定方面存在的缺陷,提出了VS_SPM算法。该算法采用矩阵存储结构,减少了数据库的扫描次数,引入支持度衰减系数,对不同层级的频繁序列设定变化的支持度。最后使用IBM数据生成器产生测试数据集验证算法的性能。实验分析表明,VS_SPM算法能够有效地解决因阈值设置不合理带来的“组合爆炸’和“稀有项目”问题。(2)提出了基于浏览兴趣的Web用户访问模式挖掘算法(Interested Web User Access Pattern Mining,IWUAPM)。该算法针对Web服务器日志数据所呈现的稀疏特性,对VS_SPM算法进行改进。首先,IWUAPM算法综合页面访问时间、访问频次、页面大小和入度(站点中指向某网页的超链接数目)等因素构建用户浏览兴趣模型。然后定义SD (Support Difference)和LS (Least Support),并运用多最小项目支持度和加权的思想,将用户浏览兴趣作为权值引入到用户访问模式挖掘中。最后,使用预处理后的重庆市农业农村信息网的服务器日志数据进行仿真实验。测试结果表明,IWUAPM算法能够获取用户感兴趣的访问模式,从而指导网站管理者改进站点设计,改善对用户服务的质量。(本文来源于《西南大学》期刊2015-04-10)
武健[5](2016)在《网络用户访问模式挖掘算法研究》一文中研究指出针对高校校园网受考生及家长关注度越来越高的现象,为深入分析和理解用户的访问模式及其访问热点的变化规律等知识,设计一种隐马尔科夫模型和分层聚类策略相结合的混合聚类算法。基于隐马尔科夫模型将时序数据转换到似然空间,其中似然度的大小通过对称性KL(Kullback-Leibler)距离来标识。构建对称性KL转移矩阵,并借助于分层聚类方法实现对用户访问模式进行聚类。通过将该方法应用于考生及家长对我校官网访问的网络日志数据挖掘进而得到用户访问的叁种模式,表明该方法的可行性和有效性。(本文来源于《计算机工程与应用》期刊2016年05期)
王磊[6](2014)在《基于Web日志的用户访问序列模式挖掘研究》一文中研究指出在Web挖掘领域中,Web日志挖掘占有了举足轻重的地位,也是目前研究热点之一。Web日志挖掘的目的是通过对用户访问Web站点时留下的Web日志的分析和研究找到隐含的规律性知识,获取用户的访问模式,可以增强Web服务器的性能,提高Web站点的网页链接结构,同时为用户提供基于兴趣的智能化服务。本文系统阐述了Web日志挖掘的基本理论基础和大致流程,分析了当前的研究现状,并对Web日志挖掘中的几个关键步骤进行了细致研究,提出了相应的改进和创新。Web日志挖掘主要包括3个过程:数据清理、模式发现和模式分析及应用。首先,数据清理包含数据采集和数据预处理,而数据预处理可以说是整个Web日志挖掘过程的基础,直接影响挖掘结果和质量。在本文中,对目前在数据预处理过程进行详细的分析和研究,并分析了实际的例子,发现在当前会话识别的预处理过程中的问题,并在此基础上,从用户的对Web站点浏览习惯出发,提出改进的会话识别方法,新会话开始划分是以Web站点首页和各导航页为参考标识的,可以在一定程度上减少原有会话方法的不足。同时,在原有预处理基础上加入了框架页面过滤,降低了日志预处理阶段的会话识别的空间消耗,能够更为准确的识别用户的访问行为。其次,模式发现是Web日志挖掘的核心,其目的是通过序列模式挖掘算法挖掘出有兴趣性的知识。本文将经典的序列模式算法进行了比较,选择PrefixSpan算法进行深入研究,针对其采用的频繁模式搜索策略导致构造大量中间数据的弊端,提出了自己的改进思路,优化了投影数据库的构建过程,减少了对序列数据库的重复扫描,提高了算法效率。最后,通过实验结果对上述关键问题进行了分析和对比,并达到了预期效果。(本文来源于《中国石油大学(华东)》期刊2014-05-01)
陈红丽[7](2012)在《用户网络访问行为模式挖掘及其应用研究》一文中研究指出随着石油行业信息化的建设,像勘探信息、油田开发信息、地面建设信息、储运销售信息、经营管理信息等各类石油信息已经形成了一定规模的海量数据资源,并且这些信息大部分都是以Web站点的形式提供给用户。如何更好的组织这些信息,为用户提供智能网站信息分类,以及满足用户的个性化信息需求,是需要解决的问题。针对这些问题,本文提出了挖掘石油信息用户访问行为模式的方法,该方法通过分析用户对石油信息的访问情况,揭示隐藏在日志中的用户对石油信息的访问习惯和兴趣,帮助油田用户从大量石油信息中方便的阅览到需要的石油资讯。石油信息用户访问行为模式挖掘研究主要分为3个阶段:数据预处理、模式发现、模式分析与应用。在数据预处理阶段,提出了以网站首页结合动态时间阈值会话识别改进方法,实验验证该方法能更好的提取用户的浏览路径,提高数据预处理结果的准确性。在模式发现阶段,本文采用k-means聚类挖掘算法,针对k-means算法对初始聚类中心选取依赖性很强的缺点,提出了基于密度和距离的方法来确定初始聚类中心,使聚类结果不受初始聚类中心随机选择造成的影响。并通过实验验证了改进后的算法在聚类正确性、效率与稳健性方面都有较好的表现。使用某石油信息资源网用户访问信息作为挖掘数据源,完成对该石油信息资源网站用户的聚类,通过对聚类结果的分析,从中得到了一些有用的模式,为石油信息检索和个性化服务等提供依据。(本文来源于《东北石油大学》期刊2012-03-25)
范新刚[8](2012)在《基于用户访问模式的Web数据挖掘》一文中研究指出Web挖掘为电子商务的海量数据处理提供了强有力的技术手段.本文分析了Web挖掘的基本过程和方法,并重点探讨了基于用户访问行动的Web挖掘方法.以Web日志作为Web挖掘的数据源,提出了用户访问行动的关联矩阵表示方法,并建立了Web用户和页面聚类模型,为电子商务的客户管理、内容管理、个性化服务等提供了决策依据.(本文来源于《广东技术师范学院学报》期刊2012年03期)
罗光春,狄翠霞,李炯[9](2012)在《新型用户访问模式挖掘方法研究》一文中研究指出用户访问模式反映了用户浏览网站的规律,可从中发现用户的访问兴趣。常用的模式发现方法则是从用户的访问日志中挖掘用户的频繁遍历路径。由于基于Apriori算法的频繁遍历路径挖掘方法需频繁访问数据库和产生大量的候选项,提出了新型的遍历路径树的数据结构,用以挖掘用户的频繁遍历路径,通过与传统算法比较,提高了挖掘效率。(本文来源于《电子科技大学学报》期刊2012年01期)
殷西洋[10](2011)在《基于兴趣度的Web日志用户访问序列模式挖掘》一文中研究指出随着网络技术和因特网的迅速发展,网络已经成为人们进行交流和相互联系的有效平台,它存储了大量的信息、数据。由于信息量的庞大,对于网络用户来说,如何能够及时地发现和利用有用的信息,则变得越来越困难。对于网站管理者来说,怎样合理地组织网站的布局,提高网站的点击率,也显得相当有难度。为了更好地解决上述相关问题,势必将数据挖掘技术应用于互联网,因此,形成了一个新的研究领域——Web挖掘(Web Mining). Web挖掘通常分为叁类,包括Web内容挖掘,Web结构挖掘和Web使用挖掘。Web使用挖掘是其中重要的应用研究方向之一,其目的是找出网站用户的访问模式,找出用户感兴趣的浏览方式,对优化站点结构和为用户提供个性化服务具有重要的意义。本文主要研究的是基于兴趣度的Web日志用户访问序列模式挖掘,针对当前挖掘用户访问序列模式算法仅仅将频繁访问路径作为用户浏览兴趣路径的问题,改进了WAP-mine算法,命名为基于兴趣度的Web日志用户访问序列模式挖掘算法BIWAP-mine (Web Access Pattern mining based on User Traversal Interest)。本文提出了访问序列上用户浏览兴趣度的定义,综合考虑了页面访问次数、浏览时间、页而信息量大小和带宽来定义用户兴趣度,并将此兴趣度用于改进WAP-mine算法。最后结合具体的实例,对算法进行了验证。结果表明该算法是有效的,在挖掘用户浏览兴趣路径方面比当前流行的WAP-mine挖掘算法更准确,并具有较好的执行效率。(本文来源于《东北师范大学》期刊2011-05-01)
用户访问模式挖掘论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着互联网的快速发展,网络用户规模不断扩大,网络用户比例不断增加,网络用户行为也变得越来越复杂。尽管许多学者对Web挖掘技术和用户行为挖掘进行了深入研究,但仍存在一些问题。传统的数据挖掘算法在大数据处理效率方面并不令人满意。与此同时,对于电子商务领域,随着网购越来越流行,网民的不断增加以及新的商品出现,大量的商品和用户没有发生交互数据,系统更倾向于给用户推荐热门商品,导致大多数电子商务平台中都存在重复推荐的情况,无法提供更精准的个性化服务,以及长尾物品的发现和物品的权重调整。同时大量的中小型企业想完成数据驱动服务的升级,包括用户行为挖掘、个性化推荐等。这些问题迫切需要解决。因此,本文选择电子商务领域,基于电子商务后台日志的数据特征,重点分析和研究电子商务用户行为,构建用户行为挖掘的基本模式。本文研究内容主要包括以下几点:首先,在深入了解Web用户行为理论的基础上,基于交互的内容对用户的行为进行分类,同时基于大数据背景,在介绍了传统的一些数据挖掘算法的基础上,做了进一步的优化,以符合现实的商业化需求,对于Web日志来说,在大数据环境以及多样的用户行为的影响下,其采集方法与处理方法变得更加的复杂,本文在此基础上深入研究和理解Web用户的行为特征以及Web日志的数据表示并总结出了互联网用户行为所具有的特征。其次,基于上述研究成果,针对大数据时代的应用场景,在对传统算法改进的基础上进行并行化处理,大幅提高算法的运行效率,同时采用分布式的文件存储结构,提高了系统数据处理的容错性。同时,深入研究了协同过滤推荐算法的优缺点。协同过滤当前有着非常广泛的应用,在不改变协同过滤算法的基础上,引入迁移学习,提出了基于标签共享和用户兴趣的跨域迁移的推荐。实验结果表明,与现有的协同过滤推荐算法相比,基于迁移学习的推荐模型的准确率有一定程度的提高,也有助于解决数据稀疏性引起的冷启动问题。同时对原来系统中已存在的推荐算法,对其算法本身的侵入性非常的小。最后,基于上述研究内容和结果,本文构建的Web用户行为挖掘系统,可进行多维度高效率的挖掘。它通过精准的营销和准确的建议,帮助电子商务商家、内容提供商等了解他们的用户并实现更好的商业价值,完成数据驱动服务的升级。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
用户访问模式挖掘论文参考文献
[1].王志俊.用户访问模式中数据挖掘的模型与算法[J].电子技术与软件工程.2019
[2].夏烈阳.大数据背景下基于Web日志的用户访问模式挖掘研究[D].云南财经大学.2019
[3].王子卿,樊楠.基于GSP算法的Web用户访问序列模式挖掘[J].电脑知识与技术.2015
[4].魏旭阳.基于Web日志的用户访问模式挖掘模型研究[D].西南大学.2015
[5].武健.网络用户访问模式挖掘算法研究[J].计算机工程与应用.2016
[6].王磊.基于Web日志的用户访问序列模式挖掘研究[D].中国石油大学(华东).2014
[7].陈红丽.用户网络访问行为模式挖掘及其应用研究[D].东北石油大学.2012
[8].范新刚.基于用户访问模式的Web数据挖掘[J].广东技术师范学院学报.2012
[9].罗光春,狄翠霞,李炯.新型用户访问模式挖掘方法研究[J].电子科技大学学报.2012
[10].殷西洋.基于兴趣度的Web日志用户访问序列模式挖掘[D].东北师范大学.2011