导读:本文包含了访问日志挖掘论文开题报告文献综述、选题提纲参考文献,主要关键词:日志,用户,模式,序列,算法,路径,数据挖掘。
访问日志挖掘论文文献综述写法
夏烈阳[1](2019)在《大数据背景下基于Web日志的用户访问模式挖掘研究》一文中研究指出随着互联网的快速发展,网络用户规模不断扩大,网络用户比例不断增加,网络用户行为也变得越来越复杂。尽管许多学者对Web挖掘技术和用户行为挖掘进行了深入研究,但仍存在一些问题。传统的数据挖掘算法在大数据处理效率方面并不令人满意。与此同时,对于电子商务领域,随着网购越来越流行,网民的不断增加以及新的商品出现,大量的商品和用户没有发生交互数据,系统更倾向于给用户推荐热门商品,导致大多数电子商务平台中都存在重复推荐的情况,无法提供更精准的个性化服务,以及长尾物品的发现和物品的权重调整。同时大量的中小型企业想完成数据驱动服务的升级,包括用户行为挖掘、个性化推荐等。这些问题迫切需要解决。因此,本文选择电子商务领域,基于电子商务后台日志的数据特征,重点分析和研究电子商务用户行为,构建用户行为挖掘的基本模式。本文研究内容主要包括以下几点:首先,在深入了解Web用户行为理论的基础上,基于交互的内容对用户的行为进行分类,同时基于大数据背景,在介绍了传统的一些数据挖掘算法的基础上,做了进一步的优化,以符合现实的商业化需求,对于Web日志来说,在大数据环境以及多样的用户行为的影响下,其采集方法与处理方法变得更加的复杂,本文在此基础上深入研究和理解Web用户的行为特征以及Web日志的数据表示并总结出了互联网用户行为所具有的特征。其次,基于上述研究成果,针对大数据时代的应用场景,在对传统算法改进的基础上进行并行化处理,大幅提高算法的运行效率,同时采用分布式的文件存储结构,提高了系统数据处理的容错性。同时,深入研究了协同过滤推荐算法的优缺点。协同过滤当前有着非常广泛的应用,在不改变协同过滤算法的基础上,引入迁移学习,提出了基于标签共享和用户兴趣的跨域迁移的推荐。实验结果表明,与现有的协同过滤推荐算法相比,基于迁移学习的推荐模型的准确率有一定程度的提高,也有助于解决数据稀疏性引起的冷启动问题。同时对原来系统中已存在的推荐算法,对其算法本身的侵入性非常的小。最后,基于上述研究内容和结果,本文构建的Web用户行为挖掘系统,可进行多维度高效率的挖掘。它通过精准的营销和准确的建议,帮助电子商务商家、内容提供商等了解他们的用户并实现更好的商业价值,完成数据驱动服务的升级。(本文来源于《云南财经大学》期刊2019-06-06)
杨富华,彭钢[2](2016)在《基于访问日志挖掘的高校综合信息门户页面推荐研究》一文中研究指出研究基于访问日志挖掘的高校综合信息门户页面推荐。从高校综合信息门户服务器日志中获取用户日志数据,对日志数据中的"脏"数据进行预处理,通过改进的K-means聚类算法将用户浏览兴趣度数据集划分为多个具有相近兴趣度的用户集合,凭此为用户提供个性化的页面推荐。实验结果表明,在高校综合信息门户页面推荐方面具有不错的效果。(本文来源于《计算技术与自动化》期刊2016年04期)
郭涵阳,高曼如,沈良忠[3](2016)在《Moodle平台师生访问行为日志统计与挖掘研究》一文中研究指出信息技术的快速发展催生了网络教学平台的不断涌现,其中Moodle平台因其开源特征被认为是当前构建MOOC(大规模开放在线课程)的有力平台之一。网络课程教学的有效开展使得Moodle系统日志表中存储了大量的师生访问行为数据,有效的日志统计挖掘有助于发现大量数据背后潜在的访问规律。通过统计分析、数据挖掘等技术实现了对日志数据的深入研究,并针对分析结果提出了Moodle课程使用中存在的问题及相应的改进意见,不仅有助于理解师生在Moodle平台的课程访问学习规律,而且能为Moodle课程的教学评价提供有价值的参考建议,有助于后期Moodle课程自动评价系统的研究。(本文来源于《计算机技术与发展》期刊2016年11期)
魏旭阳[4](2015)在《基于Web日志的用户访问模式挖掘模型研究》一文中研究指出随着信息技术的迅猛发展,用户需求的不断升级,基于Internet技术的应用以惊人的速度渗透到社会生活的方方面面,Web站点俨然已成为一个巨大的信息集散地。如何快速、高效、准确地从信息海洋中定位用户需求的信息资源是我们亟待解决的问题。基于Web自身的特性,人们将数据挖掘技术应用于Web站点的分析中,形成了Web挖掘技术。作为Web挖掘的一个重要分支,Web日志挖掘旨在对服务器日志数据进行分析,捕获用户的浏览行为和兴趣爱好等信息,从而指导Web站点的重构及优化。本文系统地概述了Web挖掘的相关概念,并从数据采集、数据预处理、模式发现和模式分析四个阶段论述了Web日志挖掘的流程,重点研究了序列模式挖掘方法及其在Web用户访问模式挖掘方面的应用。主要研究内容包括:(1)提出了改进的可变支持度序列模式挖掘算法(Variable Support Sequential Pattern Mining,VS_SPM)。本文简要论述了现有的序列模式挖掘算法,针对其在最小支持度阈值设定方面存在的缺陷,提出了VS_SPM算法。该算法采用矩阵存储结构,减少了数据库的扫描次数,引入支持度衰减系数,对不同层级的频繁序列设定变化的支持度。最后使用IBM数据生成器产生测试数据集验证算法的性能。实验分析表明,VS_SPM算法能够有效地解决因阈值设置不合理带来的“组合爆炸’和“稀有项目”问题。(2)提出了基于浏览兴趣的Web用户访问模式挖掘算法(Interested Web User Access Pattern Mining,IWUAPM)。该算法针对Web服务器日志数据所呈现的稀疏特性,对VS_SPM算法进行改进。首先,IWUAPM算法综合页面访问时间、访问频次、页面大小和入度(站点中指向某网页的超链接数目)等因素构建用户浏览兴趣模型。然后定义SD (Support Difference)和LS (Least Support),并运用多最小项目支持度和加权的思想,将用户浏览兴趣作为权值引入到用户访问模式挖掘中。最后,使用预处理后的重庆市农业农村信息网的服务器日志数据进行仿真实验。测试结果表明,IWUAPM算法能够获取用户感兴趣的访问模式,从而指导网站管理者改进站点设计,改善对用户服务的质量。(本文来源于《西南大学》期刊2015-04-10)
陈叁川,吴国全,魏峻,黄涛[5](2014)在《基于日志挖掘的移动应用用户访问模型建模技术研究》一文中研究指出提出了一种基于监控日志挖掘的移动应用用户访问模型自动构造方法,该方法包括监控代码注入和界面访问模型构造两部分。首先,提出了一种监控代码自动注入方法,即通过对移动应用代码的静态分析,自动地在相应位置插入监控代码以支持在运行时动态地监控用户的访问行为。其次,提出了一种基于状态机的移动应用用户访问模型构造方法。访问模型中状态机的节点和节点间跳转上的附加属性描述了UI界面之间的跳转行为和界面内控件的使用情况。对移动应用进行的实验表明,这种基于监控日志挖掘的移动应用用户访问模型自动构造方法能够成功地自动注入移动应用的监控代码,并能够有效获得移动应用用户界面访问行为。(本文来源于《计算机科学》期刊2014年11期)
周文学,王福[6](2014)在《基于访问日志的几类数据挖掘模型体系构建》一文中研究指出以图书馆各类Web资源平台为基础,通过分析Web日志数据源,获取隐藏在访问日志背后的用户访问模式相关的信息。在此基础上描述和分析了几类基于统计方法的Web模型算法,并探索出在图书馆中应用的设计思路。本模型和算法比较简单适用,且易于实现,适合于图书馆的低成本的构建。(本文来源于《情报科学》期刊2014年09期)
王磊[7](2014)在《基于Web日志的用户访问序列模式挖掘研究》一文中研究指出在Web挖掘领域中,Web日志挖掘占有了举足轻重的地位,也是目前研究热点之一。Web日志挖掘的目的是通过对用户访问Web站点时留下的Web日志的分析和研究找到隐含的规律性知识,获取用户的访问模式,可以增强Web服务器的性能,提高Web站点的网页链接结构,同时为用户提供基于兴趣的智能化服务。本文系统阐述了Web日志挖掘的基本理论基础和大致流程,分析了当前的研究现状,并对Web日志挖掘中的几个关键步骤进行了细致研究,提出了相应的改进和创新。Web日志挖掘主要包括3个过程:数据清理、模式发现和模式分析及应用。首先,数据清理包含数据采集和数据预处理,而数据预处理可以说是整个Web日志挖掘过程的基础,直接影响挖掘结果和质量。在本文中,对目前在数据预处理过程进行详细的分析和研究,并分析了实际的例子,发现在当前会话识别的预处理过程中的问题,并在此基础上,从用户的对Web站点浏览习惯出发,提出改进的会话识别方法,新会话开始划分是以Web站点首页和各导航页为参考标识的,可以在一定程度上减少原有会话方法的不足。同时,在原有预处理基础上加入了框架页面过滤,降低了日志预处理阶段的会话识别的空间消耗,能够更为准确的识别用户的访问行为。其次,模式发现是Web日志挖掘的核心,其目的是通过序列模式挖掘算法挖掘出有兴趣性的知识。本文将经典的序列模式算法进行了比较,选择PrefixSpan算法进行深入研究,针对其采用的频繁模式搜索策略导致构造大量中间数据的弊端,提出了自己的改进思路,优化了投影数据库的构建过程,减少了对序列数据库的重复扫描,提高了算法效率。最后,通过实验结果对上述关键问题进行了分析和对比,并达到了预期效果。(本文来源于《中国石油大学(华东)》期刊2014-05-01)
赵晶晶[8](2014)在《基于Web日志挖掘的用户访问兴趣研究》一文中研究指出随着互联网技术的高速发展,网络上的信息量已经达到空前的规模,不论通过计算机还是手机人们都可以从网上获得自己想要的信息。如何从海量数据中快速准确获得有用的信息以及发掘其中潜在的有价值的知识和模式,让互联网变得更加智能化,让人们获得更好的网络体验,这些成为了互联网时代亟待解决的问题。在此背景下Web数据挖掘技术应运而生,成为了解决上述难题的有效途径之一。Web数据挖掘主要包括Web内容挖掘、Web结构挖掘、Web日志挖掘叁方面,本文主要研究背景为Web日志挖掘。由于Web日志数据具有高维、巨量、半结构或无结构等特性,传统的数据挖掘算法不能很好的满足性能需求,因此本文将群智能算法中的粒子群算法应用到了用户聚类中,通过实验验证了该算法在高维数据上的性能优于传统的聚类算法。本文首先研究了经典的聚类算法和粒子群优化算法的基本原理并比较分析了它们的优缺点。其次,针对现有聚类算法中存在的易陷入局部最优、高维数据上性能不稳定等问题,提出了改进的基于K-means的粒子群算法,通过定义分散度来确定K-means算法的操作时机,充分利用了K-means算法的局部搜索能力和粒子群聚类算法的全局搜索能力,加快了收敛速度的同时也提高了解的精度。接着本文对粒子群算法中的惯性权重加以改进,引入适应度方差的概念,使惯性权重随适应度方差进行非线性地自适应调整。为了避免随机搜索导致的退化现象,在粒子群中还加入了一定概率的变异操作来降低聚类过早陷入局部最优解的可能性。然后,本文由分而治之的思想启发,构建了一种分层的Web日志挖掘方案。在对日志文件进行采集、清洗、事务识别、特征提取等预处理后,先用本文提出的改进算法对日志数据进行用户聚类,再使用关联规则进行挖掘用户访问模式,减小了关联规则挖掘的规模和复杂度。最后,通过实验结果验证了本文改进的算法在普通和高维Web日志数据集上都具有聚类正确性高、迭代次数少、性能稳定等优势,并且能够有效地挖掘出明显的用户访问兴趣。(本文来源于《武汉理工大学》期刊2014-04-01)
翁伟[9](2012)在《Web日志频繁访问路径挖掘算法》一文中研究指出研究了如何从Web日志中高效挖掘出连续频繁访问路径,只需扫描一次事务数据库,构建一颗Web访问路径树,该树所有符合频繁度定义的节点构成的子图包含了所有的频繁路径。提出了利用栈访问和回溯该子图各节点一次的算法即可挖掘出所有的频繁路径集,极大提高了算法的时空效率。(本文来源于《信息与电脑(理论版)》期刊2012年12期)
何跃,马丽霞,腾格尔[10](2012)在《基于用户访问兴趣的Web日志挖掘》一文中研究指出Web日志挖掘可以发现访问者兴趣和需求,提出了一种改进的以访问时间、点击次数以及访问路径共同刻画用户的访问兴趣的Web日志挖掘算法.首先以Web日志为基础构建相关矩阵,使用平均访问时间相似度和访问路径相似度共同度量用户访问兴趣的相似程度,最后采用直接聚类去除相交项的聚类算法将相似用户和相关URL聚类.实证分析结果表明该算法能较好地解释用户的实际访问兴趣,从而为网站提供相应的运营建议.(本文来源于《系统工程理论与实践》期刊2012年06期)
访问日志挖掘论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
研究基于访问日志挖掘的高校综合信息门户页面推荐。从高校综合信息门户服务器日志中获取用户日志数据,对日志数据中的"脏"数据进行预处理,通过改进的K-means聚类算法将用户浏览兴趣度数据集划分为多个具有相近兴趣度的用户集合,凭此为用户提供个性化的页面推荐。实验结果表明,在高校综合信息门户页面推荐方面具有不错的效果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
访问日志挖掘论文参考文献
[1].夏烈阳.大数据背景下基于Web日志的用户访问模式挖掘研究[D].云南财经大学.2019
[2].杨富华,彭钢.基于访问日志挖掘的高校综合信息门户页面推荐研究[J].计算技术与自动化.2016
[3].郭涵阳,高曼如,沈良忠.Moodle平台师生访问行为日志统计与挖掘研究[J].计算机技术与发展.2016
[4].魏旭阳.基于Web日志的用户访问模式挖掘模型研究[D].西南大学.2015
[5].陈叁川,吴国全,魏峻,黄涛.基于日志挖掘的移动应用用户访问模型建模技术研究[J].计算机科学.2014
[6].周文学,王福.基于访问日志的几类数据挖掘模型体系构建[J].情报科学.2014
[7].王磊.基于Web日志的用户访问序列模式挖掘研究[D].中国石油大学(华东).2014
[8].赵晶晶.基于Web日志挖掘的用户访问兴趣研究[D].武汉理工大学.2014
[9].翁伟.Web日志频繁访问路径挖掘算法[J].信息与电脑(理论版).2012
[10].何跃,马丽霞,腾格尔.基于用户访问兴趣的Web日志挖掘[J].系统工程理论与实践.2012