并行过滤论文-鲍凯丽,刘其成,牟春晓

并行过滤论文-鲍凯丽,刘其成,牟春晓

导读:本文包含了并行过滤论文开题报告文献综述及选题提纲参考文献,主要关键词:外卖,协同过滤,朴素贝叶斯,ALS算法

并行过滤论文文献综述

鲍凯丽,刘其成,牟春晓[1](2019)在《融合朴素贝叶斯和协同过滤的外卖推荐并行算法研究》一文中研究指出为了提高个性化外卖推荐系统的准确率,结合传统的协同过滤算法中存在的数据稀疏性问题,提出一种融合朴素贝叶斯和协同过滤的外卖推荐并行算法。采用并行的朴素贝叶斯分类算法构建外卖评论文本情感分类器,量化评论文本情感值;结合评分数值构建外卖综合评分模型;将综合评分结果整合到推荐系统的训练集,利用优化的并行ALS算法进行推荐。实验结果表明,该推荐算法不仅在推荐准确率上有一定的提高,还具有良好的加速比。该算法应用于个性化外卖推荐是可行和有效的。(本文来源于《计算机应用与软件》期刊2019年11期)

康林瑶,唐兵,夏艳敏,张黎[2](2019)在《基于GPU加速和非负矩阵分解的并行协同过滤推荐算法》一文中研究指出协同过滤(CF)已经在推荐系统中得到了广泛的应用。但是随着用户和项目规模的增大,协同过滤算法的运行效率以及结果的正确性会大大降低。针对这一问题,文中提出了一种基于GPU的非负矩阵分解(NMF)的并行协同过滤方法,充分利用NMF数据降维和特征提取的优势以及CUDA的多核并行计算模式,进行维数简化和用户的相似性计算。该算法在提高精确性的同时降低了计算耗费,可以较好地解决协同过滤推荐系统所存在的稀疏性和扩展性等问题,快速产生精确的个性化推荐结果。基于NVIDIA CUDA设备和真实的MovieLens用户评分数据集,将所设计的并行NMF协同过滤算法与传统的基于用户的和基于物品的协同过滤算法进行了比较,实验结果表明,所设计的并行NMF协同过滤算法达到了较快的处理速度以及较高的推荐准确率。(本文来源于《计算机科学》期刊2019年08期)

游思晴,周丽,赵东杰,薛菲[3](2018)在《基于粒子群优化算法的协同过滤推荐并行化研究》一文中研究指出针对常用协同过滤推荐算法存在计算性能瓶颈的问题,提出了在Spark上并行化实现协同过滤推荐算法RLPSO_KM_CF.首先,通过具备反向学习和局部学习能力的粒子群优化(RLPSO)算法寻找粒子群最优解,输出优化后的聚类中心;然后,运用RLPSO_KM算法对用户信息进行聚类;最后,将传统协同过滤推荐算法与RLPSO_KM聚类结合,从而对目标用户进行有效推荐.实验结果显示,RLPSO_KM_CF算法在推荐准确度方面有显着提高,具有较高的加速比,稳定性也得到了一定提升.(本文来源于《北京邮电大学学报》期刊2018年06期)

李嵩,李书琴,刘斌[4](2018)在《改进的协同过滤算法及其并行化实现》一文中研究指出为解决海量数据背景下推荐系统的可扩展性问题和评分空间上的数据稀疏性问题,研究Spark平台下基于格拉斯曼秩1更新子空间估计法(GROUSE)和用户聚类的改进协同过滤推荐算法(CF-GUC)。通过改造GROUSE算法对评分矩阵进行填充;构造用户项目类别矩阵,对用户进行模糊聚类;引入类别加权度,对评分进行加权修正,在此基础上应用协同过滤算法进行预测评分;将改进算法在Spark计算平台上做并行化实现。实验结果表明,当最近邻居数k取30到40时,CF-GUC算法相比于CF-mean算法、CF-UC算法、Pearson-CF算法, MAE值分别降低了约3.31%、3.02%、6.48%,在3种不同规模的数据集下基于Spark平台的CF-GUC算法运算效率比单节点提高了约40%到60%。(本文来源于《计算机工程与设计》期刊2018年12期)

陆俊尧,李玲娟[5](2019)在《基于Spark的协同过滤算法并行化研究》一文中研究指出协同过滤算法在推荐系统中应用广泛。但是随着数据量的爆炸式增长,协同过滤算法所需的计算量也随之增长。针对传统的单机集中式计算已无法满足推荐系统的实时性和扩展性要求的问题,基于主流的大数据平台Spark在迭代计算以及内存计算方面的优势,设计了一种基于项目的协同过滤算法在Spark上的并行化方案。该方案利用RDD并行化计算的特点,通过合理设计RDD算子来实现对物品间相似度计算过程和评分计算过程的并行化,同时采用了RDD的缓存机制以及Spark中的广播变量来对一些重要的计算资源进行缓存与分发,从而提高计算速度。用MovieLens公开数据集对基于Spark平台的并行化Item-Based协同过滤算法的性能进行测试,结果表明该并行化协同过滤算法在准确性以及时效性方面均有较好的表现。(本文来源于《计算机技术与发展》期刊2019年01期)

李冲[6](2018)在《基于用户的协同过滤推荐算法MapReduce并行化实现》一文中研究指出基于用户的协同过滤推荐算法是应用范围广且应用效果较好的推荐算法之一。传统单机模式下运行的基于用户的协同过滤推荐算法在面对海量数据时存在严重的性能瓶颈问题,很难满足实际计算需求,而基于MapReduce的并行计算框架为解决该问题提供了新思路。MapReduce是Hadoop开源框架的核心计算编程模型,MapReduce的设计目标是方便编程人员在不熟悉分布式并行编程的情况下,可将自己的程序运行在分布式系统上。根据基于用户的协同过滤推荐算法特点,提出MapReduce并行化实现方法。实验结果表明,在MapReduce并行计算框架下实现的基于用户的协同过滤推荐算法在算法性能及稳定性方面都取得了理想效果。(本文来源于《软件导刊》期刊2018年10期)

肖成龙,王宁,王永贵[7](2019)在《融合社交网络与关键用户的并行协同过滤推荐算法》一文中研究指出为解决传统协同过滤推荐算法中存在的数据稀疏、冷启动以及推荐结果缺乏多样性等问题,提出一种融合社交网络与关键用户的协同过滤推荐算法。该算法在用户—项目评分矩阵基础上,融合用户社交网络信息得出社交信任矩阵,融合关键用户信息得出关键用户评分矩阵。利用叁大评分矩阵,分配不同的权重比例,共同来预测用户对于目标项目评分。针对海量数据问题,采用Spark分布式集群实现该算法的计算并行化。实验结果表明,该算法能够有效缓解数据稀疏问题,提高处理速度和推荐准确度。(本文来源于《计算机应用研究》期刊2019年10期)

顾军华,谢志坚,武君艳,许馨匀,张素琪[8](2019)在《基于图游走的并行协同过滤推荐算法》一文中研究指出针对目前协同过滤推荐算法存在的数据稀疏性问题和可扩展性问题,本文进行了相关研究。针对稀疏性问题,在传统的皮尔逊相关相似度中引入交占比系数计算用户间直接相似度,该方法缓解了用户间共同评分项的占比问题;提出一种基于图游走的间接相似度计算方法,该方法根据用户间的直接相似度建立用户网络图,在用户网络图上通过游走计算用户间的间接相似度,并进行推荐。在Spark平台上实现本文方法的并行化,缓解了数据规模增加带来的可扩展性问题。实验结果表明:本文提出的算法在不同数据集上均取得了良好效果,有效地提高了推荐准确度,并且在分布式环境下具有良好的可扩展性。(本文来源于《智能系统学报》期刊2019年04期)

曹霞,谢颖华[9](2018)在《基于Hadoop的协同过滤并行化算法》一文中研究指出在针对大数据的迅速增长,为了改善协同过滤算法的推荐效率,使得推荐精度越来越高,提出基于Hadoop平台的协同过滤并行化算法,将传统的基于用户的协同过滤在Hadoop平台下进行Map Reduce编程模型,实现并行化.通过利用Movie Lens公用数据集对改进前后的算法对比,验证了并行化的协同过滤效率更高,也更加适合大规模数据的推荐.(本文来源于《计算机系统应用》期刊2018年05期)

李嵩[10](2018)在《基于用户的协同过滤算法改进研究及并行化实现》一文中研究指出在众多推荐技术当中,协同过滤推荐算法以其良好的推荐效果和推荐性能成为众多推荐系统的核心算法。然而,传统的协同过滤算法仅通过用户评分数据进行分析计算,推荐精度较低。同时,现有研究多以单节点计算为主,面对海量数据,已不能满足可扩展性要求。因此针对算法推荐精度低与可扩展性差的问题,本研究对基于用户的协同过滤算法进行改进,并将改进算法基于Spark平台进行并行化的设计与实现,主要研究内容如下:1.提出了改进用户聚类的协同过滤算法。针对传统的协同过滤推荐算法仅通过评分数据进行分析计算,导致推荐精度较低的问题,根据用户对各项目类别的访问频率构建了用户的项目类别关注度模型,并从初始类中心选取与距离度量两方面改进模糊C均值聚类算法,在目标用户簇类内进行协同过滤推荐。实验结果表明,在近邻数取40,聚类个数为25时,该算法较传统的协同过滤算法平均绝对误差降低了3.41%。2.提出了融合用户兴趣因素的协同过滤算法。考虑到数据稀疏性与用户兴趣会随时间变化等问题,引入了矩阵填充与评分修正的数据预处理过程。针对改进用户聚类的协同过滤算法在相似度计算过程中没有充分考虑用户兴趣的问题,基于用户对项目类别的评分信息构建了用户间类别差异度模型,并以此改进传统的相似度计算,最终在改进的用户聚类的基础上,进行协同过滤推荐。实验结果表明,在同等聚类条件下,近邻个数取40时,该算法较基于改进用户聚类的协同过滤算法平均绝对误差降低了2.85%,说明该算法可以进一步提高推荐精度。3.设计了改进的基于用户的协同过滤算法的并行化实现方案。针对推荐系统的可扩展性问题,本研究按照算法处理流程,将结合用户聚类技术与用户兴趣因素改进的协同过滤算法划分为矩阵分片与评分修正填充、用户聚类、协同过滤推荐3个阶段,并针对每阶段任务对算法进行了并行化设计与实现。实验结果表明,在MovieLens-1m数据集下,4节点Spark集群上的算法运行时间比单节点减少了50.16%,证明基于Spark平台的算法并行化方案可以有效地解决系统的可扩展性问题。(本文来源于《西北农林科技大学》期刊2018-05-01)

并行过滤论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

协同过滤(CF)已经在推荐系统中得到了广泛的应用。但是随着用户和项目规模的增大,协同过滤算法的运行效率以及结果的正确性会大大降低。针对这一问题,文中提出了一种基于GPU的非负矩阵分解(NMF)的并行协同过滤方法,充分利用NMF数据降维和特征提取的优势以及CUDA的多核并行计算模式,进行维数简化和用户的相似性计算。该算法在提高精确性的同时降低了计算耗费,可以较好地解决协同过滤推荐系统所存在的稀疏性和扩展性等问题,快速产生精确的个性化推荐结果。基于NVIDIA CUDA设备和真实的MovieLens用户评分数据集,将所设计的并行NMF协同过滤算法与传统的基于用户的和基于物品的协同过滤算法进行了比较,实验结果表明,所设计的并行NMF协同过滤算法达到了较快的处理速度以及较高的推荐准确率。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

并行过滤论文参考文献

[1].鲍凯丽,刘其成,牟春晓.融合朴素贝叶斯和协同过滤的外卖推荐并行算法研究[J].计算机应用与软件.2019

[2].康林瑶,唐兵,夏艳敏,张黎.基于GPU加速和非负矩阵分解的并行协同过滤推荐算法[J].计算机科学.2019

[3].游思晴,周丽,赵东杰,薛菲.基于粒子群优化算法的协同过滤推荐并行化研究[J].北京邮电大学学报.2018

[4].李嵩,李书琴,刘斌.改进的协同过滤算法及其并行化实现[J].计算机工程与设计.2018

[5].陆俊尧,李玲娟.基于Spark的协同过滤算法并行化研究[J].计算机技术与发展.2019

[6].李冲.基于用户的协同过滤推荐算法MapReduce并行化实现[J].软件导刊.2018

[7].肖成龙,王宁,王永贵.融合社交网络与关键用户的并行协同过滤推荐算法[J].计算机应用研究.2019

[8].顾军华,谢志坚,武君艳,许馨匀,张素琪.基于图游走的并行协同过滤推荐算法[J].智能系统学报.2019

[9].曹霞,谢颖华.基于Hadoop的协同过滤并行化算法[J].计算机系统应用.2018

[10].李嵩.基于用户的协同过滤算法改进研究及并行化实现[D].西北农林科技大学.2018

标签:;  ;  ;  ;  

并行过滤论文-鲍凯丽,刘其成,牟春晓
下载Doc文档

猜你喜欢