聚类算法论文_王俊丰,贾晓霞,李志强

导读:本文包含了聚类算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:算法,数据,多维,邻域,均值,数据挖掘,模糊。

聚类算法论文文献综述

王俊丰,贾晓霞,李志强[1](2019)在《基于K-means算法改进的短文本聚类研究与实现》一文中研究指出文中讨论在文本类目数未知的情况下,如何对数据量过少的短文本进行有效聚类的问题。短文本的特点是每一份样本文章数据少,数据稀疏,用常规的聚类方法进行文本聚类不能取得很好的效果。文中提出了一种基于K-means的改进算法,提出一种简单降维方式和新的判别样本点距离的方法,经实验验证,文中改进算法比原K-means算法有更高的准确性。(本文来源于《信息技术》期刊2019年12期)

项睿,吴华玲,李琳,张立[2](2019)在《基于K-Means聚类算法的股票技术指标分析》一文中研究指出将数据挖掘技术与股票技术分析相结合,在使用K-Means聚类算法的基础上,将乖离率BIAS与相对强弱指标RSI进行技术指标迭加,建立模型对未来股价波动趋势进行预测,并对上证A股中的1410支股票进行实证分析来验证模型准确性,提出了该模型日后的改进研究方向。(本文来源于《电脑编程技巧与维护》期刊2019年12期)

汪丽娟,钱育蓉,侯海耀,张晗,赵京霞[3](2019)在《基于k-d树分区的聚类算法并行加速策略》一文中研究指出针对传统K-Means算法存在准确率低、聚类速度慢的问题,从K-Means算法优化和Flink框架并行层面对K-Means算法优化。为避免算法陷入局部最优解,采用质心间最大距离原则选出k个质心;为提高大数据量下的K-Means聚类速度,提出用k-d树算法划分数据集实现操作算子并行化,设置多个TaskManager数目和CPU核数加速F-KMeans算法的执行。实验结果表明,较K-Means算法,F-KMeans算法的准确率提高了约3.6%;F-KMeans算法在DataSource耗时降低了45.45%,在其余阶段耗时平均降低了约28.57%。(本文来源于《计算机工程与设计》期刊2019年12期)

马翩翩,张新刚,梁晶晶[4](2019)在《基于萤火虫算法的近邻传播聚类研究》一文中研究指出针对近邻传播聚类(AP)中偏向参数和阻尼因子对聚类效果的影响,将偏向参数和阻尼因子作为萤火虫算法中的亮度和吸引度,通过群体智能算法在搜索空间中寻找偏向参数和阻尼因子,从而提高AP算法的聚类质量。实验表明,该算法能提高聚类质量。(本文来源于《网络安全技术与应用》期刊2019年12期)

赵燕伟,朱芬,桂方志,任设东,谢智伟[5](2019)在《融合可拓关联函数的密度峰值聚类算法》一文中研究指出针对传统密度峰值聚类算法(Clustering by fast search and find of density peaks,CFSFDP)簇心选择不佳、非簇心点分配不准确导致的聚类效果差问题,提出一种融合可拓关联函数的密度峰值聚类算法,通过引入平均差异度衡量样本密度选取簇心;基于k邻域思想提出雏形簇概念并建立物元模式下的节域和经典域;利用可拓关联函数定量衡量未分配点相对各雏形簇的隶属程度,从而实现精准聚类.将该算法和其他几种聚类算法在人工数据集和UCI标准数据集上分别进行对比实验,实验结果表明本文算法对任意形状任意密度数据集的聚类效果更好,优于其他算法.(本文来源于《小型微型计算机系统》期刊2019年12期)

陈鹏,程思,鲍婷婷,翟伶俐,王宏斌[6](2019)在《基于二分K均值聚类算法的数字档案优化》一文中研究指出精细化预报服务和气象能源开发等需要时间序列长、空间和时间分辨率更高的气象资料,对逐小时资料的需求尤为突出。现存历史气象资料进行数字化扫描之后存在污点、褪色、模糊、字迹洇透等问题,不符合档案归档和服务的要求、同时也造成对图像进行数值提取的难度大大增加,提取结果的准确性也难以保证。本文提出一种基于K均值的图像优化算法,能够快速识别和区分图像背景和数据记录曲线,过滤图像中的噪点,统一数据记录曲线的颜色和粗细。经过优化之后的图像对比度和清晰度明显增加,体积明显缩小,实际应用中发现,经过优化之后的图像节约了存储资源和成本,同时清晰度有明显地提高,结果表明基于K均值的优化方法明显提高了气象数字化档案的质量和应用效果。(本文来源于《气象科技》期刊2019年06期)

宗春梅,武剑飞,郝耀军,董晓红[7](2019)在《基于K-means聚类算法的中学混合式教学行为研究》一文中研究指出为了研究中学混合式教学的效果,使用Python语言对K-means算法模型进行实现及改进,并在此基础上建立了成绩分析的基本模型。首先对Iris数据集的相关属性进行分析,进而发现不同类的属性差别,其后将这种差别用名为"权值"的量体现出来,并将权值加入了聚类计算过程,实现了K-means算法的改进。接着以Iris数据集为对象进行了测试。实验结果表明所建模型对Iris数据集聚类的准确率提升到了96%以上,且聚类结果相对稳定并且运行时间明显降低。最后使用改进后的K-means算法模型对成绩数据做信息挖掘,给相关中学教学实施者带来客观的指导性意见,从而使数据挖掘起到教学辅助的作用。(本文来源于《教育与装备研究》期刊2019年12期)

杨晓文,苏明辉,韩燮[8](2019)在《基于持久性聚类的波核分割算法》一文中研究指出叁维物体的分割是叁维形状分析的重要过程。为了使分割结果适应多种模型,提高分割速度等,提出多尺度等距不变的波核函数与持久性聚类相结合的网格分割算法。首先计算波核特征函数,进而利用持久性聚类产生持久性图,最后选定合并阈值,产生分割结果。利用该算法的分割结果可通过持久性图提供准确的反馈。大量实验结果表明,文中算法对模型细微处分割具有一定的优越性,在普林斯顿大学提供的分割标准下,整体分割算法优于多数无监督分割。(本文来源于《现代电子技术》期刊2019年23期)

宋鹏[9](2019)在《基于大数据挖掘的多维数据去重聚类算法分析》一文中研究指出数据产生的渠道越来越多,速度越来越快,大量的数据为数据分析和处理带来了较大的难度,云平台中的数据种类和规模也在不断扩大,超大的数据规模给数据的存储、管理、分析等带来了前所未有的挑战。数据量剧增会导致数据的可靠性不足,如何有效地处理数据之间的关系,降低冗余数据,建立多维数据去重聚类模型是业界共同努力的方向。文中最先介绍了在大数据挖掘下的多维聚类算法,通过分析大数据内部之间的关系,建立一种适合大数据处理的多维数据去重聚类算法分析模型,对该算法进行改进和实验分析,得到该算法在采样时所存在的复杂度较低,数据分析的结果准确,有利于实现数据的分析和处理,减少数据的冗余,增加数据分析的效率,具有良好的判定效果。(本文来源于《现代电子技术》期刊2019年23期)

胡本固,戴牡红[10](2019)在《多中心点增量式模糊聚类算法》一文中研究指出增量聚类算法可以解决数据量大、内存不足的问题.传统的增量式模糊聚类(incremental multiple medoids based fuzzy clustering, IMMFC)算法只为每个数据块选择一个或多个相同数目的中心,当聚类中的对象权重较小时聚类效果不好.该文提出新的增量式模糊聚类算法用于处理大数据集.首先将大数据集分成多个小的数据块,并对每个小的数据块进行模糊聚类;然后从每个小数据块的每个簇群中选择目标中心点,中心点的个数是簇群中对象的权重之和大于阈值的最少对象数.最后合并所有选定的中心点,并对最终数据块进行模糊聚类,获取最终的中心点.实验结果表明,与IMMFC算法相比,当数据块占总数据的10%以上时,所提算法优于IMMFC.(本文来源于《应用科学学报》期刊2019年06期)

聚类算法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

将数据挖掘技术与股票技术分析相结合,在使用K-Means聚类算法的基础上,将乖离率BIAS与相对强弱指标RSI进行技术指标迭加,建立模型对未来股价波动趋势进行预测,并对上证A股中的1410支股票进行实证分析来验证模型准确性,提出了该模型日后的改进研究方向。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

聚类算法论文参考文献

[1].王俊丰,贾晓霞,李志强.基于K-means算法改进的短文本聚类研究与实现[J].信息技术.2019

[2].项睿,吴华玲,李琳,张立.基于K-Means聚类算法的股票技术指标分析[J].电脑编程技巧与维护.2019

[3].汪丽娟,钱育蓉,侯海耀,张晗,赵京霞.基于k-d树分区的聚类算法并行加速策略[J].计算机工程与设计.2019

[4].马翩翩,张新刚,梁晶晶.基于萤火虫算法的近邻传播聚类研究[J].网络安全技术与应用.2019

[5].赵燕伟,朱芬,桂方志,任设东,谢智伟.融合可拓关联函数的密度峰值聚类算法[J].小型微型计算机系统.2019

[6].陈鹏,程思,鲍婷婷,翟伶俐,王宏斌.基于二分K均值聚类算法的数字档案优化[J].气象科技.2019

[7].宗春梅,武剑飞,郝耀军,董晓红.基于K-means聚类算法的中学混合式教学行为研究[J].教育与装备研究.2019

[8].杨晓文,苏明辉,韩燮.基于持久性聚类的波核分割算法[J].现代电子技术.2019

[9].宋鹏.基于大数据挖掘的多维数据去重聚类算法分析[J].现代电子技术.2019

[10].胡本固,戴牡红.多中心点增量式模糊聚类算法[J].应用科学学报.2019

论文知识图

本文算法的识别性能包含8000个数据样本集包含9000个(1000个噪声数据)数据样...算法产生的结果随机初始化方式在Zoo数据集上的聚类准...随机初始化方式在CreditApproval数据...

标签:;  ;  ;  ;  ;  ;  ;  

聚类算法论文_王俊丰,贾晓霞,李志强
下载Doc文档

猜你喜欢