中心点算法论文_胡本固,戴牡红

导读:本文包含了中心点算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:中心点,算法,相异,密度,类中,模糊,统计法。

中心点算法论文文献综述

胡本固,戴牡红[1](2019)在《多中心点增量式模糊聚类算法》一文中研究指出增量聚类算法可以解决数据量大、内存不足的问题.传统的增量式模糊聚类(incremental multiple medoids based fuzzy clustering, IMMFC)算法只为每个数据块选择一个或多个相同数目的中心,当聚类中的对象权重较小时聚类效果不好.该文提出新的增量式模糊聚类算法用于处理大数据集.首先将大数据集分成多个小的数据块,并对每个小的数据块进行模糊聚类;然后从每个小数据块的每个簇群中选择目标中心点,中心点的个数是簇群中对象的权重之和大于阈值的最少对象数.最后合并所有选定的中心点,并对最终数据块进行模糊聚类,获取最终的中心点.实验结果表明,与IMMFC算法相比,当数据块占总数据的10%以上时,所提算法优于IMMFC.(本文来源于《应用科学学报》期刊2019年06期)

杨文君[2](2019)在《k_m eans算法初始聚类中心点选取方法研究》一文中研究指出针对k_means算法对初始聚类中心的依赖性,从不同的角度分析了几种不同的初始聚类中心的选取方法,并分析了几种方法的优缺点。(本文来源于《科学技术创新》期刊2019年33期)

韩冰[3](2019)在《非独立同分布下的K中心点算法研究》一文中研究指出随着科技的不断发展,数据挖掘成为当下帮助用户从大量的数据中提取出有效信息的重要手段,与此同时,作为数据挖掘中重要分支的聚类分析也越来越受到各方面的关注。K-中心点算法是聚类分析中具有代表性的算法之一,克服了K-均值算法对于孤立点较为敏感的缺点,具有较强的鲁棒性,但是K-中心点算法仍在某些方面存在缺陷,例如,算法中的相似性度量大多采用距离的度量方式,这种方式均假设数据对象及属性之间是独立同分布的,但实际情况中,数据对象及属性之间是非独立同分布的,因此,K-中心点算法的相似性度量方式有待改进;除此之外,K-中心点算法本身时间复杂度较大,初始中心点的选取对算法而言尤为重要。为提高算法的聚类效果与运行效率,本文对此进行了如下改进:针对K-中心点算法的度量方式为假设数据对象及属性之间是独立同分布的缺点,本文引入了无监督学习中的名义耦合相似性计算方法,用非独立同分布计算公式对传统欧氏距离计算相似度方法进行了替换,同时,由于此公式主要计算依据为属性值的频率,但数值型数据对于频率并不敏感,因此,针对数值型数据,本文在引入公式之前,将数值型数据按属性列根据欧氏距离进行聚类与替换,设计了NI-PAM算法,使聚类效果更佳。针对NI-PAM算法初始中心点采用随机选取方式的缺陷,本文利用邻域半径来优化初始中心点的选择,根据数据对象之间的非独立同分布相似度,建立相似度矩阵,遍历矩阵,统计每一个数据对象在邻域半径内所包含其他数据对象的数量,将包含量最多的对象选为第一个初始点,然后在相似度矩阵中将此对象邻域半径内包含对象互相之间的相似度均归零,重新遍历矩阵,依次类推,直到选出k个中心点,优化后的算法提高了NI-PAM算法的运算效率。在以上改进中,提高了算法的正确率,并通过优化初始中心点提高了NI-PAM算法的运行时间,但由于引入公式的计算较为复杂,时间效率还有待提高,因此,本文重新引入了数值型数据耦合相似性计算公式,并对皮尔森相关性系数替换为了斯皮尔曼等级相关系数,设计了N-NI-PAM算法,实验证明,算法的正确率也得到了很大提高,并且运行时间大大减少。改进后的算法在UCI数据集上进行了验证,实验验证表明,NI-PAM算法与N-NI-PAM算法正确率较之欧氏距离下的K-中心点算法均得到了很大提高,且N-NI-PAM算法具有较好的运算效率。(本文来源于《齐鲁工业大学》期刊2019-05-31)

韩冰,姜合[4](2019)在《基于相似度计算公式改进的K-中心点算法》一文中研究指出在传统K-中心点聚类算法中,相似性一般仅仅用距离来进行度量,这种度量方法均基于对象属性之间是独立同分布的,但大多数真实数据对象属性之间都相关联的,因此,本文将引用非独立同分布计算公式,对传统距离计算相似度方法进行替换。同时,由于此公式会依据属性值的频率来进行计算,但数值型数据对于频率并不敏感,因此,本文在引入公式之前,将数值型数据按属性列进行聚类与替换。实验结果表明,本文方法可以提高算法的聚类精度。(本文来源于《计算机与现代化》期刊2019年05期)

段桂芹,邹臣嵩,刘锋[5](2019)在《基于优化初始聚类中心的K中心点算法》一文中研究指出针对K中心点算法的初始聚类中心可能过于临近、代表性不足、稳定性差等问题,提出一种改进的K中心点算法。将样本集间的平均距离与样本间的平均距离的比值作为样本的密度参数,精简了高密度点集合中候选代表点的数量,采用最大距离乘积法选择密度较大且距离较远的K个样本作为初始聚类中心,兼顾聚类中心的代表性和分散性。在UCI数据集上的实验结果表明,与传统K中心点算法和其他2种改进聚类算法相比,新提出的算法不仅聚类结果更加准确,同时也具有更快的收敛速度和更高的稳定性。(本文来源于《计算机与现代化》期刊2019年04期)

段桂芹,刘锋,邹臣嵩[6](2019)在《改进K中心点聚类算法在成绩评价中的应用》一文中研究指出针对K-means聚类算法在成绩评价中存在的稳定性低,聚类数难确定的问题,提出了一种改进K中心点聚类算法,将样本集与样本的各自平均距离比值作为样本的密度参数,采用最大距离乘积法选择密度较大且距离较远的k个样本作为初始聚类中心,在此基础上,结合聚类评价指标DB设计了聚类质量评价模型。通过对某高校学生成绩的聚类分析结果表明:该模型能够准确地给出聚类数k,有效地挖掘出学生多门课程成绩的分布情况,可以为个性化教学的实施提供一种新的解决方案。(本文来源于《信息技术》期刊2019年03期)

张文明,闫保山[7](2018)在《一种线激光V形焊缝中心点识别的改进算法》一文中研究指出在机器人自动化焊接过程中,准确识别、提取出焊缝位置,对于焊接的精度与质量有着很大的影响。基于线激光的V形焊缝轮廓识别算法,在进行阈值分割时,有时由于线激光与V形焊缝接触时会产生激光的变形,导致局部光强下降,部分轮廓会消失。提出一种改进算法,首先通过双边滤波方法,达到图像平滑的目的;然后通过Canny边缘检测算法,准确地提取出线激光在焊缝上变形的区域;通过膨胀算法处理后,再去除焊缝轮廓留下的干扰直线;再通过直线细化算法,识别出与线激光相交的焊缝边缘轮廓点与中心点。最后识别出焊缝中心点位置。(本文来源于《焊接》期刊2018年12期)

文武,李培强[8](2018)在《基于K中心点和粗糙集的KNN分类算法》一文中研究指出为有效解决KNN算法在文本分类时效率随着数据规模的增大而降低这一问题,提出基于K中心点(K-Medoids)和粗糙集(rough set)的KNN分类方法 (KRS-KNN)。通过K中心点算法对文本数据集进行聚合,形成类簇,计算簇心和其它样本点的相异度,将相异度大于最后簇心相异度的样本剔除,运用粗糙集理论对得到的每个类簇进行分割,通过上、下作差得到的边界样本,通过KNN算法确定其最终类别。实验结果表明,文本数据的计算规模得到了降低,提高了文本数据的分类效率。(本文来源于《计算机工程与设计》期刊2018年11期)

徐常森[9](2018)在《基于K-中心点聚类算法的岩体结构面试样代表性取样方法研究》一文中研究指出研究表明,天然岩体内部发育着方向、规模、形态不一的结构面。岩体的失稳往往是岩体沿着内部的结构面破坏,故对岩体结构面力学性质的研究逐渐成为国内外学者研究的热点。由于岩体结构面本身存在尺寸效应,需要利用岩体结构面统计方法在大尺寸结构面上获取若干不同尺度的小尺寸结构面试样进行实验分析。但在实际的实验过程中,往往会面临大量的小尺寸结构面试样,若能从结构面试样中选取少量具有代表性的试样进行实验,将会极大降低实验的人力、物力。因此,对岩体结构面试样代表性取样方法的研究很有必要。此外,岩体结构面统计方法是岩体结构面试样代表性取样的原始数据获取方法,对代表性取样的结果有着重要影响。同时,岩体结构面粗糙度系数值(JRC)作为JRC-JCS模型中的重要参数,决定着岩体结构面抗剪强度值,是评价结构面统计效果、岩体结构面试样代表性取样结果是否合理的重要评价指标。由于本论文获取的轮廓曲线形貌信息数据矩阵数据点间隔具有不可控性,而目前传统JRC参数公式往往只适应特定的采样间距值。因此无法准确计算各结构面轮廓曲线的JRC值。故在对结构面试样代表性取样进行研究之前,需先对现有结构面统计方法进行分析,选取一种科学的结构面统计方法,并建立一种适合多种采样间距值的JRC计算模型。鉴于此,本论文开展了以下研究工作:(1)通过分析目前主流的岩体结构面统计方法的优缺点,选择统计效果较优的推迭统计法作为岩体结构面试样代表性取样的原始样本数据的获取方法。并基于MATLAB程序平台编写了推迭统计法的统计程序,提高工作效率。同时在基于与传统JRC参数公式对推迭取样法参数敏感性及合理性进行分析时,发现传统JRC参数公式在计算轮廓曲线JRC值无法适应采样间距值发生变化。由于本文通过对轮廓曲线高清扫描图进行数字化处理获取的轮库曲线形貌信息数据矩阵的数据步长,即采样间距值具有不可控性,导致传统的JRC参数公式无法准确计算轮廓曲线样本的JRC值。这将为后续研究造成阻碍,因此需要建立一种适用于各种采样间距值的JRC计算模型。(2)建立多种采样间距值的JRC自适应模型。传统JRC参数公式值只适应与特定的采样间距值,无法准确计算本论文获取的轮廓曲线样本的JRC值。鉴于此,通过分析Barton提出的10条标准粗糙度轮廓曲线Z_2与?x之间的变化关系,拟合出Z_2值差值的平均值(?)关于?x之间的自适应函数。利用自适应函数对JRC-Z_2参数公式进行修正,并在此基础上进一步进行偏移、旋转修正,从而建立适用多种采样间距值的JRC自适应模型。经验证,当?x在一定范围内变化时,该模型仍能保证计算精度。最后,利用该模型计算各样本与轮廓曲线整体的JRC计算值,通过比较两者之间的误差随参数值d、?d的变化关系,分析了推迭取样法的参数敏感性及合理性。(3)提出基于K-中心点聚类算法的岩体结构面试样代表性取样方法。利用简易纵剖面仪获取均匀覆盖在结构面上的若干轮廓曲线,并利用工程扫描仪获取其高清扫描图。在对图像进行数字化处理之后,采用推迭统计法对各轮廓曲线进行统计,获取结构面试样代表性取样研究的原始数据。计算各样本轮廓曲线Z_2、(Rp-1)值,并对其进行统计分析。考虑Z_2与(Rp-1)之间的数值大小关系,采用Z_2、(Rp-1)的无量纲值Z_2~′、(Rp-1)~′作为各样本轮廓曲线的特征值。之后对样本集进行K-中心点聚类,并找到聚类中心对应的轮廓曲线作为样本集的代表性轮廓曲线。经验证,基于K-中心点聚类算法的岩体结构面试样代表性取样所获取的代表性轮廓曲线的特征值均值与JRC均值与样本总体的特征值均值和JRC均值的误差随着K值的增大,逐渐稳定在5%以内。在K大于一定值后,该方法获取的代表性试样的代表性强度及该方法的合理性均能满足要求。(本文来源于《绍兴文理学院》期刊2018-11-01)

侯文静[10](2018)在《基于K中心点算法的图像聚类应用研究》一文中研究指出在如今信息高度膨胀的社会,数字图像信息也迅猛增加,怎样在海量的图像数据中进行高效地查询和处理,并获得有价值的数据信息至关重要。因此,图像数据挖掘也就应时而生,成为诸多学者炙手可热的话题。将潜在的有用知识从海量数据中挖掘出来的过程就是数据挖掘,其中它的主要研究内容包括聚类分析,聚类分析通过无监督学习的方法将具有相似特征的数据划为一类,使同一类内数据之间的相似度高,类间数据的相似度低。而图像聚类则是将图像当作目标数据来聚类,使得相似度高的图像归为一类,继而提高图像的管理和检索性能。K中心点算法作为传统的聚类算法凭借着其原理简单、执行效率高且对“噪声”不敏感等优点被广泛应用,但K中心点算法要在执行算法前对K值和初始质心进行初始化,并且不易跳出局部最优。针对这些缺陷,诸多学者对K中心点算法进行改进,将其与群体智能仿生算法进行结合,对K中心点算法的性能进行优化。本文首先改进猫群算法;之后将改进的猫群算法与K中心点算法进行结合,从而使K中心点算法不再随机选择初始质心,可以在指定质心下进行聚类;最后将结合后的算法应用在图像聚类上。主要工作如下:(1)介绍K中心点算法的基本概念、算法流程、特点;介绍猫群算法的两种模式以及特点;简单叙述图像聚类的基本理论。(2)改进猫群算法的速度-位移公式。通过增加动态惯性权重使猫群朝着最优解的方向趋近。同时为了避免“早熟”,提高算法的收敛性,将固定值mr修改为基于动态混合比率的比例公式,使猫群算法更趋向于全局最优。(3)将K中心点算法与改进后的猫群算法相结合,从而解决K中心点算法不易跳出局部最优的局限性以及选取初始质心的随机性。(4)对图像进行操作,包括彩色图像灰度化、特征提取、图像增强等。并将基于改进猫群算法的K中心点聚类在图像上进行应用,经实验证明该算法的可行性。由实验可知,对猫群算法进行改进后不仅具有良好的稳定性和较好的收敛性,同时结合K中心点算法后提高了对数据集聚类的准确性;最后在图像上得到应用,证明该算法可行。(本文来源于《西北师范大学》期刊2018-05-01)

中心点算法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对k_means算法对初始聚类中心的依赖性,从不同的角度分析了几种不同的初始聚类中心的选取方法,并分析了几种方法的优缺点。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

中心点算法论文参考文献

[1].胡本固,戴牡红.多中心点增量式模糊聚类算法[J].应用科学学报.2019

[2].杨文君.k_means算法初始聚类中心点选取方法研究[J].科学技术创新.2019

[3].韩冰.非独立同分布下的K中心点算法研究[D].齐鲁工业大学.2019

[4].韩冰,姜合.基于相似度计算公式改进的K-中心点算法[J].计算机与现代化.2019

[5].段桂芹,邹臣嵩,刘锋.基于优化初始聚类中心的K中心点算法[J].计算机与现代化.2019

[6].段桂芹,刘锋,邹臣嵩.改进K中心点聚类算法在成绩评价中的应用[J].信息技术.2019

[7].张文明,闫保山.一种线激光V形焊缝中心点识别的改进算法[J].焊接.2018

[8].文武,李培强.基于K中心点和粗糙集的KNN分类算法[J].计算机工程与设计.2018

[9].徐常森.基于K-中心点聚类算法的岩体结构面试样代表性取样方法研究[D].绍兴文理学院.2018

[10].侯文静.基于K中心点算法的图像聚类应用研究[D].西北师范大学.2018

论文知识图

具有自适应精度控制功能的通用坐标转...指纹奇异点示意图,红色为中心点区域...算法偏移距离比较原始基因表达数据和模拟基因表达数据...六次范围搜索原理图(黑色实心圆为激光...不连续地表的处理方法

标签:;  ;  ;  ;  ;  ;  ;  

中心点算法论文_胡本固,戴牡红
下载Doc文档

猜你喜欢