论文摘要
聚类是模式识别、机器学习和图像处理等领域的重要研究内容。聚类分析已经成为聚类领域的研究热点,受到了国内外学者的广泛关注。其中,模糊聚类由于引进模糊集概念,能够有效处理现实中的模糊性问题,已经成为聚类分析中不可或缺的一部分。模糊C-均值聚类算法(Fuzzy C-Means,FCM)是模糊聚类最常用的实现算法之一。FCM算法设计简单,运行效率高,可以有效地处理大数据集,在模糊聚类算法中占据非常重要的地位,但是该算法在某些方面还存在一些欠缺,比如需要预先给定最佳聚类数、不同的模糊度m会导致不同的聚类数结果等缺陷。针对以上缺点,目前主要通过聚类有效性进行验证,以判断聚类结果的好坏。聚类有效性分析主要通过提出合适的聚类有效性指标,作为算法的判断依据,但是现有的聚类有效性指标大多数只能处理分离性较好的数据集,对于噪声污染以及多类型结构并存的数据集,无法有效地做出正确判断。因此,本文从多角度分析,寻找更加合适的聚类有效性指标,使得FCM算法能够在无人工干预的情况下,有效地处理不同结构类型的数据集。本文主要研究工作如下:(1)本文首先针对现有聚类有效性指标在含有噪声与重叠的数据集上无法有效判断最佳聚类数的缺陷,提出了一种新的聚类有效性指标,简称W指标。该指标从紧凑度、分离度、重叠度三个重要特征进行测量。其中,W指标的紧凑度使用数据子类两两之间的距离,分离度使用最小隶属度,重叠度使用两个类隶属度平方的乘积进行定义,从多个方面反映了数据集的分布情况,在一定程度上避免了噪声与重叠数据对聚类结果的干扰。实验结果表明,所提出的指标能够有效地对聚类结果进行评估,并能够克服噪声与重叠数据集的影响,准确地确定样本最佳聚类数。最后,在不同模糊度m下的鲁棒性测试实验中,W有效性指标展现出比较好的鲁棒性。(2)基于上述指标进一步深入研究,发现现有的大多数模糊聚类有效性指标一般过于依赖聚类质心,使得在含有紧邻类与小类的数据集上无法准确地进行判断。为了缓解这种问题,提出了WS聚类有效性指标。WS指标通过使用最大最小隶属度法则与数据集模糊偏差,在一定程度上改善了指标过于依赖聚类中心的缺陷,全面考虑了数据集的整体信息。WS指标不仅能够避免将紧邻类误判为同一类,同时不会忽略小类的存在,展现出比较好的准确性。实验结果表明,在包含紧邻类与大小、密度差异大的数据集上,WS指标能够在不同模糊度m下,准确地找到数据集的最佳聚类数,完成有效性聚类。(3)最后,将提出的WS指标与FCM图像分割算法相结合,提出一种灰度图像自动分割算法。实验结果表明,该算法能够准确地获取图像的最佳分割数,从而高效、快速地完成图像自动分割。
论文目录
文章来源
类型: 硕士论文
作者: 耿嘉艺
导师: 钱雪忠
关键词: 模糊均值聚类,聚类有效性指标,最佳聚类数,模糊度,图像分割
来源: 江南大学
年度: 2019
分类: 基础科学,信息科技
专业: 数学,计算机软件及计算机应用
单位: 江南大学
分类号: TP311.13;O159
总页数: 64
文件大小: 6831K
下载量: 164
相关论文文献
- [1].基于均匀抽样的二阶差分聚类数确定方法[J]. 计算机与现代化 2017(10)
- [2].一种社会经济系统模糊C划分聚类数的确定方法[J]. 统计与决策 2011(12)
- [3].一种新的最佳聚类数确定方法[J]. 电子技术应用 2013(01)
- [4].气象数据概化中的最佳聚类数研究[J]. 华中师范大学学报(自然科学版) 2008(03)
- [5].基于密度和最优聚类数的入侵检测方法[J]. 西南师范大学学报(自然科学版) 2018(12)
- [6].确定最佳聚类数的二阶差分统计法[J]. 安徽大学学报(自然科学版) 2017(02)
- [7].聚类数的自动确定[J]. 科技信息(科学教研) 2008(14)
- [8].基于可变聚类数k值的聚类算法在绩效考核中的应用[J]. 节能 2013(07)
- [9].SPSS两阶聚类法如何自动确定聚类数[J]. 中国卫生统计 2010(02)
- [10].一种引入参数无需确定聚类数的聚类算法[J]. 河北工业科技 2015(02)
- [11].基于泛化能力的K-均值最佳聚类数确定方法[J]. 计算机技术与发展 2017(09)
- [12].基于稳定性的三支聚类[J]. 南京大学学报(自然科学) 2019(04)
- [13].一种确定最佳聚类数的新算法[J]. 陕西师范大学学报(自然科学版) 2012(01)
- [14].一种基于类间距阈值的模糊聚类算法[J]. 计算机应用与软件 2008(09)
- [15].海量中文短信文本最佳聚类数研究[J]. 计算机工程 2010(08)
- [16].基于聚类数和初始值的K-means算法改进研究[J]. 组合机床与自动化加工技术 2011(04)
- [17].基于聚类数的评分矩阵恢复算法[J]. 计算机工程与应用 2015(21)
- [18].一种新的K-means最佳聚类数确定方法[J]. 现代计算机 2013(30)
- [19].基于K-means的最佳聚类数确定方法研究[J]. 电脑知识与技术 2014(01)
- [20].利用FCM求解最佳聚类数的算法[J]. 计算机工程与应用 2008(22)
- [21].优化加权多视角K-means聚类算法[J]. 计算机技术与发展 2019(03)
- [22].K-means聚类蚁群优化算法求解大型TSP问题[J]. 物流科技 2018(02)
- [23].一种基于密度的分布式聚类改进算法[J]. 微电子学与计算机 2018(05)
- [24].复杂经济系统FCM划分最佳聚类数的确定[J]. 计算机应用研究 2011(05)
- [25].基于微粒群算法的聚类算法改进[J]. 计算机技术与发展 2010(11)
- [26].面向WSN的聚类头选举与维护协议的研究综述[J]. 现代计算机(专业版) 2018(27)
- [27].K-means算法最佳聚类数评价指标研究[J]. 软件导刊 2017(11)
- [28].高效率的K-means最佳聚类数确定算法[J]. 计算机应用 2014(05)
- [29].基于特征关系的加权投票聚类集成研究[J]. 计算机工程与应用 2018(03)
- [30].一种启发式确定聚类数方法[J]. 小型微型计算机系统 2018(07)