基于密度的空间聚类论文-何选森,何帆

基于密度的空间聚类论文-何选森,何帆

导读:本文包含了基于密度的空间聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:欠定盲源分离,混合矩阵估计,单源点检测,镜像映射

基于密度的空间聚类论文文献综述

何选森,何帆[1](2019)在《密度空间与密度峰值聚类的欠定混合矩阵估计》一文中研究指出针对欠定盲源分离问题,提出了增强信号稀疏性的方法,并把具有噪声的基于密度空间聚类与寻找密度峰值聚类相结合用于估计混合矩阵。首先,把时域观测信号变换成时频域的稀疏信号,通过单源点检测突出信号的线性聚类特性,并采用镜像映射将线性聚类转变成致密聚类以便于进行密度基的聚类分析;然后,利用密度空间聚类搜寻密集数据堆中高密度的点和与之相应的邻域,以自动形成聚类簇的数量和初步聚类中心;最后,把获得的聚类数量作为密度峰值聚类的输入参数,在数据簇的范围内搜索其密度峰值以实现对聚类中心位置的进一步修正。以上方法不仅可提高混合矩阵的估计精度,而且估计量具有较高的一致性。(本文来源于《数据采集与处理》期刊2019年05期)

陈春涛,陈优广[2](2019)在《基于影响空间的稳健密度峰值聚类算法》一文中研究指出DP(Clustering by Fast Search and Find of Density Peaks)是一种新提出的基于局部密度和距离的聚类算法,具有能够发现任意形状的类簇、易于理解并且可以高效划分数据的优点。但是该算法无法处理单个类簇中同时存在多个密度峰值的情况,并且数据划分不稳定,容易导致连锁错误划分;当类簇间的密度差异较大时,其无法准确识别稀疏的类簇。为弥补以上不足,提出一种基于影响空间的稳健密度峰值聚类算法。该改进算法通过邻近数据计算局部密度,增强对小规模类簇的识别能力。为了提高数据划分的稳定性,引入了影响空间,并定义了一种新的对称关系,提出了一种新的分配策略。其通过计算目标数据与邻近数据的局部密度比值,并对影响空间进行加权,使算法能够处理具有多密度分布特征的数据。基于人工合成数据集和UCI数据集的模拟对比实验表明,提出的改进策略增强了算法对稀疏类簇的识别能力,提高了数据划分的稳定性,在NMI和Acc评价指标方面取得了较优的结果。(本文来源于《计算机科学》期刊2019年11期)

刘春桐,马世欣,王浩,汪洋,李洪才[3](2019)在《基于空间密度聚类的改进KRX高光谱异常检测》一文中研究指出高光谱遥感影像包含了丰富的光谱信息,对于地物具有极强的分辨能力,从而促进了不需任何先验信息的高光谱异常目标探测技术的发展。KRX(Kernel RX)异常探测算法巧妙地利用核函数将RX算法映射至高维特征空间,加强了光谱中非线性信息的运用,具有较强的可分辨性,显着改善了低维空间的光谱不可分问题。然而,也暴露了KRX算法中病态Gram矩阵求逆误差大,异常检测效率低等缺点。为实现理论上KRX算法的强探测性能,提出一种基于新型聚类方法的改进KRX探测算法(DC-KRX)。(1)由于空间邻域像元具有较强的光谱相似性,会造成Gram矩阵病态,严重影响了异常探测效果,因此背景虚检现象严重。针对病态Gram矩阵的求逆误差问题,算法改进了KRX算子,对Gram矩阵进行奇异值分解,选取特征值较大的主成分,保证了Gram矩阵的求逆精度,待测像元的探测结果采用l-2范数表示,检测效果提高明显;(2)在改进KRX的基础上,提出了空间聚类KRX算法。空间像元之间具有光谱强相关性,既造成了Gram矩阵的病态,数据的冗余也影响了探测效率。实验发现,通过聚类算法可以合并像元于聚类中心,减少空间维度,提高计算效率;同时,聚类中心按照聚类大小被赋予不同的权重,保证了探测精度;(3)另一方面,选用合适的聚类算法是一个难点。聚类KRX算法对于聚类算法的精度和实时性要求较高,比较发现,一种基于密度峰值快速搜索(DC)的新型聚类算法具有较好的聚类性能。算法采用欧式距离计算任意像元的相似度,利用局部密度和邻域距离作为聚类中心的联合判断准则,对结果进行排序得到聚类中心。实验发现,该聚类算法计算速度快,且能够对任意形状的分布进行聚类,非常适合于维度较高,成分复杂的高光谱图像,且适用于较高次数的重复聚类。DC-KRX算法提供了一种空间聚类预处理的高光谱异常探测新思路,最后,与国际主流探测算法对比发现,该算法表现了较好的探测性能。同时,时效性对比分析发现,聚类前后算法的检测效率提高了30%以上,有效改善了KRX算法的实时性。(本文来源于《光谱学与光谱分析》期刊2019年06期)

李卫华[4](2019)在《基于改进的密度空间聚类算法的网络恶意数据流检测策略》一文中研究指出本文提出了利用基于参考点的展开策略来改进现有的密度空间聚类算法,并利用改进后的聚类算法检测网络恶意数据流。为了验证其有效性,将该算法与K-Means进行对比,考察本文策略在聚类纯度、兰德指数和F值叁种指标下的表现。实验结果表明,与K-Means算法相比,本文策略具有较高的聚类准确性(即纯度、兰德指数和F值较高)。(本文来源于《遵义师范学院学报》期刊2019年02期)

周世波,徐维祥,徐良坤[5](2019)在《融合密度峰值和空间邻域信息的FCM聚类算法》一文中研究指出针对模糊C均值(FCM)算法聚类结果对初始中心点敏感以及聚类过程中没有考虑到不同密度样本点在聚类过程中影响力不同的缺陷,提出了一种密度峰值和样本点空间邻域信息优化的FCM算法。改进后的算法选择数据集中具有局部密度峰值的样本点或者局部密度较大的样本点作为初始聚类中心,充分考虑样本点邻域之间的关系,增加局部密度值大的样本点在聚类中心迭代计算过程中的影响力,从而达到优化FCM算法聚类效果的目的。理论分析和在人造数据集、加州大学欧文分校(UCI)机器学习数据库中真实数据上的实验结果表明,改进后算法的抗噪性、聚类效果和全局收敛能力均优于传统FCM算法。(本文来源于《仪器仪表学报》期刊2019年04期)

张辉,韩发,鹿方凯[6](2019)在《自适应局部密度变化空间聚类算法研究》一文中研究指出针对空间局部密度变化和需要用户输入参数的空间聚类问题,提出自适应局部密度变化的空间聚类方法。借助Delaunay叁角网构建空间邻近关系的优势,首先给出点密度的度量标准,即与点直接相连的边长度均值。将核点定义为一阶邻域中至少存在一个密度相似点,在此基础上应用广度优先搜索算法对一阶邻域进行搜索,对密度相似的核点进行扩展,将密度远小于核点密度的点作为簇的边界点。在判断点密度是否相似时,根据已加入核点的平均密度和密度变化率自动调整参数值。通过模拟实验,对比DBSCAN算法实验结果,对提出的算法进行验证。实验结果表明,该算法不仅能够自动适应局部密度变化和识别出离散点,而且能适应不同形态的空间簇。(本文来源于《软件导刊》期刊2019年01期)

伏家云,靖常峰,杜明义[7](2018)在《空间密度聚类模式挖掘方法DBSCAN研究回顾与进展》一文中研究指出针对DBSCAN方法存在的参数Eps和MinPts需要事先人为输入及对密度分布层次大的数据集聚类效果较差的局限性,该文对其进行了文献回顾,总结了国内外学者们的研究现状与发展,并比较分析了引用量较高方法的优点和不足,最后得出结论。对于参数确定的问题,现有学者提出了大致两种解决方法:(1)利用启发式方法;(2)与其他智能算法相结合。对于具有较大密度差数据集的适用问题,现有学者也提出了大致两种解决方法:(1)利用曲线斜率将数据集分层;(2)利用一定的规则将数据集网格化。(本文来源于《测绘科学》期刊2018年12期)

谭雯[8](2018)在《基于子空间与密度峰值的高维数据聚类算法研究》一文中研究指出随着当今计算机技术的飞速发展,数据的爆炸性增长使得从中发现有价值的信息变得越来越困难,原本在低维数据集上能够取得良好聚类效果的方法,由于受到“维灾”影响,无法在高维数据集上取得同样理想的结果,因此寻找更全面的聚类方法迫在眉睫。本文主要研究适用于高维数据集的聚类算法,首先介绍了数据挖掘中高维数据聚类的背景和意义,以及聚类算法的国内外发展现状;其次介绍了聚类的相关知识;在阅读大量文献的基础上,提出了现有算法的一些改进。主要工作如下:(1)总结了现有聚类算法的优缺点,尤其是子空间CLIQUE算法和密度峰值聚类算法DPC。CLIQUE算法中的等宽划分网格可能会丢掉部分聚类点,破坏密集区域的完整性;并且人为输入密度阈值具有随机性,很难确定合适阈值。DPC算法只能处理中小型数据集,而且区分不出异常点和聚类边界点。(2)提出自适应高维子空间聚类算法REG-CLIQUE,引入二叉树结合相对熵进行自适应网格划分,删除冗余维,提高聚类精度;提出密度阈值的计算公式,递归求得合适值,大大降低算法先验性。实验表明,REG-CLIQUE算法能够实现自适应聚类,且聚类时间及准确率都优于GP-CLIQUE算法和CLIQUE算法。(3)提出密度峰值聚类改进算法SREDPC,对高维大数据集进行抽样处理,使用残差平方提供一个比DPC算法更好的决策图来确定聚类中心;通过晕点识别区分出异常点和属于聚类簇的边界点。实验表明,改进算法能够应用于高维大数据集,在时间复杂度和聚类结果上也都优于原始DPC算法。(本文来源于《长沙理工大学》期刊2018-04-01)

苏适,李康平,严玉廷,陆海,汪新康[9](2018)在《基于密度空间聚类和引力搜索算法的居民负荷用电模式分类模型》一文中研究指出居民用户用电模式分类研究可为需求侧响应方案设计、负荷特性分析及其高精度预测提供支撑。首先,利用基于密度的空间聚类算法提取得到用户的典型用电模式;然后,考虑每天不同时段及季节变换对用户用电行为的影响,提取能够描述用户在不同时间尺度下用电行为的6个特征;在此基础上,提出了一种基于引力搜索算法的用户用电模式分类模型;最后,对实测居民用电数据进行聚类,并对各类用户的用电模式及其参与需求侧响应的潜力进行了分析。(本文来源于《电力自动化设备》期刊2018年01期)

何云斌,王霄,万静,李松[10](2017)在《障碍空间中基于密度的不确定数据聚类算法》一文中研究指出为解决传统聚类算法无法有效处理障碍空间中不确定数据的问题,本文提出了障碍空间中基于密度的不确定聚类算法解决此类问题.本文第一步利用叁角模糊数和R树的性质提出TF-Initialseeds算法来解决数据的不确定性问题.在基于密度聚类方法的基础上,本文第二步,利用Voronoi图剪枝策略可以有效减少计算量的特性,提出了障碍不确定密度聚类算法VPSDBSCAN.最后结合第一步与第二步算法提出了TVDBSCAN算法,用于处理障碍空间中的不确定数据.实验分析表明TVDBSCAN算法在处理障碍不确定数据时具有更高的效率,得到更好的聚类结果.(本文来源于《小型微型计算机系统》期刊2017年12期)

基于密度的空间聚类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

DP(Clustering by Fast Search and Find of Density Peaks)是一种新提出的基于局部密度和距离的聚类算法,具有能够发现任意形状的类簇、易于理解并且可以高效划分数据的优点。但是该算法无法处理单个类簇中同时存在多个密度峰值的情况,并且数据划分不稳定,容易导致连锁错误划分;当类簇间的密度差异较大时,其无法准确识别稀疏的类簇。为弥补以上不足,提出一种基于影响空间的稳健密度峰值聚类算法。该改进算法通过邻近数据计算局部密度,增强对小规模类簇的识别能力。为了提高数据划分的稳定性,引入了影响空间,并定义了一种新的对称关系,提出了一种新的分配策略。其通过计算目标数据与邻近数据的局部密度比值,并对影响空间进行加权,使算法能够处理具有多密度分布特征的数据。基于人工合成数据集和UCI数据集的模拟对比实验表明,提出的改进策略增强了算法对稀疏类簇的识别能力,提高了数据划分的稳定性,在NMI和Acc评价指标方面取得了较优的结果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

基于密度的空间聚类论文参考文献

[1].何选森,何帆.密度空间与密度峰值聚类的欠定混合矩阵估计[J].数据采集与处理.2019

[2].陈春涛,陈优广.基于影响空间的稳健密度峰值聚类算法[J].计算机科学.2019

[3].刘春桐,马世欣,王浩,汪洋,李洪才.基于空间密度聚类的改进KRX高光谱异常检测[J].光谱学与光谱分析.2019

[4].李卫华.基于改进的密度空间聚类算法的网络恶意数据流检测策略[J].遵义师范学院学报.2019

[5].周世波,徐维祥,徐良坤.融合密度峰值和空间邻域信息的FCM聚类算法[J].仪器仪表学报.2019

[6].张辉,韩发,鹿方凯.自适应局部密度变化空间聚类算法研究[J].软件导刊.2019

[7].伏家云,靖常峰,杜明义.空间密度聚类模式挖掘方法DBSCAN研究回顾与进展[J].测绘科学.2018

[8].谭雯.基于子空间与密度峰值的高维数据聚类算法研究[D].长沙理工大学.2018

[9].苏适,李康平,严玉廷,陆海,汪新康.基于密度空间聚类和引力搜索算法的居民负荷用电模式分类模型[J].电力自动化设备.2018

[10].何云斌,王霄,万静,李松.障碍空间中基于密度的不确定数据聚类算法[J].小型微型计算机系统.2017

标签:;  ;  ;  ;  

基于密度的空间聚类论文-何选森,何帆
下载Doc文档

猜你喜欢