导读:本文包含了数据聚类论文开题报告文献综述、选题提纲参考文献,主要关键词:数据,算法,多维,成分,拉普拉斯,方法,热点。
数据聚类论文文献综述写法
张莹梅,杨耿煌,李明林,路光达[1](2019)在《低压台区变压器用电数据聚类模型研究》一文中研究指出针对低压台区变压器端采集的电力数据量庞大、用电信息维度高导致分析困难、原始数据很难为电力用户用电研究提供数据依据的问题,提出了一种基于NCA的低压台区变压器用电数据的聚类模型。该模型能够实现对台区变压器端采集的原始用电信息进行NCA特征选择,剔除冗余信息,并在此基础上对核心指标数据聚类分析,再通过戴维森堡丁指数评判聚类算法质量。以某市郊区台区实际电力运行数据为例,验证了所提模型的有效性。在不改变电力原始数据的基础上,为研究台区电力数据和用电行为提供参考。(本文来源于《天津职业技术师范大学学报》期刊2019年04期)
薛潇[2](2019)在《船舶水下通信系统中海声信道文本数据聚类方法研究》一文中研究指出传统的文本数据聚类方法性能较差,无法得到最优的聚类原型。为了解决这个问题,提出船舶水下通信系统中海声信道文本数据聚类方法研究。首先处理在船舶水下通信系统中选取的海声信道文本数据,在应用聚类定义,分解文本数据相异度矩阵,为统一变量度量值,应用绝对偏差均值公式进行标准化处理,在此基础上,对海声信道文本数据进行聚类,由此,完成海声信道文本数据聚类方法的设计。在实验中,随机选取10组文本数据相异度矩阵,通过对比2种方法的性能,验证所提方法的可行性。实验结果表明,所提方法性能更好,更占优势。(本文来源于《舰船科学技术》期刊2019年20期)
张苏宁,王月娟,吴水明,景栋盛[3](2019)在《基于Krylov子空间方法的网络入侵数据聚类》一文中研究指出网络信息安全中的数据具有维数高、规模复杂等特性。网络入侵检测需要对网络入侵信息进行合理的分析,筛选出危险的带有攻击性的行为。随着数据维数的不断升高,传统的基于距离的聚类分析方法不再适用。针对此,本文提出一种基于Krylov子空间方法的高维数据聚类分析算法,首先将高维数据投影到低维空间,实现数据的降维,再用基于遗传算法的K-means算法在低维空间中进行数据的聚类,避免了数据属性的丢失,同时也提高了高维数据聚类分析的效率。最后,使用KDD Cup 99数据进行实验,实验验证了方法的有效性和精确性。(本文来源于《计算机与现代化》期刊2019年10期)
邓林峰,张爱华,赵荣珍[4](2019)在《集成多策略改进FCM算法的旋转机械故障数据聚类分析研究》一文中研究指出针对旋转机械故障数据聚类分析中的初始聚类中心不确定和孤立点敏感问题,提出了一种集成多策略改进的模糊C均值(FCM)聚类方法。首先以故障数据集的决策属性为等价关系对数据集进行划分,得到若干个由等价关系导出的等价类;然后以每个等价类为可行域,采用均值漂移方法搜索故障数据类中心;最后以搜索到的类中心为FCM算法的初始聚类中心,通过核技术计算故障数据样本与相应类中心在高维特征空间中的欧氏距离,从而实现数据样本相似性的有效度量,并完成故障数据的模糊聚类。通过标准数据集和旋转机械故障数据集对方法的性能进行了验证及比较分析。结果显示,改进FCM算法的聚类性能相比传统FCM算法的聚类性能得到了明显提升,在收敛速度和聚类准确性两个性能指标上,改进的FCM算法比FCM算法具有显着优势。(本文来源于《振动工程学报》期刊2019年05期)
李雪[5](2019)在《基于数据挖掘的数据聚类分析研究》一文中研究指出随着网络技术的兴起,人们生产生活中会产生海量数据,其中蕴含大量有用知识。但因为数据中所蕴含的知识密度普遍不高,如何获取想要的知识是亟待解决的问题。数据挖掘技术正是解决此问题的一把金钥匙。本文首先分析了聚类分析在数据挖掘中的原理和优势,然后提出了一种基于模型的聚类方法,对聚类的算法进行了深入分析,并提出了相关的改进算法。(本文来源于《安阳师范学院学报》期刊2019年05期)
石险峰,刘学军,张礼[6](2019)在《PUseqClust:一种RNA-seq数据聚类分析方法》一文中研究指出基因的聚类分析是基因表达数据分析研究的重要技术,它按照表达谱相近原则将基因表达数据归类,探究未知的基因功能.近年来,RNA-seq技术广泛应用于测量基因表达水平,产生了大量的读段数据,为基因表达聚类分析提供了充分条件.由于读段非均匀分布的特性,对读段计数一般采用负二项分布进行建模.现有的负二项分布算法和传统的聚类算法对于聚类分析都是直接对读段计数进行建模,没有充分考虑实验本身存在的各种噪声,以及基因表达水平测量的不确定性,或者对聚类中心的不确定性考虑不够.基于PGSeq模型,模拟读段的随机产生过程,采用拉普拉斯方法考虑多条件多重复基因表达水平之间的相关性,获得了基因表达水平的不确定性,联合混合t分布聚类模型,提出PUseqClust(propagating uncertainty into RNA-seq clustering)框架进行RNA-seq读段数据的聚类分析.实验结果表明,该方法相比其他方法获得了更具生物意义的聚类结果.(本文来源于《软件学报》期刊2019年09期)
李沐春,贾宗维[7](2019)在《基于约束满足的大数据聚类中心点确定仿真》一文中研究指出针对传统的大数据聚类中心点确定方法存在用时较长、准确性较低等问题,提出了一种基于约束满足的大数据聚类中心点确定方法。将数据分布密度与增加数据关键点密度权值两种方法相结合,对大数据初始聚类中心进行K-means聚类,并获取最优聚类数目。通过最优聚类数目构建微型相似性矩阵,采用Gabow算法提取该矩阵所对应连通图的各个强连通分支。在强连通分支的基础之上,通过约束传播算法获取整个数据集的点对相似度,并利用点对相似度和奇异值分解确定大数据聚类中心点,实现数据聚类。实验结果表明,所提方法对具有更高的聚类准确性以及更低的聚类时间,适合海量数据的聚类应用。(本文来源于《计算机仿真》期刊2019年09期)
曲红艳,王化琨,周影,田甜,岳宇巍[8](2019)在《基于稳定稀疏主成分的基因表达数据聚类分析方法》一文中研究指出通过对基因表达数据的聚类分析能够较快地发现肿瘤细胞,较为准确快速地诊断疾病。本文在稀疏主成分的基础上,研究了基于稳定稀疏主成分的基因表达数据聚类分析方法的问题。改进的方法主要应用于解决稀疏主成分的Lasso方法在高维度中缺乏变量选择的一致性。使用直接聚类、主成分聚类、稀疏主成分、稳定稀疏主成分四种聚类方法对2个基因表达数据进行K均值聚类和层次聚类,比较方法的准确率,验证了基于稳定稀疏主成分的基因表达数据的聚类分析方法的准确度更高。(本文来源于《黑龙江大学自然科学学报》期刊2019年04期)
蔡莉,李英姿,江芳,梁宇[9](2019)在《面向城市热点区域的不平衡数据聚类挖掘研究》一文中研究指出在大数据时代,数据来源众多,因此多源数据的融合成为数据挖掘领域的一个研究热点。现有的多源数据融合研究主要聚焦于相同领域内平衡数据集的融合模型和算法,对来自不同领域的非平衡数据集的聚类挖掘关注较少。DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法是挖掘热点区域的主要算法,但其无法处理不平衡的融合数据,少数类数据形成的聚类结果很难被发现。针对不平衡数据的融合,文中提出了一种基于时空特征的位置数据融合模型;同时,从数据层面和算法层面提出新颖的方法来解决不平衡数据的挖掘问题。鉴于目前的聚类算法的评价指标并不适用于不平衡数据的聚类结果评估,提出了一种新的综合评价指标来反映聚类质量。将来自交通领域的GPS轨迹数据(多数类数据)和社交领域的微博签到数据(少数类数据)进行融合,然后采用所提方法来挖掘热点区域。实验结果表明:基于多源数据融合的热点区域挖掘结果优于单源挖掘结果,所发现的热点区域位置、分布和数量与实际情况一致。文中所提出的融合模型、改进算法和评估指标法是有效且可行的,还可用于其他来源的位置数据的融合与分析。(本文来源于《计算机科学》期刊2019年08期)
向丽,戴晓晖[10](2019)在《动态遗传算法在大数据聚类分析中的应用》一文中研究指出对于常规聚类方法,聚类结果往往与初始聚类中心数目和数据入次序有关。本文另辟蹊径,提出了一种动态GA来实现样本类别数目由数据本身来确定,避免了聚类数目确定的盲目性等问题。计算结果表明,该方法是一个具有全局最优解的动态聚类方法。(本文来源于《信息记录材料》期刊2019年08期)
数据聚类论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
传统的文本数据聚类方法性能较差,无法得到最优的聚类原型。为了解决这个问题,提出船舶水下通信系统中海声信道文本数据聚类方法研究。首先处理在船舶水下通信系统中选取的海声信道文本数据,在应用聚类定义,分解文本数据相异度矩阵,为统一变量度量值,应用绝对偏差均值公式进行标准化处理,在此基础上,对海声信道文本数据进行聚类,由此,完成海声信道文本数据聚类方法的设计。在实验中,随机选取10组文本数据相异度矩阵,通过对比2种方法的性能,验证所提方法的可行性。实验结果表明,所提方法性能更好,更占优势。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据聚类论文参考文献
[1].张莹梅,杨耿煌,李明林,路光达.低压台区变压器用电数据聚类模型研究[J].天津职业技术师范大学学报.2019
[2].薛潇.船舶水下通信系统中海声信道文本数据聚类方法研究[J].舰船科学技术.2019
[3].张苏宁,王月娟,吴水明,景栋盛.基于Krylov子空间方法的网络入侵数据聚类[J].计算机与现代化.2019
[4].邓林峰,张爱华,赵荣珍.集成多策略改进FCM算法的旋转机械故障数据聚类分析研究[J].振动工程学报.2019
[5].李雪.基于数据挖掘的数据聚类分析研究[J].安阳师范学院学报.2019
[6].石险峰,刘学军,张礼.PUseqClust:一种RNA-seq数据聚类分析方法[J].软件学报.2019
[7].李沐春,贾宗维.基于约束满足的大数据聚类中心点确定仿真[J].计算机仿真.2019
[8].曲红艳,王化琨,周影,田甜,岳宇巍.基于稳定稀疏主成分的基因表达数据聚类分析方法[J].黑龙江大学自然科学学报.2019
[9].蔡莉,李英姿,江芳,梁宇.面向城市热点区域的不平衡数据聚类挖掘研究[J].计算机科学.2019
[10].向丽,戴晓晖.动态遗传算法在大数据聚类分析中的应用[J].信息记录材料.2019