随机聚类论文_刘亚丽,李国栋,刘云,洪奕,刘瑜俊

导读:本文包含了随机聚类论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:森林,多核,分布式,相似性,稻米,近邻,网络。

随机聚类论文文献综述

刘亚丽,李国栋,刘云,洪奕,刘瑜俊[1](2019)在《基于随机森林的电动汽车充电行为聚类技术研究》一文中研究指出随着国家对新能源汽车的持续推进,成千上万的电动汽车(EV)接入电力系统,在充电过程中形成了关于EV充电行为的海量数据,因此有必要对EV充电行为特征展开研究。文中提出了一种基于随机森林的EV充电行为聚类技术,从充电行为的大量数据中辨识和分析不同类型的充电行为。采用英国Dundee市2018年1月的充电数据进行实验,分别得到该月工作日、双休日和节假日的充电行为分类。聚类分析获得的各个类别有着较为明确的特性,并以此推断出用户的充电方式、出行行为特点等。最后将该算法和欧式距离法进行对比,对比结果表明随机森林算法在EV聚类问题中的优越性。(本文来源于《电力工程技术》期刊2019年06期)

郭新蕾,赵玉杰,刘潇威,周其文,王夏晖[2](2019)在《基于空间聚类与随机森林的稻米富集镉影响因素筛选研究》一文中研究指出以湖南省某县为例,通过空间聚类筛选研究热点区,并对热点区筛选的土壤样品进行多参数检测获取分析数据,通过随机森林回归锁定影响稻米富集Cd的主控因子。结果表明:研究区高高、高低聚类区稻米Cd富集系数差异达9倍,低低、低高聚类区稻米Cd富集系数差异达16倍;影响稻米富集Cd的最主要因素为Ca、pH、Mn,其次是Fe、Si,再次是Zn、DOC、Cl、K、P、Mg、S、Cd、Na、Cu,影响程度逐渐减小,最后是SOM影响程度最小。通过调控Ca含量可显着影响土壤pH,进而影响稻米对Cd的吸收。随着土壤Fe、Mn的升高稻米Cd含量呈指数下降。土壤Si含量与土壤Fe、pH等均呈负相关,Si含量增加,稻米Cd含量相应升高。有机质对稻米富集Cd的影响不显着。研究表明,双变量空间聚类与随机森林相结合可以有效筛选出稻米富集Cd的土壤主控因子,从而为稻米Cd污染的修复治理及污染源解析热点筛查提供基础支撑。(本文来源于《农业环境科学学报》期刊2019年08期)

吴文静,景鹏,贾洪飞,张铭航[3](2019)在《基于K均值聚类与随机森林算法的居民低碳出行意向数据挖掘》一文中研究指出对居民低碳意识的形成机理进行研究,可以为交通管理者引导城市居民选择低碳出行方式提供重要依据.运用数据挖掘技术对低碳出行问卷数据进行分析;将计划行为理论框架下的15维问题视为表征居民低碳出行意愿的内在原因变量,应用K均值聚类算法对居民低碳出行意愿强度进行归类,并将所得结果作为被解释变量应用于随机森林模型中,探讨居民的社会属性特征、出行特征等对其低碳出行意愿的作用机理.结果表明:基于Silhouette指标检验及t-SNE降维,居民低碳出行意愿可划分为3类:强烈、中立、不强烈;基于重要性指标显示影响最为显着的4项因素分别是居民的职业、居住地、家庭构成、通勤时间.研究结果从多个角度为城市交通低碳化发展及管理提供政策建议.(本文来源于《华南理工大学学报(自然科学版)》期刊2019年07期)

吕梦雅,任小霞,赵静,刘宇涵,贾江凯[4](2019)在《随机聚类形状匹配的形变体实时仿真》一文中研究指出针对传统形状匹配方法仅限于模拟较小形变的问题,提出一种基于随机聚类的划分方法.首先对传统旋转矩阵的求解过程进行优化,引入位置约束因子对目标位置进行二次修正,避免穿透现象;然后利用随机聚类方法对粒子群集进行划分生成一系列相互重迭的聚类,在单个时间步长内对每个聚类进行刚度拟合变换,重迭区域的粒子属于多个聚类,在形变过程中进行多次旋转变化能够模拟更大尺度的形变效果;最后采用反距离平方内核的权重方案计算重迭区域粒子的质量,根据粒子与所属簇集的距离合理地分配质量比重更新聚类中心.文中方法在每一次聚类更新时及时更新权重和质心,有效地避免了粒子在划分过程中产生较大偏移.实验结果表明,该方法能快速划分任意模型的粒子群集,允许模拟大尺度弹性形变,与形状匹配相结合具有较强的鲁棒性;同时保证了其实时性,更加适用于交互仿真.(本文来源于《计算机辅助设计与图形学学报》期刊2019年07期)

王诚,王凯[5](2019)在《一种基于聚类约简决策树的改进随机森林算法》一文中研究指出传统随机森林算法为了提高分类准确率,常常需要构建大量的决策树模型。由于训练数据集的复杂性以及传统随机森林在构建过程中引入的随机性,算法在训练过程中会生成部分分类性能差和相似度较高的决策树,影响模型的整体分类性能。针对这个问题,提出一种基于决策树聚类的改进随机森林算法(Trees Clustering Random Forest,TCRF),从分类精度和相似性角度去除不合格的决策树,根据AUC值从原始森林中提取出相对高精度子森林,利用基于Kappa统计量的距离度量方法对子森林聚类,从划分出的簇中选取具有代表性的树组成高精度低相似的森林。实验结果证明:改进后的算法在集成准确率以及分类效率上要高于传统随机森林算法。(本文来源于《南京邮电大学学报(自然科学版)》期刊2019年03期)

王迎旭[6](2019)在《基于随机特征的多核分布式协同模糊聚类算法研究》一文中研究指出近些年,云计算、物联网、大数据等技术的快速发展,推动了新型点对点分布式网络的应用,点对点分布式网络数据中隐含大量对预测或是决策有益的信息。本论文的研究目的是实现一种能够对点对点分布式网络中数据进行有效分析的聚类算法。论文设计实现了四种基于随机特征的集中式核模糊聚类算法,一种基于随机特征的多核分布式协同模糊聚类算法。(1)首先,本文设计了一种基于随机特征的单核模糊聚类算法,该算法使用随机特征方法近似核函数,在随机特征空间中进行模糊聚类。实验测试中,该算法得到了与传统核聚类算法相近的聚类结果,但是计算复杂度远远低于传统核聚类算法。此外,在此部分测试中,本文比较了两种不同的随机特征方法,测试结果说明准蒙特卡洛特征可以比随机傅里叶特征更好的近似核函数。(2)考虑到随机特征空间中的不同维度对聚类结果的重要性可能不同,本文设计了基于随机特征的单核属性加权模糊聚类算法。该算法将原始数据映射到随机特征空间后,为随机特征空间中的每个维度赋予权重,并使用最大熵正则化方法在聚类过程中自动的优化权重分布。实验测试的结果说明,该算法可以有效的发现随机特征空间中的重要维度,为重要维度赋予较大的权重,使其在类的形成过程中发挥更大的作用,提高聚类效果。(3)考虑到单核聚类算法的效果易受核函数选取的影响,本文设计了一种基于随机特征的多核核加权模糊聚类算法。该算法使用随机特征方法近似多核核函数,并使用最大熵方法自动优化核函数的权重分布。在实验测试中,该算法成功的为重要的核函数分配了较大的权重,得到了理想的聚类结果。并且,该算法的计算复杂度远远低于传统的多核聚类算法。(4)为了进一步提高聚类效果,本文设计一种基于随机特征的多核属性加权模糊聚类算法。该算法使用随机特征方法近似多个核函数,并将多个随机特征空间融合成一个组合的随机特征空间,为组合的随机特征空间的每个维度赋予权重,使用最大熵正则化方法在聚类过程中自动的优化权重分布。测试结果说明,该算法不但可以有效的发现重要的核函数,还可以发现重要的核函数对应的随机特征空间中重要的维度,显着的提高了聚类效果。(5)最终,基于上述算法,本文实现了基于随机特征的多核分布式协同模糊聚类算法。在该算法中,分布式点对点网络的每个节点首先独立的将其数据映射到组合的随机特征空间中,并为组合特征空间的每个维度赋予权重。随后,各节点交替的进行聚类与信息交换。在聚类过程中,各节点使用其本地数据和从相邻节点交换来的信息进行聚类,使用最大熵正则化方法优化维度权重分布。在信息交换过程中,各节点与其相邻节点交换类中心与权重。最终,各节点都达到聚类停止条件,得到全局一致的聚类结果。在测试中,该算法成功地完成了对模拟分布式数据的聚类任务,优化了维度权重分布,得到了符合预期的聚类结果。(本文来源于《济南大学》期刊2019-06-13)

罗显豪[7](2019)在《多级聚类演化的随机SVM集群在fMRI上的应用》一文中研究指出大脑是由数以千亿的神经元相互连结形成的复杂生物器官,在大脑的结构和功能上进行探索与研究,有助于阐明大脑的运行机制,对及时干预和治疗神经系统变性疾病有着重要的指导作用。功能磁共振成像作为一种非侵入性的新兴神经成像手段,为探究大脑的神经功能活动提供了客观、有效的数据支撑。本文基于功能磁共振成像,创新性地提出了多级聚类演化的随机支持向量机集群(Multilevel Clustering-evolutionary Random Support Vector Machine Cluster,MCRSVMC),并运用该方法分别对阿斯伯格症和轻度认知障碍展开研究。本文的主要贡献描述如下:(1)提出一种新的MCRSVMC算法。在对多个SVM基分类器进行组合的基础上,引入聚类演化的方法构建MCRSVMC,以提高模型的最终分类性能。MCRSVMC可以用来实现特征选择,并进一步检测疾病的异常脑区,为神经系统变性疾病的诊断研究开拓了新的思路。(2)利用MCRSVMC对阿斯伯格症的分类诊断展开应用研究。首先从ABIDE数据库下载63个阿斯伯格症患者和72个正常对照的静息态功能磁共振成像数据,然后构建图论拓扑特征,最后采用MCRSVMC算法对患者和正常对照进行分类。结果表明,基于最优特征的准确率为95.24%,并且可以找到额中回、海马、补充运动区等病灶。该研究结果表明MCRSVMC算法能够有效地帮助医师对阿斯伯格症患者进行辅助诊断。(3)利用MCRSVMC对轻度认知障碍进程展开应用研究。首先从ADNI数据库下载36个正常对照、42个早期轻度认知障碍和38个晚期轻度认知障碍患者的静息态fMRI数据,然后构建图论特征,最后利用MCRSVMC对轻度认知障碍进程的不同阶段进行多组实验。基于最优特征,MCRSVMC在正常对照组和早期轻度认知障碍组的分类上达到了89.47%的准确率,在早期和晚期轻度认知障碍组的分类上达到了90%的准确率。在检测病灶的过程中,发现海马旁回和后扣带回等脑区在两组实验中同时出现异常,说明这些脑区在“正常认知早期轻度认知障碍晚期轻度认知障碍”的演变进程中起着关键的作用。这些实验结果展示了MCRSVMC方法在追踪轻度认知障碍发病路径中的巨大潜能。(本文来源于《湖南师范大学》期刊2019-06-01)

林思美,黄华国,陈玲[8](2019)在《结合随机森林与K-means聚类评价湿地火烧严重程度》一文中研究指出针对湿地植被存在典型的季节及年际变化特征,常用的遥感识别手段无法对湿地火烧严重程度实现准确评价的问题,提出了一种适用于湿地火烧严重程度的评价方法。基于2001年9月扎龙湿地的火灾事件,应用K-means聚类分析,从季节与年际2个方面的NBR阈值中获取不同火烧严重程度的训练样本,并利用随机森林机器学习算法建立基于光谱指数的分类模型,从而实现了湿地火烧严重程度的准确制图与评价。结果表明,交叉验证的分类总体精度为89.9%,各个火烧严重程度之间未出现严重的混分情况,且该模型具有一定的可移植性,能够成功地用于湿地火灾研究,从而为湿地火灾管理提供相应的参考依据。(本文来源于《遥感信息》期刊2019年02期)

李蓉,郑浪,任喜梅,钟春晓,王锦丽[9](2019)在《基于随机矩阵理论及层次聚类方法在肝癌基因网络中的研究》一文中研究指出为了找出与肝癌发生发展有关的基因,利用随机矩阵理论及层次聚类法分析肝癌基因网络,构建了肝癌基因层次树图,分析得到5个具有不同功能的基因团簇,并预测WNT4、SLU7基因与B淋巴细胞免疫过程有关,LMNB2、CDC7L1、H2AFX基因能促进肝癌细胞的增殖.(本文来源于《湘潭大学学报(自然科学版)》期刊2019年02期)

徐秀芳,徐森,花小朋,徐静,皋军[10](2019)在《一种基于t-分布随机近邻嵌入的文本聚类方法》一文中研究指出文本数据具有高维、稀疏、海量的特性,给传统的聚类算法带来了极大挑战.提出一种基于t-分布随机近邻嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)的文本聚类方法.首先通过t-SNE将高维文本数据嵌入到低维空间,使得高维空间相似度较低的文本对应的映射点距离较远,而相似度较高的文本对应的映射点距离较近;然后根据低维空间映射点坐标,再采用传统的聚类分析算法进行聚类,得到最终的聚类结果.在多个基准文本数据集上进行了实验测试,验证了该方法的有效性.(本文来源于《南京大学学报(自然科学)》期刊2019年02期)

随机聚类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

以湖南省某县为例,通过空间聚类筛选研究热点区,并对热点区筛选的土壤样品进行多参数检测获取分析数据,通过随机森林回归锁定影响稻米富集Cd的主控因子。结果表明:研究区高高、高低聚类区稻米Cd富集系数差异达9倍,低低、低高聚类区稻米Cd富集系数差异达16倍;影响稻米富集Cd的最主要因素为Ca、pH、Mn,其次是Fe、Si,再次是Zn、DOC、Cl、K、P、Mg、S、Cd、Na、Cu,影响程度逐渐减小,最后是SOM影响程度最小。通过调控Ca含量可显着影响土壤pH,进而影响稻米对Cd的吸收。随着土壤Fe、Mn的升高稻米Cd含量呈指数下降。土壤Si含量与土壤Fe、pH等均呈负相关,Si含量增加,稻米Cd含量相应升高。有机质对稻米富集Cd的影响不显着。研究表明,双变量空间聚类与随机森林相结合可以有效筛选出稻米富集Cd的土壤主控因子,从而为稻米Cd污染的修复治理及污染源解析热点筛查提供基础支撑。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

随机聚类论文参考文献

[1].刘亚丽,李国栋,刘云,洪奕,刘瑜俊.基于随机森林的电动汽车充电行为聚类技术研究[J].电力工程技术.2019

[2].郭新蕾,赵玉杰,刘潇威,周其文,王夏晖.基于空间聚类与随机森林的稻米富集镉影响因素筛选研究[J].农业环境科学学报.2019

[3].吴文静,景鹏,贾洪飞,张铭航.基于K均值聚类与随机森林算法的居民低碳出行意向数据挖掘[J].华南理工大学学报(自然科学版).2019

[4].吕梦雅,任小霞,赵静,刘宇涵,贾江凯.随机聚类形状匹配的形变体实时仿真[J].计算机辅助设计与图形学学报.2019

[5].王诚,王凯.一种基于聚类约简决策树的改进随机森林算法[J].南京邮电大学学报(自然科学版).2019

[6].王迎旭.基于随机特征的多核分布式协同模糊聚类算法研究[D].济南大学.2019

[7].罗显豪.多级聚类演化的随机SVM集群在fMRI上的应用[D].湖南师范大学.2019

[8].林思美,黄华国,陈玲.结合随机森林与K-means聚类评价湿地火烧严重程度[J].遥感信息.2019

[9].李蓉,郑浪,任喜梅,钟春晓,王锦丽.基于随机矩阵理论及层次聚类方法在肝癌基因网络中的研究[J].湘潭大学学报(自然科学版).2019

[10].徐秀芳,徐森,花小朋,徐静,皋军.一种基于t-分布随机近邻嵌入的文本聚类方法[J].南京大学学报(自然科学).2019

论文知识图

随机网络的度分布与Poisson分布的比...初始化方式在HeartDisease数据集...视频数据集的时-空间特征点类典型动作的前30个运动词汇同时,也...随机聚类测试矩阵,其中参数k=...

标签:;  ;  ;  ;  ;  ;  ;  

随机聚类论文_刘亚丽,李国栋,刘云,洪奕,刘瑜俊
下载Doc文档

猜你喜欢