导读:本文包含了聚类技术论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语义,算法,热点,技术,插座,密度,数据链。
聚类技术论文文献综述
刘亚丽,李国栋,刘云,洪奕,刘瑜俊[1](2019)在《基于随机森林的电动汽车充电行为聚类技术研究》一文中研究指出随着国家对新能源汽车的持续推进,成千上万的电动汽车(EV)接入电力系统,在充电过程中形成了关于EV充电行为的海量数据,因此有必要对EV充电行为特征展开研究。文中提出了一种基于随机森林的EV充电行为聚类技术,从充电行为的大量数据中辨识和分析不同类型的充电行为。采用英国Dundee市2018年1月的充电数据进行实验,分别得到该月工作日、双休日和节假日的充电行为分类。聚类分析获得的各个类别有着较为明确的特性,并以此推断出用户的充电方式、出行行为特点等。最后将该算法和欧式距离法进行对比,对比结果表明随机森林算法在EV聚类问题中的优越性。(本文来源于《电力工程技术》期刊2019年06期)
韩瑞鹏[2](2019)在《基于双聚类技术的传统村落档案研究热点分析》一文中研究指出在CNKI数据库中,以"主题=传统村落"进行检索,可知有关传统村落的论文在近5年内大量增加,涉及到方志学、社会学、生态学、档案学等多个学科,而对这一主题进行数据分析的研究较少。运用双聚类技术对传统村落档案研究热点进行分析,一方面可以用可视化矩阵图和可视化山丘图直观地反映高斯曲线的聚类分析,另一方面也可以通过分析来描述传统村落档案研究方面的现状和选题趋势。(本文来源于《档案》期刊2019年06期)
陈颖[3](2019)在《一种面向程序理解的程序语义聚类技术》一文中研究指出针对源代码中一些非结构化的自然语言描述信息进行语义聚类,辅助开发人员开展程序理解。主要利用自然语言处理技术对程序中的标识符和注释进行预处理,将程序转换成词频矩阵;然后利用潜在语义索引技术对该词频矩阵进行层次聚类,并对每个聚类的标记进行推荐,辅助开发人员理解程序。在开源项目JEdit上进行验证,结果显示对该5万行规模的项目代码进行聚类时耗不足1分钟。因此,该技术能够快速对程序进行语义聚类,辅助开发人员快速理解程序。(本文来源于《软件导刊》期刊2019年10期)
朱红星[4](2019)在《数据挖掘聚类技术下船舶网络安全保护态势研究》一文中研究指出船舶网络交互安全可以直接影响船舶日常工作,为了有效提高船舶网络安全保护质量,引入数据挖掘聚类技术,以此为基础设计船舶网络安全保护技术。在当前船舶网络环境下,建立多条数据基本链,不断迭代,完成网络数据挖掘,再辅以叁维云数据聚类技术,完成数据聚类,根据聚类数据类型特征,设计3种不同的访问控制路径,获取特征细节层次,最后建立保护控制端口,根据网络访问数据的特征细节和稳态率,明确响应时间,以此作为排序依据,进行访问控制排列,实现船舶网络安全保护。实验数据表明,应该船舶网络技术后,船舶网络非法占用比降低了26%,程序非法捕捉率提高29%。(本文来源于《舰船科学技术》期刊2019年12期)
张瑞霖[5](2019)在《基于聚类中心选取策略的混合属性聚类技术研究》一文中研究指出数据的爆炸式增长为数据挖掘技术的应用带来了契机,聚类分析是数据挖掘领域中极为活跃的研究方向之一,旨在分析数据的分布、研究数据的特征,发现数据潜在的内部结构。它在数据探索和机器学习中扮演着重要角色,并广泛应用于推荐系统、客户分割、商业智能、生物信息等领域。本文在研究现有的聚类分析算法基础上,结合聚类中心选取技术,针对高维空间中混合属性数据聚类算法存在精度较低、参数敏感且过多、聚类中心选取偏差等问题展开研究,论文的主要创新工作如下:(1)依据核心对象与非核心对象的分布差异,提出了一种基于过滤模型的聚类算法CA-FM。算法采用提出的过滤模型FM去除干扰聚类过程的非核心对象;并根据核心对象间的近邻关系构建邻接矩阵,通过遍历矩阵统计连通子图数量,即为聚类原型个数;然后将对象按密度因子进行降序排序,选出聚类原型;最后将剩余对象依据划分原则分配到相应的簇中,形成最终聚类。在合成数据集、UCI机器学习数据集以及人脸识别数据集上的实验结果验证了算法的有效性,与同类算法相比,CA-FM算法具有较高的聚类精度。(2)依据聚类中心的空间分布特征,提出了一种基于中心选取模型的聚类算法CSC。算法以提出的无参数局部核密度度量方法和边界度度量方法为依据,建立了聚类中心选取模型CSM,从而自动确定聚类中心;并按照密度峰值聚类算法的划分原则,将剩余对象划分到相应的簇中,形成最终聚类。在合成数据集和真实数据集上的实验结果验证了聚类中心选取模型的鲁棒性和聚类算法的有效性。与同类算法相比,CSC算法具有较高的聚类精度和参数鲁棒性。(3)针对混合属性数据聚类任务,提出了一种基于残差分析的混合属性数据聚类算法RA-Clust。算法在基于熵权重的混合属性相似性度量基础上,提出了基于KNN和Parzen窗技术的局部密度计算方法;并通过线性回归和残差分析技术对聚类中心进行预选取,然后依据提出的聚类中心目标优化模型对预选取阶段得到的对象进行迭代优化,得到期望的聚类中心;最后将剩余对象按距高密度对象最小距离原则进行划分,完成聚类任务。在数值属性、分类属性以及混合属性数据集上的实验结果验证了RA-Clust算法的有效性。与同类算法相比,RA-Clust算法参数较少且具有较高的聚类精度。本文的研究工作展示了聚类分析技术从低维、数值属性向高维、混合属性处理领域的演变,同时为聚类中心选取过程提出了一种思路、机制、模型。在医疗诊断、金融信贷、生物信息、人脸识别等领域的实验与分析,进一步加速了混合属性数据聚类算法由理论研究向实际应用的迁移。(本文来源于《郑州大学》期刊2019-05-01)
程栾[6](2019)在《密度峰值聚类技术的研究与改进》一文中研究指出聚类采用无监督的方式将输入数据归属到不同组,它在分析数据集的自然结构中起着重要作用,并且被广泛应用于基因学、移动通信、影像识别、数据检索、宇宙学、机器学习等重要领域。在聚类算法中,基于密度峰值的聚类技术具有其它聚类算法所不能比拟的优势,即它能够处理任意形状簇,但是存在需要手动输入参数和手动选择簇中心的问题。本文从拉普拉斯中心性理论和PageRank网页排名理论两个角度展开对密度峰值聚类技术的研究,主要创新成果如下:(1)提出基于拉普拉斯中心性和密度峰值的无参数聚类算法:结合数学统计学里的拉普拉斯理论和图论中的拉普拉斯能量理论,首先计算数据集中每个数据点的拉普拉斯中心性和相对距离,然后按照统计学里正态分布中的“3?”定理,潜在簇中心就可以被筛选出来,该算法解决了参数敏感性问题和簇中心手动提取不准确问题,从数据集规模大小和数据维度高低两个角度与经典的叁种密度聚类算法在数据集上的聚类结果进行对比,验证了该算法相对于其他叁种算法不仅提高了聚类的效率,而且实现了自动聚类。(2)提出基于PageRank的密度峰值聚类算法:首先利用PageRank算法中通过计算网页的PageRank分数对网页进行排名的思想来定义数据对象的影响力指数,并计算每个数据对象与具有更高影响力指数的对象之间的距离,然后将其影响力指数和每个数据对象的相对距离映射到二维空间,构建决策图,选择聚类中心,最后按照最近邻原则完成聚类,从数据集规模大小和数据维度高低两个角度与经典的叁种密度聚类算法进行比较,证实了该算法不但降低了参数敏感性,而且优化了簇的聚类性能。(本文来源于《郑州大学》期刊2019-05-01)
杨翾,孙可,叶刚进,王骏海,张林强[7](2019)在《基于聚类技术的“插座式”分布式光伏接入方法及其应用》一文中研究指出根据杭州地区光伏发展的实际情况和国际对标学习成果提出了基于聚类技术的"插座式"分布式光伏接入方法,实现分布式光伏以插头插入插座的方式并网接入,绘制分布式光伏并网"插座"地图,为政府制定分布式光伏发展规划提供论证支撑,为配电网网格化规划方案修编提供建议参考,确保光伏并网项目安全、经济、有序、便捷接入。研究成果已在建德市数个试点工业园区成功推广应用。(本文来源于《浙江电力》期刊2019年02期)
毛晓东,董辉[8](2019)在《人脸聚类技术在公安行业应用浅析》一文中研究指出随着公安信息化的不断发展,人脸识别技术已在公安行业广泛应用,并通过人脸抓拍机、图片结构化等手段获取了海量的人脸图片,形成了动态人脸资源库。本文通过分析人脸聚类技术的算法、技术难点等,探索如何运用人脸聚类技术将这些人脸资源有效的应用在公安实战中,为公安治安防控、刑侦破案、反恐防暴等工作提供有力支撑。(本文来源于《中国安全防范技术与应用》期刊2019年01期)
靳康萌,张沛,邓晓洋,谢桦[9](2019)在《基于K-means聚类技术改进的多线性蒙特卡洛概率能流算法》一文中研究指出可再生能源的间歇性出力以及负荷的波动给综合能源系统(integrated energy systems,IES)引入了大量不确定性因素。提出了一种基于K-means聚类技术改进的多线性蒙特卡洛概率能流计算方法。首先,引入输入随机变量整体灵敏度系数概念,并以权重系数的形式修正输入随机变量样本,改进K-means聚类效果,确保各聚类簇均具有较小的波动范围。然后,采用多线性化求解思路进行概率能流计算,即对聚类中心进行确定性能流计算,而各聚类簇中输入随机变量样本利用同一簇聚类中心处得到的状态变量和雅可比矩阵进行线性化能流求解,从而减少了迭代过程,提高计算效率。以IEEE57节点电力系统和14节点天然气网络构成的IES为算例,验证了所提方法比传统蒙特卡洛法具有更高的计算效率,相比现有多线性蒙特卡洛算法具有更高的准确性和计算效率。(本文来源于《电网技术》期刊2019年01期)
姜云飞[10](2018)在《基于K-means聚类技术的博士招生质量研究》一文中研究指出借助K-means聚类算法等数据挖掘技术,从我国博士研究生招生实际状况入手,从博士招生的结构质量、生源质量和选拔质量等角度分析研究生招生质量,提出科学合理的优化选拔方式、提升生源质量的博士生招生方案,对博士研究生招生单位具有良好的借鉴意义。(本文来源于《沈阳大学学报(社会科学版)》期刊2018年05期)
聚类技术论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在CNKI数据库中,以"主题=传统村落"进行检索,可知有关传统村落的论文在近5年内大量增加,涉及到方志学、社会学、生态学、档案学等多个学科,而对这一主题进行数据分析的研究较少。运用双聚类技术对传统村落档案研究热点进行分析,一方面可以用可视化矩阵图和可视化山丘图直观地反映高斯曲线的聚类分析,另一方面也可以通过分析来描述传统村落档案研究方面的现状和选题趋势。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
聚类技术论文参考文献
[1].刘亚丽,李国栋,刘云,洪奕,刘瑜俊.基于随机森林的电动汽车充电行为聚类技术研究[J].电力工程技术.2019
[2].韩瑞鹏.基于双聚类技术的传统村落档案研究热点分析[J].档案.2019
[3].陈颖.一种面向程序理解的程序语义聚类技术[J].软件导刊.2019
[4].朱红星.数据挖掘聚类技术下船舶网络安全保护态势研究[J].舰船科学技术.2019
[5].张瑞霖.基于聚类中心选取策略的混合属性聚类技术研究[D].郑州大学.2019
[6].程栾.密度峰值聚类技术的研究与改进[D].郑州大学.2019
[7].杨翾,孙可,叶刚进,王骏海,张林强.基于聚类技术的“插座式”分布式光伏接入方法及其应用[J].浙江电力.2019
[8].毛晓东,董辉.人脸聚类技术在公安行业应用浅析[J].中国安全防范技术与应用.2019
[9].靳康萌,张沛,邓晓洋,谢桦.基于K-means聚类技术改进的多线性蒙特卡洛概率能流算法[J].电网技术.2019
[10].姜云飞.基于K-means聚类技术的博士招生质量研究[J].沈阳大学学报(社会科学版).2018