导读:本文包含了变量聚类论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:变量,模型,均值,判据,成分,能源,方差。
变量聚类论文文献综述
何智恒,戴毅,柴欣生[1](2019)在《基于多变量的纸张相似性聚类分析程序与界面的设计》一文中研究指出基于PCA和K-means聚类的算法,采用LabVIEW编写了程序界面交互友好的操作软件系统,用于研究纸张在不同变量上的相似程度。程序设计主要赋予了简便操作,人机友好,数据可视化的特点。基于不同的多变量,采用PCA结合K-means聚类方法对纸张进行了相似程度的分析研究,结果表明:程序界面具有清晰简洁、交互友好、可操作性强的特点,可对纸张进行聚类分析,且可信度高。本程序可用于不同品质等级纸张在不同多变量上差异的识别和相似品质纸张的聚类,有效地进行纸张的各种差异化的分析。(本文来源于《造纸科学与技术》期刊2019年03期)
刘瑞平,王惠文,王珊珊[2](2019)在《基于Gram-Schmidt变换的有监督变量聚类》一文中研究指出为进一步研究回归模型中高维数据的降维方法,提出基于Gram-Schmidt变换的新的有监督变量聚类(SCV-GS)方法。该方法未采用以潜变量为聚类中心的层次聚类,而是借用变量扫描思想,依次挑出对响应变量有重要贡献的关键变量,并将其作为聚类中心。SCV-GS方法基于Gram-Schmidt变换,对变量之间的高度相关性进行批量处理,并得到聚类结果;同时,结合偏最小二乘思想,提出新的同一性度量,并以此来选取最佳聚合参数。SCV-GS不仅可以快速得到变量聚类结果,而且可识别出对响应变量的解释及预测起关键作用的变量类。仿真表明该聚类方法运算速度显着提升,而且所得潜变量对应的回归系数的估计结果与对照方法表现一致;实例分析表明该方法具有更好的解释性和预测能力。(本文来源于《北京航空航天大学学报》期刊2019年10期)
杨明瀚[3](2018)在《分类变量数据聚类内部评价及算法研究》一文中研究指出本文针对分类变量数据的聚类问题,从聚类结果的有效性评价入手展开研究工作,主要研究成果包括:(1)针对现有分类变量数据聚类有效性评价指标的适用性问题,分析了常用指标对类内紧密度和类间分离度的度量方法或所用假设,论证了仅考虑类内紧密度的有效性指标不适于层次聚类结果的评价,分析了类间分离度度量或假设的合理性对评价能力的影响。(2)针对聚类有效性内部指标评价能力的定量分析问题,提出了一种基于D-S证据理论的有效性指标评价能力相似性度量方法,由此发展出一种基于外部信息的内部指标评价能力度量方法,并用提出的方法对现有分类变量数据聚类有效性内部指标进行了评价能力分析,指出现有内部指标不能很好的满足评价需要。(3)针对现有分类变量数据内部指标评价能力不足的问题,提出了一种基于信息增益的类间分离度度量方法,进而提出了一种兼顾类内紧密度与类间分离度的分类变量数据聚类有效性内部指标CUBAGE。通过理论和实验对CUBAGE指标的评价能力和计算复杂度进行了分析,验证了 CUBAGE指标的优越性。(4)针对基于原型的划分式聚类算法聚类质量不足的问题,提出了 一种针对分类变量数据的无原型划分式迭代方法,进而提出了一种基于聚类有效性的划分式聚类算法k-CUBAGE。在证明该算法收敛的前提下,实验分析表明k-CUBAGE聚类算法具有快速收敛性、高聚类质量且结果更稳定。(5)针对随机初始划分造成的聚类结果不稳定的问题,提出了一种基于对象聚集度的初始类确定方法,该方法通过寻找对象更聚集且与其他类差异更大的初始类中心来确定初始类,消除了 k-CUBAGE聚类结果的随机性,并提高了聚类质量。(本文来源于《北京科技大学》期刊2018-12-25)
孟浚,邓晓雨,虞捷舟[4](2018)在《基于变量聚类的BP神经网络术后生存期预测模型》一文中研究指出针对结直肠癌患者术后生存期预测,基于模糊C均值(FCM)聚类算法,提出一种结合场景认知和隶属度排序的变量聚类方法,对结直肠癌患者样本进行降维,并筛选出6个特征变量.结合BP神经网络,建立一个结直肠癌患者术后生存期预测模型.为了验证该模型的有效性,利用主成分分析(PCA)对样本进行降维,并训练BP神经网络,对比FCM模型及PCA模型的预测准确率.结果显示,基于FCM变量聚类的BP神经网络模型预测准确率更高,所提出的变量聚类方法能够有效筛选出对于生存期有相关性和解释性的变量,从而提高BP神经网络模型的预测准确率.(本文来源于《浙江大学学报(工学版)》期刊2018年12期)
陈钊正,吴聪[5](2018)在《多变量聚类分析的高速公路交通流状态实时评估》一文中研究指出针对交通状态单变量判断传统方法的不足,本文建立了基于多变量聚类分析的高速公路交通流状态实时评估方法.结合实际交通流数据,利用模糊聚类、K均值聚类等算法对速度、流量等向量进行聚类分析,给出适合当前高速公路特点的交通状况划分方法和关键参数.本文方法能够实时、准确、全面地反映交通流的运行情况,为制定高效的交通管理控制方案及合理的出行方案提供数据基础.(本文来源于《交通运输系统工程与信息》期刊2018年03期)
李顺勇,钱宇华,张晓琴,牛建永[6](2018)在《基于变量选择和聚类分析的两阶段异方差模型估计》一文中研究指出建模经济学领域中的面板数据,异方差性在所难免.两阶段估计方法是一种较好的研究异方差性的手段,在进行样本分组时,如果仅选定一个自变量作为依据,会导致信息量不完整.本文提出了用变量选择的方法筛选出用于分组的几个变量,之后用κ均值方法进行聚类,进而实现对样本的类别划分,从而可以得到异方差估计.实证显示:在异方差估计精度和拟合值方面,本文提出的方法在有效性和可行性方面优势明显.(本文来源于《应用概率统计》期刊2018年02期)
仲明月[7](2018)在《基于主导变量分层聚类的风电场动态等值研究》一文中研究指出随着能源结构的逐步改变,电力生产的重要性日益突出,第叁代大电网开始大力发展大规模新能源电力。风能作为清洁、技术成熟、能源受用地广阔的新能源,其并网规模逐年增加。但是,基于风电本身的随机性和波动性特点,其出力并不稳定,对电网的安全稳定带来极大影响,所以有必要对大规模风电并入电网后电力系统的运行特性进行深层次的分析。对风电并网后的电力系统安全稳定运行的研究,首要问题是搭建较为精确的风电场模型。若建立风电场的详细模型,增大了整个电力系统建模难度,同时模型难以修正,并极大地增加了时域仿真时间。在实际工程应用中,常常将整个风电场作为一个微电网,考虑其对电网的影响,因此有必要搭建等值模型来表征整个风电场的运行状态。本文在确保风机等值精度的基础上,提出了一种适用于双馈风力发电机的动态等值建模方法。(1)该方法通过搭建风电机数学模型得到可表征风电机运行的状态变量,这些变量考虑了各风电场机组实际运行状态受尾流效应、时滞效应和风电机控制方式的影响;(2)运用主成分分析法提取状态变量中的转差率和风力机转矩作为主导变量,这两个变量可以表征状态变量94%的振荡特性;(3)利用分层聚类算法进行同调机组分群,分别将状态变量、主导变量、风速作为风电场的分群指标,将同群机组等值为一台风电机;(4)将同群机组按照容量加权原则和电压不变原则对等值风电机发电和集电参数进行计算;(5)在PSCAD平台搭建了24台风电机组多机等值模型,进行了故障和风速波动仿真。仿真结果表明,将转差率和风力机转矩这两个主导变量作为分群指标合理有效。与风速等值模型相比,主导变量等值模型考虑因素更全面且精度更高;与详细模型相比,主导变量等值模型计算复杂度低、能适合风电并网后的电力系统研究。本文提出的基于主导变量分层聚类的风电场等值模型,该模型计算复杂度低、易于实现、适用范围更广,且能较好满足风电场动态等值分析的实际需求。研究结果为分析风电并网后的电力系统安全稳定性能提供了良好的理论基础,具有一定的参考价值和借鉴意义。(本文来源于《西华大学》期刊2018-03-01)
Chirag,Deb,Siew,Eang,Lee[8](2018)在《《通过对改造前后建筑物数据进行聚类分析确定影响办公建筑能源消耗的关键变量》》一文中研究指出本研究旨在确定影响空调办公建筑能耗的关键建筑设计变量。本研究基于热带气候条件下的新加坡进行。结合56个办公楼改造前后能源审计报告数据进行评估分析。从这些报告中提取的14个建筑变量的列表构成了超集。对这些数据进行系统分析,得出影响能耗和改造决策的关键变量。为此,利用k均值聚类确定了一个稳健的迭代过程。该过程对14个变量的所有组合进行了测试,以应对改造前后条件下的能源使用强度(EUI,kW·h/m~2·a)的变化。结果表明,最佳变量包括:1)总建筑面积(GFA);2)非空调能耗;3)冷却装置的平均效率;4)冷却装置的装机容量。这些信息可以用来探索需要改造的办公楼的节能潜力。由此产生的集群还可以用来根据改造前的条件和节能潜力来对建筑物进行基准测试。(本文来源于《建筑节能》期刊2018年02期)
宋士豹,杨淑莹[9](2018)在《基于邻近相点聚类分析的多变量局域多步预测》一文中研究指出针对高维混沌复杂系统的多步预测问题,提出了一种基于邻近相点聚类分析的多变量局域多步预测模型。首先对于多变量邻近相点的选取,结合邻近相点多步回溯后的演化规律和变量间的关联信息对演化轨迹的影响,提出了一种新的多变量演化轨迹相似度综合判据;然后针对选取全局最优邻近相点耗时长的缺点,提出了一种基于邻近相点聚类分析的新方案来降低多步预测时间,提高预测效率。最后通过Lorenz混沌数据仿真实验,表明该模型具有优良的预测性能。(本文来源于《计算机应用研究》期刊2018年08期)
来永杰[10](2017)在《基于SOM聚类变量选择方法的共识模型在近红外光谱数据中的应用》一文中研究指出数据建模是化学计量学研究的重要内容,根据数据建模的任务不同,可以分为定量分析和定性分析。目前,单模型建模是数据建模中常用的方法,即反复分析测量数据的过程中,建立一系列预测模型,选出一个预测性能最好的模型。然而,现代高通量分析仪器的成千上万个分析通道为测量样本提供了丰富的测量数据,但常遇到样本少,变量多的问题,采用单模型的方法就难以满足其建模要求。为了弥补单模型建模方法的不足,近年来,多模型共识建模在很多领域得到广泛的研究和应用,共识建模则是通过某种建模方法建立多个成员模型,并用某种共识策略结合起多个成员模型对未知样品进行预测,形成一个共识结果,以提高模型的预测精度和可靠性。本文将共识建模方法应用于近红外光谱数据,并对线性共识成员模型和非线性共识的成员模型进行探讨,主要内容如下:介绍选题的背景和意义,分析数据建模的基本原理及本文应用的建模方法。研究变量选择多回归成员模型共识建模方法,分析变量选择的优势,提出了一种基于偏最小二乘的共识模型(C-SOM-PLS)和基于最小二乘支持向量机的共识模型(C-SOM-LS-SVM),即分别是线性多成员共识模型和非线性多成员共识模型。建模方法是先通过Kohonen自组织特征映射网络(SOM)聚类算法对变量进行选择,使相似的变量聚集在一起,选出N个子数据集,然后把N个子数据集分别通过Duplex算法把近红外光谱数据分为训练集、验证集和测试集,利用训练集建立一系列成员回归模型,通过验证集选出模型预测性能最好时对应的模型及误差,运用验证集误差计算共识模型的权重,最后把成员模型对未知样品的预测结果用加权求和的方法结合起来,形成一个共识的结果。结果表明,大多数共识模型的预测性能要比单模型好,不仅提高了模型的预测精度,也增强了模型的稳定性。分析C-SOM-PLS、C-SOM-LS-SVM和各自成员模型的预测结果,发现有些共识建模的预测效果比成员模型差,研究表明,因为成员模型过拟合对共识模型产生了影响。为了降低过拟合对模型的影响,本文在共识模型中引入了模型集群分析(MPA),该算法实现需要叁步,第一,通过蒙特卡洛采样获取子数据集;第二,针对每一个子数据集建立一个子模型;第叁,从样本空间对所有建立的集群子模型的参数进行统计分析,获取有用信息。结果表明引入MPA能够很好的降低过拟合对共识模型的影响。(本文来源于《温州大学》期刊2017-05-25)
变量聚类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为进一步研究回归模型中高维数据的降维方法,提出基于Gram-Schmidt变换的新的有监督变量聚类(SCV-GS)方法。该方法未采用以潜变量为聚类中心的层次聚类,而是借用变量扫描思想,依次挑出对响应变量有重要贡献的关键变量,并将其作为聚类中心。SCV-GS方法基于Gram-Schmidt变换,对变量之间的高度相关性进行批量处理,并得到聚类结果;同时,结合偏最小二乘思想,提出新的同一性度量,并以此来选取最佳聚合参数。SCV-GS不仅可以快速得到变量聚类结果,而且可识别出对响应变量的解释及预测起关键作用的变量类。仿真表明该聚类方法运算速度显着提升,而且所得潜变量对应的回归系数的估计结果与对照方法表现一致;实例分析表明该方法具有更好的解释性和预测能力。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
变量聚类论文参考文献
[1].何智恒,戴毅,柴欣生.基于多变量的纸张相似性聚类分析程序与界面的设计[J].造纸科学与技术.2019
[2].刘瑞平,王惠文,王珊珊.基于Gram-Schmidt变换的有监督变量聚类[J].北京航空航天大学学报.2019
[3].杨明瀚.分类变量数据聚类内部评价及算法研究[D].北京科技大学.2018
[4].孟浚,邓晓雨,虞捷舟.基于变量聚类的BP神经网络术后生存期预测模型[J].浙江大学学报(工学版).2018
[5].陈钊正,吴聪.多变量聚类分析的高速公路交通流状态实时评估[J].交通运输系统工程与信息.2018
[6].李顺勇,钱宇华,张晓琴,牛建永.基于变量选择和聚类分析的两阶段异方差模型估计[J].应用概率统计.2018
[7].仲明月.基于主导变量分层聚类的风电场动态等值研究[D].西华大学.2018
[8].Chirag,Deb,Siew,Eang,Lee.《通过对改造前后建筑物数据进行聚类分析确定影响办公建筑能源消耗的关键变量》[J].建筑节能.2018
[9].宋士豹,杨淑莹.基于邻近相点聚类分析的多变量局域多步预测[J].计算机应用研究.2018
[10].来永杰.基于SOM聚类变量选择方法的共识模型在近红外光谱数据中的应用[D].温州大学.2017