导读:本文包含了聚类树论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:构件,顶点,超图,模型,图像,文本,闭环。
聚类树论文文献综述
钱晓捷,杜胜浩[1](2017)在《基于刻面分类标识和聚类树的构件检索方法》一文中研究指出针对如何从规模庞大的软件构件库中快速且高效地检索出目标构件的问题,提出一种基于刻面分类标识和聚类树的构件检索方法。使用构件标识集合对构件进行刻面分类标识描述,克服了单纯采用刻面分类法对构件进行分类描述和检索时带来的主观因素的影响;引入聚类树的思想,对构件进行基于语义相似度的聚类分析,建立构件聚类树,能有效地缩小检索范围,减少检索构件与构件库中构件比较的次数,提高检索效率。最后在实验中与一般检索方法对比,实验结果表明该方法的构件查准率为88.3%,查全率为93.1%;而且在大规模的构件库中使用时依然有良好的检索效果。(本文来源于《计算机应用》期刊2017年10期)
袁慎溪[2](2017)在《基于随机森林和预测聚类树的多类标分类算法研究》一文中研究指出近年来,多类标分类问题在生活中变得越来越常见,在学术研究中也逐渐成为了一个热点。在多类标分类问题中,训练集中的每个样本都对应由一个或者多个类标组合而成,而在传统的分类问题中,每个样本只属于一个类,和多类标分类问题有着明显的不同。因此,用于单类标分类的算法不能直接用于多类标分类问题。目前关于解决多类标分类问题已经有了很多的算法,但是经过我们的调研和实验,我们发现它们在结果上并没有达到预期,仍然有不少的提升空间。本文通过对网络回归进行了一定研究的基础上,将网络回归中的方法应用到了预测聚类树算法中,然后又使用随机森林算法对之进行集成,提出了一种新的多类标分类算法。本文主要做了如下的工作:(1)从随机森林、预测聚类树以及多类标分类算法叁个方面对国内外文献进行了调研。全面总结了多类标研究领域内的分类算法及其验证准则;(2)通过把非网络数据的多类标数据转化成网络数据,将用于网络回归的算法运用到了多类标分类的场景;(3)将聚类之间距离和利用网络回归的方法计算出的聚类内部紧密度结合到一起作为预测聚类树分裂过程中选择最优分裂属性的依据;(4)基于以上的工作,将预测聚类树算法和随机森林算法集成到一起从而提出了一种新的多类标分类算法。最后本文将新提出的算法与目前业内比较常用的优秀算法在多个领域的多个数据集上进行实验,实验结果证明我们的算法具有良好的分类性能。(本文来源于《华南理工大学》期刊2017-03-15)
郭颂,姚建峰,周鹏[3](2017)在《基于聚类树的多类标文本分类算法研究》一文中研究指出提出一种新的多类标分类算法——多类标聚类树算法.该算法利用文本属性特征及类标信息,通过迭代调用"基于类标信息的聚类算法",将两空间分类树的生长不断划分,直至空间足够简单为止.实验证明,提出的多类标聚类树算法总体上优于其他对比算法,其分类能力强于排序能力.(本文来源于《信阳师范学院学报(自然科学版)》期刊2017年01期)
耿增民,万玉钗,刘峡壁,兰丽,陈迪[4](2016)在《一种基于GMM-聚类树的面向大规模服装图像检索的索引结构》一文中研究指出目前服装图像检索研究主要偏重于考察服装图像底层特征的表示方法,对服装图像数据集整体的特性关注较少.服装图像种类、款式、细节多种多样,传统方法在检索速度和准确率上已经不能满足用户的需求.为在日益庞大的服装图像集中快速准确地搜索需要的款式,提出一种GMM-聚类树索引方式.GMM-聚类树将不同细节的服装图像按照相似性逐步聚类,分别对应于不同的聚类树分支,避免人为指定聚类个数造成服装分类的错误.分别在小数据集和大数据集上测试其对服装图像检索的准确率和效率,试验结果表明通过自动确定聚类个数和GMM-聚类树的逐层分类,能够带来检索准确率和效率的双重提升.(本文来源于《北京服装学院学报(自然科学版)》期刊2016年03期)
王家腾,殷宏,解文彬,殷超[5](2016)在《基于顶点重要度和层次聚类树的地形网格简化》一文中研究指出为提高基于精细DEM数据的地形网格简化效率,在传统顶点聚类算法的基础上,提出一种基于顶点重要度和层次聚类树的地形网格简化算法。对地形分块顶点进行聚类,引入由顶点特征值和简化误差构成的顶点重要度来筛选簇代表点;根据代表点构建粗化网格,迭代缝合与简化过程直至完成整个地形网格简化;采用内存层次聚类树对简化的中间结果进行组织,将之用于地形多分辨率绘制中,指导网格的简化和细分。实验结果表明,该算法较好地保持了原始地形特征,缩减了内存消耗,中间结果的利用有效提升了地形渲染效率。(本文来源于《计算机工程与设计》期刊2016年06期)
宋思阳[6](2016)在《基于RSOM聚类树的视觉SLAM闭环检测关键技术研究》一文中研究指出随着人工神经网络和机器人技术的飞速发展,具有即时定位和同步建图(Simultaneous Localization and Mapping, SLAM)能力的移动机器人成为了当今人工智能领域的研究热点之一。当机器人处在未知环境中时,由于缺乏周围环境的先验信息,因此需要判断当前所处的位置之前是否访问过,并以此作为定位误差和地图更新的依据,即闭环检测问题。基于计算机视觉的SLAM闭环检测的主要任务是寻找数据库中与当前采集图像最相似的历史图像,并判断这两幅图像是否来自于同一场景。本文首先概述了国内外导航机器人技术的研究现状和SLAM闭环检测研究的核心问题,并分析了典型图像局部不变特征和两种图像建模方法的基础理论,为闭环检测算法中的图像表征、图像匹配和图像检索提供了理论依据。由于实时采集的图像序列中相邻图像间的相似度较高,若将即时采集的图像直接存入数据库,则容易导致的错误闭环检测。针对该问题,本文设计了一种序列图像分组算法对输入图像进行筛选。同时,当前大部分闭环检测算法的运算时间随着数据库增大而快速增加,从而使得检测系统不具有实时性能。考虑到自组织映射神经网络树(Recursive Self-organizing Map, RSOM)在大规模图像检索领域的优异性能,本文提出了一种基于RSOM树的视觉场景建模方法,为访问的场景建立路标;同时提出一种于RSOM树的路标检索算法,实时检索数据库内的相似路标。在运行时,系统还将实时删除数据库内的冗余路标和冗余图像。在闭环检测中,感知混淆是导致误检的主要原因之一,本文结合各场景之间的相似性关系和几何约束提出了一种阈值加权方法来最大程度避免该问题。同时,算法通过增量学习的方式来实时学习各场景中的信息,以提高检测精度。在六种不同环境下的实验测试结果表明:本文设计的SLAM闭环检测算法在室内和室外多种环境下均有实时检测能力,具有较高的检测召回率,同时对动态目标有一定的自适应性。(本文来源于《湖南大学》期刊2016-05-22)
别世福[7](2013)在《面向文本流的聚类树分类方法研究》一文中研究指出近年来,随着互联网技术的应用不断发展和普及,每时每刻都有大量的文本数据产生,例如实时新闻,电子邮件,即时聊天记录等。如何从文本数据流中挖掘出有用的信息已经受到工业界和学术界的广泛关注,而文本数据流的分类问题是文本流挖掘中非常重要的一个领域,可应用于垃圾邮件的分类,恐怖活动侦查等方面。本课题针对文本数据流的分类问题而进行了深入的研究,已完成的工作如下所示:(1)深入分析了文本数据流的生成方式、特点以及文本流学习上当前遇到的挑战;另外,本文总结了文本流分类算法和聚类树分类方法的国内外研究现状。(2)提出了一种强监督聚类树分类算法(CTL):该算法在训练阶段更加合理地利用了数据中的类标信息,在度量样本间相似度的问题上同时考虑了属性空间和类标空间的相似性,使得构建的聚类树模型更全面的反映训练数据的特征。另外,CTL算法中使用了一种新的聚类算法,其能够根据簇的重要性计算簇中心。在本算法的实验部分,相比于原始聚类树算法,常用树形分类算法(C4.5,CART和Random Forest)和SVM算法,CTL算法在处理高维文本数据时有一定的优势。(3)针对文本流分类问题,本文提出了一种基于CTL的动态集成分类算法。该算法使用CTL算法作为基分类器,使用最近的数据块作为验证集,计算每个基分类器精度,然后使用了两种基于精度的加权方式。在本算法的实验部分,对比了四种集成方式和叁种基分类器的组合,在不同的数据集上验证了该算法的有效性。(本文来源于《哈尔滨工业大学》期刊2013-12-01)
陈武[8](2012)在《多类标聚类树分类方法优化及并行化实现》一文中研究指出近年来,多类标分类问题成为学术研究的一个热点,多类标分类技术是解决多类标分类和类标排序两大任务的重要技术手段,为了更有效地解决多类标文本分类问题,一种新的基于聚类树的多类标文本分类算法在2011年被提出,并得到了充分的实验验证但是基于多类标聚类树文本分类算法在分类策略上也存在着不足,没能充分利用类标间的信息,对样本的分类预测完全依赖于类标掩盖数组和纯度同时,随着互联网的发展,数据规模不断扩大,如何在海量数据下加快算法运行速度也是本文关注的问题本文围绕多类标聚类树文本分类算法存在的问题以及如何实现算法并行化的问题进行深入研究,具体研究内容及成果如下:(1)全面对现有的多类标分类算法进行调研和深入分析,总结各算法的优缺点,总结目前基于MapReduce框架的机器学习并行化算法(2)深入阐述多类标聚类树分类算法,分析其理论和算法流程,分析该算法的存在的问题(3)针对多类标聚类树分类算法在分类策略上存在的不足,提出了两种优化策略第一种是基于基分类器的优化策略,使用基分类器在沿着决策路径对待测样本进行辅助分类和类标置信度计算,有助于提高分类器分类的性能第二种是利用皮尔森积差相关系数表示类标间的相关性优化算法,进一步地提升类标排序的性能;(4)针对如何在海量数据下加快算法的运行速度问题,提出算法并行化的思路,进而在MapReduce框架下实现了多类标聚类树分类方法的并行化(5)通过实验,本文证明了两种多类标聚类树文本分类方法的优化策略在评价指标中优胜于原来的算法,同时,实验也表明,基于MapReduce模型的多类标聚类树文本分类方法并行化能够取得不错的性能(本文来源于《哈尔滨工业大学》期刊2012-12-01)
郑君君[9](2011)在《基于属性图和聚类树的海量图像检索关键技术研究》一文中研究指出图像检索技术是计算机视觉领域的研究热点,虽然近年来该方面的研究已经取得了巨大进展,但是由于问题本身的复杂性,图像检索仍然是存在很多难点,而海量图像检索问题更为突出。本文首先概述了现有图像检索方法,分析了现有方法存在的问题,并给出了本文的检索方法。论文对图像的表征、图像的索引、检索策略等方面的进行了研究及实现。第一章首先介绍了国内外图像检索技术的基本情况,以及现有图像检索方法中所面临的挑战,在此基础上给出了本文采用的图像检索的基本思路以及本文的工作。第二章将论文中所要用到的相关基础理论,包括局部不变特征的提取,利用局部不变特征构建具有一定语义的属性图,以及用于对图像索引的RSOM树等进行了介绍,并给出了相似性传播原理,以及构建类属超图模型的相关理论。第叁章详细描述了基于RSOM树的图像K近邻求解的过程包括:图像索引的建立,PKNNG的求解和KNNG的求解。针对高维特征问题,提出了RSOM森林的分段特征建模方法,给出了RSOM森林的训练和查询过程,以及基于RSOM森林的图像K近邻求解算法实现。第四章介绍了本文中图像索引建立的方法,以及利用相似性传播原理实现对查询图像的检索。文中采用学术界公共测试数据集,通过对大量数据的实验分析,验证了本文方法的有效性。第五章是论文的结束语,总结了本文的主要工作,指出了本文工作的不足,提出了海量图像检索技术中需进一步研究的内容。(本文来源于《国防科学技术大学》期刊2011-11-01)
戴颖[10](2010)在《基于聚类树的相似重复记录检测算法改进研究》一文中研究指出数据仓库中数据来源的多渠道导致相似重复记录增多,严重影响了数据利用的效率和决策质量。相似重复记录的检测和消除成为数据仓库、知识发现等领域的热点研究问题。由于大多数的决策应用都是基于动态数据库,因此增量式相似重复记录检测研究更是受到组织和学者的关注。基于聚类树的检测算法是一种比较好的增量式相似重复记录检测方法。但该算法存在效率不高、精度低下的问题。鉴于此,本文使用等级法进行属性约减,并为聚类树构建过程增设了一个阈值,提出了一种改进的基于聚类树检测算法。本文首先综述了数据质量、数据清洗和相似重复记录检测的相关理论和方法。其次,分析了基于聚类树检测算法存在的问题,针对这些问题提出了改进思路和方法,即采用等级权重法约减属性给属性排序以提高算法的精度,通过增设记录阈值提高算法的效率,并给出了改进后的算法过程。最后,以SQL Sever Management Studio为DBMS、MyEclipse7.0为程序开发工具,开发了ICT-Syst(Improved Clustering Tree System)应用程序,并应用数据库生成器按给定规则生成的实验数据库,进行算法的有效性验证实验,实验结果表明改进后的算法具有较高的查全率和查准率,数据处理效率亦有明显提高。(本文来源于《合肥工业大学》期刊2010-04-01)
聚类树论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近年来,多类标分类问题在生活中变得越来越常见,在学术研究中也逐渐成为了一个热点。在多类标分类问题中,训练集中的每个样本都对应由一个或者多个类标组合而成,而在传统的分类问题中,每个样本只属于一个类,和多类标分类问题有着明显的不同。因此,用于单类标分类的算法不能直接用于多类标分类问题。目前关于解决多类标分类问题已经有了很多的算法,但是经过我们的调研和实验,我们发现它们在结果上并没有达到预期,仍然有不少的提升空间。本文通过对网络回归进行了一定研究的基础上,将网络回归中的方法应用到了预测聚类树算法中,然后又使用随机森林算法对之进行集成,提出了一种新的多类标分类算法。本文主要做了如下的工作:(1)从随机森林、预测聚类树以及多类标分类算法叁个方面对国内外文献进行了调研。全面总结了多类标研究领域内的分类算法及其验证准则;(2)通过把非网络数据的多类标数据转化成网络数据,将用于网络回归的算法运用到了多类标分类的场景;(3)将聚类之间距离和利用网络回归的方法计算出的聚类内部紧密度结合到一起作为预测聚类树分裂过程中选择最优分裂属性的依据;(4)基于以上的工作,将预测聚类树算法和随机森林算法集成到一起从而提出了一种新的多类标分类算法。最后本文将新提出的算法与目前业内比较常用的优秀算法在多个领域的多个数据集上进行实验,实验结果证明我们的算法具有良好的分类性能。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
聚类树论文参考文献
[1].钱晓捷,杜胜浩.基于刻面分类标识和聚类树的构件检索方法[J].计算机应用.2017
[2].袁慎溪.基于随机森林和预测聚类树的多类标分类算法研究[D].华南理工大学.2017
[3].郭颂,姚建峰,周鹏.基于聚类树的多类标文本分类算法研究[J].信阳师范学院学报(自然科学版).2017
[4].耿增民,万玉钗,刘峡壁,兰丽,陈迪.一种基于GMM-聚类树的面向大规模服装图像检索的索引结构[J].北京服装学院学报(自然科学版).2016
[5].王家腾,殷宏,解文彬,殷超.基于顶点重要度和层次聚类树的地形网格简化[J].计算机工程与设计.2016
[6].宋思阳.基于RSOM聚类树的视觉SLAM闭环检测关键技术研究[D].湖南大学.2016
[7].别世福.面向文本流的聚类树分类方法研究[D].哈尔滨工业大学.2013
[8].陈武.多类标聚类树分类方法优化及并行化实现[D].哈尔滨工业大学.2012
[9].郑君君.基于属性图和聚类树的海量图像检索关键技术研究[D].国防科学技术大学.2011
[10].戴颖.基于聚类树的相似重复记录检测算法改进研究[D].合肥工业大学.2010