二分决策树论文_李海涛,刘泰麟,邵泽东,黄海广

导读:本文包含了二分决策树论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:算法,决策树,均值,自适应,赤潮,数据,神经网络。

二分决策树论文文献综述

李海涛,刘泰麟,邵泽东,黄海广[1](2019)在《基于决策树与二分分割算法的BP神经网络在赤潮等级预测中的应用研究》一文中研究指出针对赤潮灾害等级预测难的现状,提出了一种基于C4.5决策树与二分分割算法优化的BP(反向传播)神经网络赤潮等级预测模型。该模型针对传统BP神经网络输入参数难以选择和隐含层节点数量难以确定的问题,通过决策树分类获取最优的属性组合,来解决输入参数难以选择的问题;通过"二分分割算法",来解决隐含层节点数难以确定的问题。实验结果表明,该模型在青岛近海海域赤潮灾害等级预测中,预测结果的均方根误差(RMSE)小于传统BP神经网络的预测误差,并且在网络训练时间上有所缩短,预测精度上有所提高,能够获得良好的预测结果,可为赤潮等级预测提供新的解决方法。(本文来源于《海洋科学》期刊2019年09期)

裘国永,张娇[2](2012)在《基于二分K-均值的SVM决策树自适应分类方法》一文中研究指出分析和研究了自适应降维算法在高维数据挖掘中的应用。针对已有数据挖掘算法因维灾难导致的在处理高维数据时准确率和聚类质量都较低的情况,将二分K-均值聚类和SVM决策树算法结合在一起,提出了一种适用于高维数据聚类的自适应方法 BKM-SVMDT。该算法能保证二分K-均值聚类是在低维数据空间中进行,其结果再反过来帮助SVM在高维空间中的执行,这样反复执行以取得较好的分类精度和效率。标准数据集的实验结果证明了该方法的有效性。(本文来源于《计算机应用研究》期刊2012年10期)

张娇[3](2012)在《基于二分K均值和SVM决策树的数据挖掘算法研究》一文中研究指出利用计算机技术对数据进行采集和处理是IT技术一个极为重要的应用。在数据采集过程中会遇到很多高维的数据信息,信息中包含着大量特征。这些高维数据造成了数据挖掘过程中的“维灾难”问题。因此,分析和研究对高维数据集进行有效信息挖掘的算法显得十分重要。针对高维数据挖掘的需要,本文先简单地讨论了高维数据分类和现有数据挖掘算法的研究热点、研究现状及相关理论和方法,在这基础上开展了进一步研究。研究工作主要有:(1)讨论了现有数据挖掘算法在高维数据集上进行数据挖掘的不足及自适应维归约算法的重要性。首先,给出了高维数据分类存在的问题和研究热点并具体说明了降维在高维数据挖掘过程中的重要性。其次,介绍了现有支持向量机(SVM)分类算法和K均值相关算法在高维数据集应用上的不足,为后续算法的改进打下了较好的基础。(2)设计了一种针对高维数据集的有效的多分类二阶段数据挖掘方法。该方法首先利用二分K均值算法对高维数据集进行粗聚类,然后再利用SVM决策树算法对粗聚类之后的结果进行细分,即可实现对高维数据进行多分类的目的。该方法既有效地减少了高维数据在进行多分类时的训练时间,而且实验结果证明该方法比单纯使用K均值聚类算法或SVM算法的分类准确率有所提高并且也降低了时间复杂度。(3)对现有的知识发现过程进行有效分析,将数据预处理与数据挖掘实现内部循环,从而得到较优的挖掘结果。本文利用支持向量机决策树算法(SVMDT)来实现数据挖掘预处理步骤中的数据降维。针对高维数据集的多分类问题,提出了一种结合二分K均值聚类和SVMDT算法的自适应分类方法(BKM-SVMDT方法)。在BKM-SVMDT方法中,首先利用PCA将原始数据集从高维空间变换到低维空间上,然后在得到的低维空间上执行二分K均值算法来得到样本的类信息,再利用高低维之间的指示矩阵H生成高维数据的类信息,指导SVMDT算法进行分类,再得到低维数据集和新的指示矩阵H,从而可在得到的新的低维数据空间上进行二分K均值聚类算法,这个过程反复执行下去,直到达到相应收敛结果。该方法既较好地避免了维灾难问题,又能自适应地得到某种形式的收敛结果。与NLSVM算法和SVM决策树算法的对比实验也证明了BKM-SVMDT方法的有效性。(本文来源于《陕西师范大学》期刊2012-06-01)

张娇,裘国永,张奇[4](2012)在《基于二分K均值的SVM决策树的高维数据分类方法》一文中研究指出针对数据挖掘中高维数据多分类问题,提出了一种基于二分K均值的SVM决策树的高维数据分类方法.该方法先利用二分K-均值将高维数据基本聚为k类,再构造SVM多分类模型,利用它对各类进行细分.本文给出了该模型的构造及应用方法,并在标准数据集上验证了该方法的有效性.(本文来源于《赤峰学院学报(自然科学版)》期刊2012年07期)

蒋艳凰,杨学军,赵强利[5](2003)在《具有高可理解性的二分决策树生成算法研究(英文)》一文中研究指出二分离散化是决策树生成中处理连续属性最常用的方法,对于连续属性较多的问题,生成的决策树庞大,知识表示难以理解.针对两类分类问题,提出一种基于属性变换的多区间离散化方法——RCAT,该方法首先将连续属性转化为某类别的概率属性,此概率属性的二分法结果对应于原连续属性的多区间划分,然后对这些区间的边缘进行优化,获得原连续属性的信息熵增益,最后采用悲观剪枝与无损合并剪枝技术对RCAT决策树进行简化.对多个领域的数据集进行实验,结果表明:对比二分离散化,RCAT算法的执行效率高,生成的决策树在保持分类精度的同时,树的规模小,可理解性强.(本文来源于《软件学报》期刊2003年12期)

二分决策树论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

分析和研究了自适应降维算法在高维数据挖掘中的应用。针对已有数据挖掘算法因维灾难导致的在处理高维数据时准确率和聚类质量都较低的情况,将二分K-均值聚类和SVM决策树算法结合在一起,提出了一种适用于高维数据聚类的自适应方法 BKM-SVMDT。该算法能保证二分K-均值聚类是在低维数据空间中进行,其结果再反过来帮助SVM在高维空间中的执行,这样反复执行以取得较好的分类精度和效率。标准数据集的实验结果证明了该方法的有效性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

二分决策树论文参考文献

[1].李海涛,刘泰麟,邵泽东,黄海广.基于决策树与二分分割算法的BP神经网络在赤潮等级预测中的应用研究[J].海洋科学.2019

[2].裘国永,张娇.基于二分K-均值的SVM决策树自适应分类方法[J].计算机应用研究.2012

[3].张娇.基于二分K均值和SVM决策树的数据挖掘算法研究[D].陕西师范大学.2012

[4].张娇,裘国永,张奇.基于二分K均值的SVM决策树的高维数据分类方法[J].赤峰学院学报(自然科学版).2012

[5].蒋艳凰,杨学军,赵强利.具有高可理解性的二分决策树生成算法研究(英文)[J].软件学报.2003

论文知识图

二分决策树示意图一13决策树的二级展开模型仪表板提取结果选练样本分布图不变矩特征筛选后的边缘Fig.2Resultof...一P叮PS用户使用界面

标签:;  ;  ;  ;  ;  ;  ;  

二分决策树论文_李海涛,刘泰麟,邵泽东,黄海广
下载Doc文档

猜你喜欢