基于MCP惩罚的AdaBoost集成剪枝技术的研究

基于MCP惩罚的AdaBoost集成剪枝技术的研究

论文摘要

AdaBoost是一种有力的集成学习方法,能将一系列低预测精度的弱学习器结合成为一个高预测精度的强学习器。然而,与其它集成学习方法相似,AdaBoost也需要使用大量的基学习器来产生最终的预测结果,因此当数据维度较高或集成规模较大时,构建AdaBoost集成模型对计算机的内存空间产生了挑战。回归模型中的特征选择方法能够显著地降低数据维度,并且在集成学习中也已证明了其有效性。通过对集成模型进行剪枝,我们能够产生一个规模更小,精度却更高的集成模型。在本文中,我们提出使用最小最大凹度惩罚函数(MCP)对AdaBoost模型进行集成剪枝,在简化集成模型的同时改进预测精度。本文首先使用MCP惩罚的逻辑回归对高维数据进行变量筛选处理,再使用AdaBoost集成方法进行建模,并以实验说明对高维数据使用MCP进行变量筛选不仅不会损害后续AdaBoost模型的性能,反而能提高其预测精度;在建立AdaBoost集成模型后,取其基学习器的预测结果作为逻辑回归中的预测矩阵,从而使用带有MCP惩罚项的逻辑回归对集成模型进行剪枝,MCP的剪枝效果将与LASSO与SCAD惩罚函数的效果作比较。在真实数据集上进行的实验结果表明,在有噪声数据集中,使用MCP函数进行集成剪枝得到良好的效果:在本文涉及到的所有六个有噪声数据集中,使用MCP剪枝后的模型均比原模型有更高的预测精度,同时其平均集成规模大幅降低至原模型的5%至20%,其总体效果也优于使用另外两个惩罚函数剪枝的模型。通过实验,本文得出以下结论:在使用AdaBoost进行高维数据的分类预测时,使用带MCP惩罚项的逻辑回归模型能够在缩小集成规模的同时提高模型表现。

论文目录

  • 摘要
  • abstract
  • 1 绪论
  •   1.1 背景与意义
  •   1.2 创新点
  •   1.3 研究现状
  •     1.3.1 集成学习
  •     1.3.2 集成剪枝
  •   1.4 本章小结
  • 2 Ada Boost集成模型
  •   2.1 决策树
  •     2.1.1 概念与分类
  •     2.1.2 划分标准
  •     2.1.3 优缺点
  •   2.2 Ada Boost
  •     2.2.1 概念
  •     2.2.2 原理
  •     2.2.3 优缺点
  •   2.3 本章小结
  • 3 惩罚函数
  •   3.1 逻辑回归
  •     3.1.1 概念与形式
  •     3.1.2 缺点与正则化回归
  •   3.2 惩罚函数
  •     3.2.1 LASSO
  •     3.2.2 SCAD
  •     3.2.3 MCP
  •   3.3 本章小结
  • 4 集成剪枝
  •   4.1 概述
  •   4.2 算法
  •   4.3 本章小结
  • 5 实证分析
  •   5.1 实验步骤
  •   5.2 数据描述
  •   5.3 实验设置
  •   5.4 实验结果与讨论
  •   5.5 本章小结
  • 6 结论与不足
  •   6.1 结论
  •   6.2 不足与展望
  •   6.3 本章小结
  • 参考文献
  • 附录
  •   Ada Boost算法伪代码
  •   PICASSO算法伪代码
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 郑伟华

    导师: 江河

    关键词: 集成剪枝,特征选择,最小最大凹度惩罚

    来源: 江西财经大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,自动化技术

    单位: 江西财经大学

    分类号: TP181;O212.1

    总页数: 58

    文件大小: 2483K

    下载量: 67

    相关论文文献

    • [1].基于多步校正的改进AdaBoost算法[J]. 清华大学学报(自然科学版)网络.预览 2008(10)
    • [2].基于AdaBoost级联框架的舌色分类[J]. 北京生物医学工程 2020(01)
    • [3].基于CEEMDAN+RF+AdaBoost的短期负荷预测[J]. 水电能源科学 2020(04)
    • [4].基于AdaBoost算法的炉芯温度预测模型[J]. 钢铁研究学报 2020(05)
    • [5].基于iForest-Adaboost的核电厂一回路故障诊断技术研究[J]. 核动力工程 2020(03)
    • [6].基于AdaBoost的短期边际电价预测模型[J]. 计算机与数字工程 2020(02)
    • [7].基于AdaBoost的雷达剩余杂波抑制方法[J]. 电光与控制 2020(06)
    • [8].基于AdaBoost集成学习的窃电检测研究[J]. 电力系统保护与控制 2020(19)
    • [9].基于混合采样AdaBoost的地中海贫血数据诊断研究[J]. 数据通信 2020(05)
    • [10].基于KELM-AdaBoost方法的短期风电功率预测(英文)[J]. 控制工程 2019(03)
    • [11].Adaboost-SVM多因子选股模型[J]. 经济研究导刊 2019(10)
    • [12].一种改进的Adaboost-BP算法在手写数字识别中的研究[J]. 大理大学学报 2019(06)
    • [13].一种快速AdaBoost.RT集成算法时间序列预测研究[J]. 电子测量与仪器学报 2019(06)
    • [14].一种加入动态权重的AdaBoost算法[J]. 重庆师范大学学报(自然科学版) 2019(05)
    • [15].基于改进的AdaBoost算法的中压配电网断线不接地故障检测[J]. 电测与仪表 2019(16)
    • [16].基于Adaboost算法的人脸检测的研究[J]. 中外企业家 2019(26)
    • [17].基于Adaboost.RT算法的隧道沉降时间序列预测研究[J]. 中国计量大学学报 2019(03)
    • [18].一种改进的BP-AdaBoost算法及应用研究[J]. 现代电子技术 2019(19)
    • [19].AdaBoost的多样性分析及改进[J]. 计算机应用 2018(03)
    • [20].基于改进Real AdaBoost算法的软件可靠性预测[J]. 空军工程大学学报(自然科学版) 2018(01)
    • [21].一种基于聚类和AdaBoost的自适应集成算法[J]. 吉林大学学报(理学版) 2018(04)
    • [22].基于Adaboost算法的人眼检测技术在路考系统中的应用[J]. 汽车与安全 2016(04)
    • [23].基于改进Adaboost算法的人脸检测方法[J]. 科技经济导刊 2018(18)
    • [24].基于Adaboost和回归树集合技术的疲劳识别研究[J]. 汕头大学学报(自然科学版) 2017(02)
    • [25].基于AdaBoost算法的在线连续极限学习机集成算法[J]. 软件导刊 2017(04)
    • [26].基于Adaboost的改进多元线性回归算法中长期负荷预测[J]. 太原理工大学学报 2017(05)
    • [27].Adaboost人眼定位方法改进与实现[J]. 大连交通大学学报 2017(05)
    • [28].基于SVM-Adaboost裂缝图像分类方法研究[J]. 公路交通科技 2017(11)
    • [29].基于Adaboost算法的主客观句分类[J]. 长春大学学报 2015(12)
    • [30].基于AdaBoost的极限学习机集成算法[J]. 软件导刊 2016(04)

    标签:;  ;  ;  

    基于MCP惩罚的AdaBoost集成剪枝技术的研究
    下载Doc文档

    猜你喜欢