非线性规划形式的多标签特征选择算法的研究

非线性规划形式的多标签特征选择算法的研究

论文摘要

在多标签问题中,一个实例不仅与多个标签有关,而且常包含高维特征。在这些特征中有些是冗余的甚至是不相关的,它们的存在降低分类器性能,增加内存占用量。多标签特征选择技术由于能够挑选出与标签最相关的原始特征而成为最主流的解决上述问题的方法。本文在基于条件互信息的非线性规划形式特征子集选择框架QIPcmi的基础上提出两个多标签特征选择算法:(1)基于条件互信息联合遗传算法的多标签特征选择算法;(2)基于归一化条件互协方差算子的二次规划多标签特征选择算法。对于基于条件互信息联合遗传算法的多标签特征选择算法:我们首先对特征进行离散化处理,以满足条件互信息与互信息的要求。然后我们使用了带控制策略的遗传算法求解QIPcmi。在实验中,我们将提出的算法与四种现存的多标签特征选择算法在六个基准多标签数据集上进行比较。通过实验可以发现,我们提出的基于条件互信息联合遗传算法的多标签特征选择算法可以选出更优的特征子集。对于基于归一化条件互协方差算子的二次规划多标签特征选择算法:我们首先介绍了归一化条件互协方差算子和归一化互协方差算子,它们可以分别进行条件依赖性度量和依赖性度量。本文中,我们用它们分别替换QIPcmi中的条件互信息和互信息,形成基于归一化条件互协方差算子的非线性规划形式的特征子集选择方法。然后我们放松约束条件,将原本属于NP难度的问题转化成二次规划问题进行求解。在实验中,我们将该算法与本文提出的第一种算法以及其它两种已有算法在五个基准多标签数据集上进行比较。实验分析显示,我们提出的基于归一化条件互协方差算子的二次规划多标签特征选择算法在实验中拥有更好的分类效果。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 第2章 多标签分类问题与特征选择
  •   2.1 多标签分类问题及其数学描述
  •     2.1.1 多标签分类算法介绍
  •     2.1.2 多标签数据集
  •     2.1.3 多标签分类评价指标
  •   2.2 特征选择
  •     2.2.1 特征选择的意义与通用框架
  •     2.2.2 特征选择方法的分类
  •   2.3 本章小结
  • 第3章 基于条件互信息联合遗传算法的多标签特征选择算法
  •   3.1 信息熵与条件互信息
  •   3.2 基于条件互信息的非线性规划形式的多标签特征选择模型
  •     3.2.1 特征子集选择模型QIPcmi
  •     3.2.2 基于该模型的现有算法
  •   3.3 基于条件互信息联合遗传算法的多标签特征选择算法
  •     3.3.1 基本遗传算法
  •     3.3.2 带控制策略的遗传算法
  •     3.3.3 多标签特征选择算法CGAcmi
  •   3.4 实验结果与分析
  •     3.4.1 对比算法与实验数据集
  •     3.4.2 预处理及参数设置
  •     3.4.3 实验结果与分析
  •   3.5 本章小结
  • 第4章 基于归一化条件互协方差算子的二次规划特征选择算法
  •   4.1 归一化条件互协方差算子
  •   4.2 基于归一化条件互协方差算子的二次规划特征选择算法
  •   4.3 实验结果与分析
  •     4.3.1 对比算法与实验数据集
  •     4.3.2 核函数选择
  •     4.3.3 预处理与参数设置
  •     4.3.4 实验结果与分析
  •   4.4 本章小结
  • 第5章 总结与展望
  •   5.1 总结
  •   5.2 展望
  • 参考文献
  • 附录
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 刘畅

    导师: 许建华

    关键词: 多标签分类,特征选择,非线性规划,条件互信息,遗传算法,归一化条件互协方差算子

    来源: 南京师范大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,自动化技术

    单位: 南京师范大学

    分类号: O221.2;TP18

    DOI: 10.27245/d.cnki.gnjsu.2019.000732

    总页数: 67

    文件大小: 4664K

    下载量: 32

    相关论文文献

    • [1].基于指数损失间隔的多标记特征选择算法[J]. 计算机技术与发展 2020(04)
    • [2].基于?_(2,1)范数的在线流特征选择算法[J]. 计算机与数字工程 2019(06)
    • [3].森林优化特征选择算法的增强与扩展[J]. 软件学报 2020(05)
    • [4].基于自步学习的半监督特征选择算法研究[J]. 电脑知识与技术 2020(15)
    • [5].基于图的特征选择算法综述[J]. 安徽大学学报(自然科学版) 2017(01)
    • [6].面向高维微阵列数据的集成特征选择算法[J]. 计算机工程与科学 2016(07)
    • [7].基于支持向量机的特征选择算法综述[J]. 信息工程大学学报 2014(01)
    • [8].一种改进的文本分类特征选择算法[J]. 微电子学与计算机 2011(12)
    • [9].基于邻域交互增益信息的多标记流特征选择算法[J]. 南京大学学报(自然科学) 2020(01)
    • [10].大数据中基于稀疏投影的在线特征选择算法[J]. 湖南科技大学学报(自然科学版) 2018(03)
    • [11].一种改进的动态流特征选择算法[J]. 计算机工程与应用 2012(18)
    • [12].特征选择算法研究综述[J]. 安徽广播电视大学学报 2019(04)
    • [13].多标记特征选择算法的综述[J]. 郑州大学学报(理学版) 2020(04)
    • [14].一种改进的类别区分词特征选择算法[J]. 计算机与现代化 2019(03)
    • [15].特征选择算法及应用综述[J]. 办公自动化 2018(21)
    • [16].海量高维数据下分布式特征选择算法的研究与应用[J]. 科技通报 2013(08)
    • [17].全局调距和声特征选择算法[J]. 计算机工程与应用 2019(02)
    • [18].基于标记权重的多标记特征选择算法[J]. 计算机科学 2017(10)
    • [19].多标记不完备数据的特征选择算法[J]. 计算机科学与探索 2019(10)
    • [20].一种基于支持向量数据描述的特征选择算法[J]. 智能系统学报 2015(02)
    • [21].基于多视角学习和注意力的特征选择算法[J]. 北京交通大学学报 2020(05)
    • [22].基于XGBoost的特征选择算法[J]. 通信学报 2019(10)
    • [23].用于轴承表面缺陷分类的特征选择算法[J]. 轴承 2018(01)
    • [24].基于森林优化特征选择算法的改进研究[J]. 软件学报 2018(09)
    • [25].面向代价敏感的多标记不完备数据特征选择算法[J]. 小型微型计算机系统 2018(12)
    • [26].一种基于谱理论的并行特征选择算法[J]. 计算机应用与软件 2010(11)
    • [27].改进的特征选择算法[J]. 计算机工程与设计 2008(22)
    • [28].基于分割策略的特征选择算法[J]. 计算机科学 2018(10)
    • [29].基于拉普拉斯评分的多标记特征选择算法[J]. 计算机应用 2018(11)
    • [30].基于特征关联的多标记谱特征选择算法[J]. 闽南师范大学学报(自然科学版) 2017(02)

    标签:;  ;  ;  ;  ;  ;  

    非线性规划形式的多标签特征选择算法的研究
    下载Doc文档

    猜你喜欢