近年来不平衡分类问题受到广泛关注。SMOTE过采样通过添加生成的少数类样本改变不平衡数据集的数据分布,是改善不平衡数据分类模型性能的流行方法之一。本文首先阐述了SMOTE的原理、算法以及存在的问题,针对SMOTE存在的问题,分别介绍了其4种扩展方法和3种应用的相关研究,最后分析了SMOTE应用于大数据、流数据、少量标签数据以及其他类型数据的现有研究和面临的问题,旨在为SMOTE的研究和应用提供有价值的借鉴和参考。
类型: 期刊论文
作者: 石洪波,陈雨文,陈鑫
关键词: 不平衡数据分类,算法,过采样,欠采样,高维数据,分类型数据
来源: 智能系统学报 2019年06期
年度: 2019
分类: 信息科技,基础科学
专业: 数学,自动化技术
单位: 山西财经大学信息学院
基金: 国家自然科学基金资助项目(61801279),山西省自然科学基金项目(201801D121115,2014011022-2)
分类号: TP181;O212.2
页码: 1073-1083
总页数: 11
文件大小: 1812K
下载量: 721
本文来源: https://www.lunwen90.cn/article/abd2ca392cedddda6ed584f4.html