文章介绍了数据缺失的现象、概念、出现的领域以及产生的原因,总结了数据缺失机制和数据缺失模式;综述了目前缺失数据常用的处理方法:加权法、删除法、统计学插补法以及机器学习插补法,并综合比较了各种方法的适用范围和优缺点;最后提出了针对高维数据的缺失处理、复合缺失数据特征的处理、新领域的缺失数据处理将是未来缺失数据处理方法的研究方向。
类型: 期刊论文
作者: 邓建新,单路宝,贺德强,唐锐
关键词: 缺失数据,处理方法,单一插补,多重插补,方法比较
来源: 统计与决策 2019年23期
年度: 2019
分类: 经济与管理科学,基础科学
专业: 数学,宏观经济管理与可持续发展
单位: 广西大学广西制造系统与先进制造技术重点实验室,广西大学机械工程学院
基金: 国家自然科学基金资助项目(71562002,51965006),广西自然科学基金资助项目(2018GXNSFAA050111),广西制造系统与先进制造技术重点实验室项目(16-380-12S011,17-259-05S006),广西高等教育本科教学改革工程项目(2017JGA126),广西研究生教育创新计划项目(YCSW2019035)
分类号: F224;O212
DOI: 10.13546/j.cnki.tjyjc.2019.23.005
页码: 28-34
总页数: 7
文件大小: 1434K
下载量: 1539
本文来源: https://www.lunwen90.cn/article/dffc777587dac0ff54a66f92.html