缺失数据处理通常基于统计学的方法,在数据预处理阶段对缺失值进行填补,其效率和准确性并不高。因此,提出了一种基于模糊C均值(FCM)聚类的嵌入式填充方法(FCMSI)。此算法通过平均比率法(ARM)对稀疏数据进行初始化填充;采用局部距离策略对FCM进行改进,并对数据进行聚类;将缺失数据作为变量,在每次聚类迭代后的簇内采用协同过滤(CF)的思想对变量值进行替换,直到结果收敛。利用UCI标准数据集进行对比实验,并采用三种不同评价指标衡量,验证了FCMSI方法比传统填充方法性能显著提高。
类型: 期刊论文
作者: 张楷卉,李鹏
关键词: 缺失数据填充,稀疏数据,模糊均值聚类,协同过滤
来源: 黑龙江大学自然科学学报 2019年06期
年度: 2019
分类: 基础科学,信息科技
专业: 计算机软件及计算机应用
单位: 黑龙江大学创业教育学院,哈尔滨理工大学软件与微电子学院
基金: 国家自然科学基金资助项目(61103149),黑龙江省普通高校基本科研业务费专项资金资助(LGYC2018JQ003)
分类号: TP311.13
DOI: 10.13482/j.issn1001-7011.2019.06.012
页码: 750-756
总页数: 7
文件大小: 347K
下载量: 110
本文来源: https://www.lunwen90.cn/article/e638a941d3818b7b5a069075.html