一种基于模糊C均值聚类的稀疏数据缺失值填充方法

一种基于模糊C均值聚类的稀疏数据缺失值填充方法

论文摘要

缺失数据处理通常基于统计学的方法,在数据预处理阶段对缺失值进行填补,其效率和准确性并不高。因此,提出了一种基于模糊C均值(FCM)聚类的嵌入式填充方法(FCMSI)。此算法通过平均比率法(ARM)对稀疏数据进行初始化填充;采用局部距离策略对FCM进行改进,并对数据进行聚类;将缺失数据作为变量,在每次聚类迭代后的簇内采用协同过滤(CF)的思想对变量值进行替换,直到结果收敛。利用UCI标准数据集进行对比实验,并采用三种不同评价指标衡量,验证了FCMSI方法比传统填充方法性能显著提高。

论文目录

  • 0 引 言
  • 1 稀疏数据缺失值填充
  • 2 算法描述
  •   2.1 模糊C均值聚类算法
  •   2.2 协同过滤
  •   2.3 FCMSI算法
  • 3 实验结果及分析
  •   3.1 数据集
  •   3.2 实验评价指标
  •   3.3 实验结果分析
  • 4 结 论
  • 文章来源

    类型: 期刊论文

    作者: 张楷卉,李鹏

    关键词: 缺失数据填充,稀疏数据,模糊均值聚类,协同过滤

    来源: 黑龙江大学自然科学学报 2019年06期

    年度: 2019

    分类: 基础科学,信息科技

    专业: 计算机软件及计算机应用

    单位: 黑龙江大学创业教育学院,哈尔滨理工大学软件与微电子学院

    基金: 国家自然科学基金资助项目(61103149),黑龙江省普通高校基本科研业务费专项资金资助(LGYC2018JQ003)

    分类号: TP311.13

    DOI: 10.13482/j.issn1001-7011.2019.06.012

    页码: 750-756

    总页数: 7

    文件大小: 347K

    下载量: 110

    相关论文文献

    标签:;  ;  ;  ;  

    一种基于模糊C均值聚类的稀疏数据缺失值填充方法
    下载Doc文档

    猜你喜欢