Print

聚类算法综述

论文摘要

大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大类,并特别对大数据聚类作了较为系统的分析与总结。此外,概述并分析了各类聚类算法的研究进展及其应用概况,并结合研究课题讨论了算法的发展趋势。

论文目录

  • 0 引言
  • 1 聚类分析过程
  •   1.1 特征选择或变换
  •   1.2 聚类算法选择或设计
  •   1.3 聚类结果评价与物理解析
  • 2 相似性度量
  •   2.1 连续性变量的相似性度量
  •     1) 欧氏距离 (Euclidean Distance) 。
  •     2) 切比雪夫距离 (Chebyshev Distance) 。
  •     3) 曼哈顿距离 (Manhattan Distance) 。
  •     4) 闵可夫斯基距离 (Minkowski Distance) 。
  •     5) 马氏距离 (Mahalanobis Distance) 。
  •     6) 对称点距离 (Point Symmetry Distance) 。
  •     7) 相关系数 (Correlation Coefficient) 。
  •     8) 余弦相似度 (Cosine Similarity) 。
  •   2.2 离散变量的相似性度量
  •     2.2.1 二值变量的相似性度量方法
  •     2.2.2 多值变量的相似性度量方法
  •   2.3 混合变量的相似性度量
  • 3 聚类算法分类
  • 4 小数据聚类算法
  •   4.1 传统聚类
  •     4.1.1 划分聚类
  •     4.1.2 层次聚类
  •   4.2 智能聚类
  •     4.2.1 人工神经网络聚类
  •     4.2.2 核聚类
  •     4.2.3 序列数据聚类
  •     4.2.4 复杂网络聚类
  •     4.2.5 智能搜索聚类
  • 5 大数据聚类算法
  •   5.1 分布式聚类
  •   5.2 并行聚类
  •   5.3 高维聚类
  • 6 算法对比分析
  • 7 聚类结果评价
  • 8 结语
  • 文章来源

    类型: 期刊论文

    作者: 章永来,周耀鉴

    关键词: 聚类,相似性度量,大数据聚类,小数据聚类,聚类评价

    来源: 计算机应用 2019年07期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用

    单位: 中北大学软件学院

    基金: 国家自然科学基金资助项目(6160051296)~~

    分类号: TP311.13

    页码: 1869-1882

    总页数: 14

    文件大小: 837K

    下载量: 5391

    相关论文文献

    本文来源: https://www.lunwen90.cn/article/af9c656ff9d2e3af24319bf8.html