聚类算法综述
论文摘要
大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大类,并特别对大数据聚类作了较为系统的分析与总结。此外,概述并分析了各类聚类算法的研究进展及其应用概况,并结合研究课题讨论了算法的发展趋势。
论文目录
0 引言1 聚类分析过程 1.1 特征选择或变换 1.2 聚类算法选择或设计 1.3 聚类结果评价与物理解析2 相似性度量 2.1 连续性变量的相似性度量 1) 欧氏距离 (Euclidean Distance) 。 2) 切比雪夫距离 (Chebyshev Distance) 。 3) 曼哈顿距离 (Manhattan Distance) 。 4) 闵可夫斯基距离 (Minkowski Distance) 。 5) 马氏距离 (Mahalanobis Distance) 。 6) 对称点距离 (Point Symmetry Distance) 。 7) 相关系数 (Correlation Coefficient) 。 8) 余弦相似度 (Cosine Similarity) 。 2.2 离散变量的相似性度量 2.2.1 二值变量的相似性度量方法 2.2.2 多值变量的相似性度量方法 2.3 混合变量的相似性度量3 聚类算法分类4 小数据聚类算法 4.1 传统聚类 4.1.1 划分聚类 4.1.2 层次聚类 4.2 智能聚类 4.2.1 人工神经网络聚类 4.2.2 核聚类 4.2.3 序列数据聚类 4.2.4 复杂网络聚类 4.2.5 智能搜索聚类5 大数据聚类算法 5.1 分布式聚类 5.2 并行聚类 5.3 高维聚类6 算法对比分析7 聚类结果评价8 结语
文章来源
类型: 期刊论文
作者: 章永来,周耀鉴
关键词: 聚类,相似性度量,大数据聚类,小数据聚类,聚类评价
来源: 计算机应用 2019年07期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用
单位: 中北大学软件学院
基金: 国家自然科学基金资助项目(6160051296)~~
分类号: TP311.13
页码: 1869-1882
总页数: 14
文件大小: 837K
下载量: 5391
相关论文文献
本文来源: https://www.lunwen90.cn/article/af9c656ff9d2e3af24319bf8.html