不平衡数据集论文
面向不平衡数据集的一种改进的k-近邻分类器
论文摘要心脏心律失常数据集的心电图(ECG)数据往往存在各心律失常类型下样本数量不平衡问题.针对此问题,提出了一种新的模式识别分类方法,即改进的基于核的差重建的加权k-近邻分类...密度聚类算法及其在海洋中尺度现象中的应用研究
论文摘要在大数据时代,数据量的爆炸式增长让传统人工处理方法无法应对。而数据挖掘技术可以快速高效发现数据内的潜在模式和知识,其中,聚类算法作为一种常用的数据处理方式已经广泛应用于...基于重采样策略的随机森林算法在乳腺肿瘤分类中的研究
论文摘要医学临床数据通常具有数据不平衡性,而不平衡数据集在分类时,分类器往往会偏向多数类,影响分类效果。针对乳腺肿瘤数据集不平衡问题,引入欠采样和过采样策略来平衡数据分布,采用...