导读:本文包含了不平衡数据论文开题报告文献综述及选题提纲参考文献,主要关键词:聚类分析,子空间聚类,不平衡数据,聚类精度
不平衡数据论文文献综述
程铃钫,陈黎飞,赖晓燕,林燕[1](2019)在《不平衡数据软子空间聚类算法在临床医学中的应用与研究》一文中研究指出聚类分析是数据挖掘中重要的研究课题,在信息过滤、生物信息学,医学等领域得到广泛应用。本课题着重于自上而下的子空间聚类方法,主要原因是当前主要的此型算法都是以K-means或K-modes为基础的,在均匀效应的影响下,不平衡数据的问题是现有的软子空间算法不能有效聚类的,所以提出了一种基于划分的不平衡数据软子空间聚类新算法。所提算法提高了不平衡数据的聚类精度,在生物信息学和临床医学等领域具有一定的理论意义和实际应用价值。(本文来源于《软件》期刊2019年11期)
任佳丽,王文晶[2](2019)在《基于差分孪生卷积神经网络的大规模不平衡数据分类算法》一文中研究指出传统基于支持向量机的不平衡数据分类算法包含矩阵运算,无法应用于大规模的不平衡数据集。针对这种情况,提出基于差分孪生卷积神经网络的大规模不平衡数据分类算法。设计差分卷积机制增强卷积神经网络的深度结构表示能力,在不改变滤波器数量的情况下提高模型的判别能力。通过差分孪生卷积神经网络分别优化每个类的特征图,每个类关联多个超平面,根据输入样本与超平面的距离决定输出样本的类标签。基于多组不平衡数据集的实验结果表明,该算法实现了较好的分类性能。(本文来源于《计算机应用与软件》期刊2019年11期)
李根红[3](2019)在《基于省域层面数据的我国流通业集聚不平衡性研究》一文中研究指出本文通过我国省域数据进行实证研究,分析了我国流通业集聚的不平衡性。研究发现:在2009-2017年期间,我国流通业集聚发展经历了从集聚劣势到集聚优势的过程,但东、中、西叁大区域流通业集聚的不平衡性也比较明显,东部地区集聚优势较强而中西部地区表现出集聚劣势。通过叁大细分产业的研究则发现,不同产业集聚水平的区域不平衡性也是相异的,重庆和陕西等地流通业及细分产业的集聚水平都处在前列,而江苏和浙江等相对发达地区在交通运输仓储邮政业这一细分领域的集聚程度反而较低。最后,按照流通业细分产业的均衡发展以及流通业整体的区域均衡发展,提出了相应的对策建议。(本文来源于《商业经济研究》期刊2019年20期)
李鹏飞[4](2019)在《基于不平衡数据和神经网络算法的通信光缆故障预测分析》一文中研究指出光纤是通信网络的基础,承载着巨大的网络流量,一旦出现故障后影响较大。因此光缆故障预测是一个热门研究话题。论文针对该问题,基于光缆的基本参数和故障信息,采取神经网络模型进行故障分类。由于光缆故障是小概率事件,数据样本的类别分布存在不平衡问题,采取了SMOTE算法对不平衡数据进行处理,再通过分类模型进行分析研究。结果表明,预测模型总体的分类准确性为76.2%,对故障光缆的预测灵敏度为72.4%,效果比较好,能够给通信光缆运行维护工作提供一定的辅助作用。(本文来源于《信息系统工程》期刊2019年10期)
向军,郑钤[5](2019)在《多源不平衡噪声数据集成冲突消除仿真研究》一文中研究指出多源数据集成过程中存在相互冲突情况,消除冲突有利于信息共享和提高用户满意度。针对当前数据冲突消除相关研究成果存在查准率与查全率低的问题,提出基于K-半径子图的多源不平衡噪声数据集成冲突消除方法。利用网络侦听技术,通过将路由器与流量识别工作站放置在同一个物理网段中,所有路经路由器的多源数据包均会经过流量识别工作站完成多源数据采集。根据采集所得数据的K-半径子图描述数据上下文信息,并通过数据K-半径子图对比的方式,将数据相似程度与数据上下文相似程度相结合判定数据是否存在冲突。假设不存在冲突,则按一定规则将数据保存下来;假设存在冲突,则将冲突数据消除。实验结果表明,所提方法具有很高地查准率与查全率,整体运行效果良好,可为该领域发展提供强力支撑。(本文来源于《计算机仿真》期刊2019年10期)
梅颖,卢诚波[6](2019)在《面向不平衡数据集的一种改进的加权超限学习机分类算法》一文中研究指出标准的加权超限学习机在训练不平衡数据集时,只对不同类之间赋予类权值而没有对个体的样本赋予不同的权值,忽视了样本个体的差异.针对这种情况,利用标准的超限学习机估算个体样本的权值,并与类权值结合,提出了一种改进的双重加权超限学习机分类算法,算法能很好地处理分类任务中各类训练数据分布不平衡的情形.实验结果表明,双重加权超限学习机分类算法与单重加权超限学习机、无权超限学习机相比较,在提高分类精度方面取得了较好的效果.(本文来源于《数学的实践与认识》期刊2019年19期)
刘悦婷,张燕,孙伟刚[7](2019)在《基于局部密度改进的SVM不平衡数据集分类算法》一文中研究指出针对不平衡数据集数据分布不均匀及边界模糊的特点,提出基于局部密度改进的SVM不平衡数据集分类算法.该算法先将多数类划分成多个子类,并依据子类内每个样本的局部密度选出边界区域、靠近边界区域的与少数类数目相等的样本,与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器进行迭代优化.结果表明,与WSVM,ALSMOTE-SVM和基本SVM算法相比,该算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能.(本文来源于《宁夏大学学报(自然科学版)》期刊2019年03期)
孙艳歌,邵罕,杨艳聪[8](2019)在《基于代价敏感不平衡数据流分类算法》一文中研究指出在数据流分类学习过程中,类不平衡和概念漂移是两大挑战问题.在分析传统特征选择算法和代价敏感学习方法的基础上,将代价敏感学习算法的思想引入特征选择算法中,设计并实现了一种基于代价敏感的Relief F剪枝的数据流分类算法,不仅能删除冗余的特征,而且适应动态变化的数据流环境.与经典的算法进行分析比较,结果表明所提算法可显着提升分类效果.(本文来源于《信阳师范学院学报(自然科学版)》期刊2019年04期)
周建伟[9](2019)在《不平衡数据的下采样方法研究》一文中研究指出不平衡数据集会严重影响机器学习中的分类器性能。论文提出了一种基于高斯混合模型的下采样方法。利用高斯混合模型对负类数据进行拟合,根据每个高斯分量上数据的分布情况,即概率区间按比例进行下采样。此方法通过减少多数类样本数目达到了平衡类分布的目的,并且尽可能保持了多数类的数据分布。在6组UCI不平衡数据集上的实验结果表明,论文提出的下采样方法有效地提高了对不平衡数据的分类性能。(本文来源于《计算机与数字工程》期刊2019年09期)
李克文,谢鹏,路慎强[10](2019)在《基于不平衡数据类分布学习的特征选择方法》一文中研究指出在特征选择过程中,传统特征选择方法可能会因数据集分类不平衡而受到影响,论文提出一种基于不平衡数据类分布学习的特征选择方法。首先,该方法的损失函数由累加相对熵变形为连乘相对熵的形式从而将不平衡数据评价引入至损失函数中。然后,对新的损失函数进行变形及梯度求导得出损失函数下降的梯度方向,通过变步长梯度下降法使得损失函数收敛。最后,通过对学习到的类分布进行阈值控制从而筛选特征以达到特征选择的目的。论文采用了逻辑回归、随机森林、支持向量机和梯度提升决策树四种分类器,FSLDL(Feature Selection Method by Label Distribution Learning Based on Imbalanced Data)、PCA、SVM-RFE和F_classify四种特征选择方法,SMOTENN、NearMiss和ADASYN叁种不平衡数据采样方法在NASA故障数据集的KC1数据集上做了对比分析,结果表明论文提出的FSLDL在只进行特征选择的情况下对不平衡数据分类效果优于其他特征选择方法,在与不平衡数据采样方法结合时效果也有提升。(本文来源于《计算机与数字工程》期刊2019年09期)
不平衡数据论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
传统基于支持向量机的不平衡数据分类算法包含矩阵运算,无法应用于大规模的不平衡数据集。针对这种情况,提出基于差分孪生卷积神经网络的大规模不平衡数据分类算法。设计差分卷积机制增强卷积神经网络的深度结构表示能力,在不改变滤波器数量的情况下提高模型的判别能力。通过差分孪生卷积神经网络分别优化每个类的特征图,每个类关联多个超平面,根据输入样本与超平面的距离决定输出样本的类标签。基于多组不平衡数据集的实验结果表明,该算法实现了较好的分类性能。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
不平衡数据论文参考文献
[1].程铃钫,陈黎飞,赖晓燕,林燕.不平衡数据软子空间聚类算法在临床医学中的应用与研究[J].软件.2019
[2].任佳丽,王文晶.基于差分孪生卷积神经网络的大规模不平衡数据分类算法[J].计算机应用与软件.2019
[3].李根红.基于省域层面数据的我国流通业集聚不平衡性研究[J].商业经济研究.2019
[4].李鹏飞.基于不平衡数据和神经网络算法的通信光缆故障预测分析[J].信息系统工程.2019
[5].向军,郑钤.多源不平衡噪声数据集成冲突消除仿真研究[J].计算机仿真.2019
[6].梅颖,卢诚波.面向不平衡数据集的一种改进的加权超限学习机分类算法[J].数学的实践与认识.2019
[7].刘悦婷,张燕,孙伟刚.基于局部密度改进的SVM不平衡数据集分类算法[J].宁夏大学学报(自然科学版).2019
[8].孙艳歌,邵罕,杨艳聪.基于代价敏感不平衡数据流分类算法[J].信阳师范学院学报(自然科学版).2019
[9].周建伟.不平衡数据的下采样方法研究[J].计算机与数字工程.2019
[10].李克文,谢鹏,路慎强.基于不平衡数据类分布学习的特征选择方法[J].计算机与数字工程.2019