导读:本文包含了不均衡模型论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:不均衡,数据,模型,不平衡,算法,故障,标签。
不均衡模型论文文献综述
陶新民,李晨曦,李青,任超,刘锐[1](2019)在《不均衡最大软间隔SVDD轴承故障检测模型》一文中研究指出针对不均衡数据下的轴承故障检测问题,提出一种最大软间隔支持向量域描述(Maximum Soft Margin Support Vector Domain Description,MSM-SVDD)故障检测模型。该模型通过引入最大软间隔正则项,将传统支持向量域描述(SVDD)算法的分类边界向故障类偏移,进而提高算法的故障检测性能,同时对正则化项系数的取值范围进行了理论分析。实验部分讨论了正则化项系数、高斯核参数以及正常类样本数目对模型故障检测性能的影响,并给出了正则化项系数与高斯核参数的取值建议。实验结果表明,新提出的MSM-SVDD模型非常适合处理小样本不均衡数据下的故障检测问题。最后通过实测数据的对比实验,表明MSM-SVDD模型在不均衡数据下的故障检测性能较其他方法有较大幅度提升。(本文来源于《振动工程学报》期刊2019年04期)
孙淑晓,郑晓娜[2](2019)在《发展不均衡的城市中企业空间竞争模型》一文中研究指出研究了城市发展不均衡程度对双寡头竞争企业选址—价格均衡及利润的影响。特别地,拓展了传统Hotelling模型中消费者均匀分布假设,以刻画消费者分布不均衡程度。研究结果显示,当选址限制在市场空间时,企业最优选址总位于市场空间的两个不同端点处;当一个企业附近的消费者密度达到最大值时,该企业并不能获得最高利润;消费者均匀分布时,产业利润达到最大。当选址不限于市场空间时,具有市场优势的企业在其优势足够大时会选址于市场空间中,且产业利润总比受限时大。(本文来源于《管理现代化》期刊2019年04期)
包萍,刘运节[3](2019)在《不均衡数据集下基于生成对抗网络的改进深度模型故障识别研究》一文中研究指出由于传统轴承故障诊断方法依赖于信号处理能力且模型泛化能力差的问题,提出一种不均衡数据集下基于深度对抗网络的故障诊断方法,该方法首先通过构建小样本训练集进行生成对抗网络训练,将生成样本加入到原始小类别样本训练集中,得到样本训练集,降低不同类别样本的不平衡性;然后引入深度学习的模型优化技术,提出适合轴承故障诊断的深度卷积神经网络模型,该模型直接作用于训练样本集,自适应地从原始数据中逐层学习故障特征,实现不同故障的准确识别;为了增强诊断系统最终分类预测的准确性,引入Focal损失函数对分类层进行故障识别。大量的定性定量实验表明,所提的改进网络在检测率与误检率方面均优于现有的其他深度模型,并且拥有较快的收敛速度与泛化能力。(本文来源于《电子测量与仪器学报》期刊2019年03期)
姜思羽,钟晓玲,邱少健,宋恒杰[4](2019)在《结合标签相关性和不均衡性的多标签学习模型》一文中研究指出针对现有多标签学习算法较少兼顾标签间关联性和不平衡性的问题,提出一种同时考虑多标签间相关性与多标签不平衡问题的学习模型(A Multi-label Learning Model based on Label Correlation and Imbalance,MLCI).该学习模型针对每个标签类别,通过耦合其他标签类别以考量标签间的关联性,并降低缓解标签间不均衡比率,MLCI是一个将当前标签的二类不平衡学习器和多个与其他标签耦合的多类不平衡学习器结合的集成分类器.采用7种常用的多标签算法作为对比算法,针对yeast、scene、emotions和CAL500这4个开放数据集进行分类处理.实验结果表明,MLCI相比其他对比算法,在精度均值(Average-Precision)、排序损失(Ranking-Loss)、宏观平均AUC(Macro-Averaging AUC)和微观平均AUC(Micro-Averaging AUC) 4个性能评估指标上总体占明显优势.(本文来源于《哈尔滨工业大学学报》期刊2019年01期)
张俊涛,杨耀红,田宇[5](2018)在《基于风险的不均衡报价模糊优化模型》一文中研究指出本文利用模糊优化理论,考虑资金的时间价值,并考虑工程量增减的模糊性,建立了不平衡报价的模糊优化模型,并把截集水平作为风险水平,对优化结果进行二次优化。最后结合一个算例进行了计算分析。(本文来源于《价值工程》期刊2018年10期)
崔琳爽[6](2018)在《复合XGBoost模型在不均衡数据集分类预测上的应用》一文中研究指出分类问题是日常决策中经常遇到的问题。传统的分类算法前提假设是数据集的类别均衡或者每一类的错分代价一样,但是在现实中面对的数据集一般是不均衡的,特别是医疗诊断、商品搭售推荐等领域,因此研究不均衡数据集分类问题对解决实际问题很有价值。本文首先通过文献分析,详细地介绍了数据集层面和分类算法层面对不均衡数据集分类问题的现有解决方法。提出了利用复合XGBoost模型,即重采样算法和XGBoost算法相结合的方法,对不均衡数据集进行二分类预测,并将该模型应用于用户商品偏好的预测中。本文在构建用户商品偏好预测模型时,从四个方面选取了31个特征变量,通过建立逻辑斯蒂回归模型、复合逻辑斯蒂回归模型、AdaBoost模型、随机森林模型、XGBoost模型及复合XGBoost模型,对用户是否会购买推荐的产品B进行了预测。利用Recall、F1值、AUC值等指标进行对比分析,结果表明复合XGBoost模型中的EasyEnsemble-XGB模型的分类预测效果最好。通过EasyEnsemble-XGB模型特征重要性分析,得出五个重要特征,这些信息可以更好地刻画目标用户。在不均衡数据集分类模型的实际应用中,本文提出要根据实际业务目标来调整阈值以输出分类标签,而不是固定使用0.5作为分类阈值。(本文来源于《兰州大学》期刊2018-04-01)
赵琳琳,温国锋,邵良杉[7](2018)在《不均衡数据下的采空区煤自燃PCA-AdaBoost预测模型》一文中研究指出为提高不均衡数据下采空区自然发火预测准确率,选取O_2浓度等作为指标,利用主成分分析法(PCA)提取指标的主成分,并将主成分作为自适应增强算法(AdaBoost)输入参数,发火情况作为AdaBoost算法输出参数,建立不均衡数据下采空区自然发火PCA-AdaBoost预测模型;以张家口宣东2号矿为例,选取20组实测数据作为训练样本,用于训练模型;利用受试者工作特征曲线下的面积进行评价预测效果;利用训练好的模型预测15组测试样本,并将结果与粒子群优化支持向量机(PSO-SVM)模型进行比较。结果表明:在不均衡数据集条件下,利用PCA提取的算例的3个主成分包含原始6个指标的86.831%信息,降低了指标相关性,实现了降维;温度和CH_4浓度对发火影响更大;所建模型的预测结果与实际情况吻合,其在预测精度和收敛速度方面优于PSO-SVM模型。(本文来源于《中国安全科学学报》期刊2018年03期)
陈旭,刘鹏鹤,孙毓忠,沈曦,张磊[8](2019)在《面向不均衡医学数据集的疾病预测模型研究》一文中研究指出基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系统往往将临床病例作为训练数据集,以临床表现的描述文字为特征,采用统计机器学习方法构建疾病预测模型.然而,在医疗领域往往存在着样本数据集不均衡的问题,导致模型的预测效果降低.欠采样技术是目前解决样本不均衡问题的常用手段.其主要采用一定的方法从多数类样本中抽取部分样本,与少数类样本组成平衡数据集后再构建模型.现有的欠采样方法往往可以显着提高模型对少数类样本的召回率,然而其通常也会造成模型准确率的降低,从而限制了预测模型的整体提升效果.为此,该文提出了一种新的基于迭代提升欠采样的集成分类方法(Under-Sampling with Iteratively Boosting,USIB),该方法迭代地从多数类样本中进行欠抽样,构建多组弱分类器,并采用加权组合方式将这些弱分类器构成一个强分类器,从而提升样本不平衡条件下单种疾病预测效果.另外,医学病例样本数据集通常是多类别、多标签的,为此,该文将多个单种疾病的预测模型进行组合构成一个多标签疾病预测模型,以满足临床意义上的多病种以及并发症的诊断.为了进一步提升多标签预测模型的效果,该文设计了一种基于标签最大互信息生成树的标签选择方法(Labels Selection method based on Maximum Mutual Information Spanning Tree,LS-MMIST),该方法根据原始数据集的分布构建标签之间的最大互信息生成树,在每一次的样本预测阶段,借助树中疾病标签之间的关系确定最终的预测标签集合.实验方面,该文首先选择叁种公开的不均衡二分类数据集和我们私有的四种稀有疾病的数据集,对该文提出的迭代提升欠采样方法进行性能评估.其次,分别对比了该文提出的多标签预测模型与现有的多标签预测技术在中医和西医两种多标签数据集上的预测性能.实验结果显示,相对于目前主流的八种欠采样以及两种集成采样技术,该文提出的迭代提升欠采样方法在各个不均衡二分类数据集上的F1值平均提升22.58%;与现有的各种多标签预测技术相比,该文提出的多标签预测方法在西医和中医数据集上正确率分别提升6.30%和12.43%,召回率分别提升4.33%和5.86%,F1值分别提升5.48%和11.16%.(本文来源于《计算机学报》期刊2019年03期)
王璐,王沁[9](2012)在《中国投资与消费不均衡发展的实证研究:基于因子-Copula模型》一文中研究指出在现有对投资与消费关系研究缺乏定量研究的基础上,引入Copula函数来探讨投资与消费的变动关系。首先利用因子分析进行投资与消费高维指标的降维处理,这样有效避免了Copula函数在多维变量下的建模复杂性;接着利用半参数建模方法选择了Cumbel函数来描述当前二者的关系;结果显示当前我国投资与消费存在显着不均衡关系,同时二者具有非对称性、非线性等数量特征;最后对上述研究结论进行了经济解释分析。(本文来源于《数理统计与管理》期刊2012年06期)
刁翠霞[10](2012)在《面向不均衡数据集分类的W-SVM模型》一文中研究指出支持向量机(Support Vector Machine,SVM)作为一种机器学习方法自1995年被Vapnik提出以来就一直受到广泛关注,分类是SVM实现数据挖掘的重要目标之一,当满足类别样本均衡的前提时,SVM具有良好的分类性能,但是现实问题的样本往往是不均衡的,因此为了使SVM适应不均衡样本学习,需要通过变换样本、改进算法或转化问题等来解决。本文以中小企业板的财务预警模型为研究的问题背景,由于样本中风险企业和无风险企业数量的显着不均衡,致使SVM识别风险企业的能力急剧下降。为了解决以上样本不均衡情况的二类分问题,本文从改进算法的角度出发,主要的研究工作包括以下叁项:第一,将SVM中超平面的法向量近似为各个属性的客观权重,将主观权重作为客观权重的取值约束,加入到二次规划问题的约束条件中,推导得出对偶问题的二次规划的标准形,称之为W-SVM,实验表明W-SVM在解决类别不均衡学习时比SVM更有效;第二,将W-SVM同已有的适应不均衡样本学习的C-SVM模型结合,得到CW-SVM,并通过实验对比表明了CW-SVM的解集比C-SVM对应的唯一最优解更具有参考价值;第叁,为使得W-SVM具备更好的识别少类样本的能力,减少寻优过程的工作量,提出一种沿特定方向限制法向量取值的假设,该假设比主客观权重融合思想更容易被理解,接着通过实验分析发现,该假设提到的寻优方法是合理可行的。(本文来源于《合肥工业大学》期刊2012-04-01)
不均衡模型论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
研究了城市发展不均衡程度对双寡头竞争企业选址—价格均衡及利润的影响。特别地,拓展了传统Hotelling模型中消费者均匀分布假设,以刻画消费者分布不均衡程度。研究结果显示,当选址限制在市场空间时,企业最优选址总位于市场空间的两个不同端点处;当一个企业附近的消费者密度达到最大值时,该企业并不能获得最高利润;消费者均匀分布时,产业利润达到最大。当选址不限于市场空间时,具有市场优势的企业在其优势足够大时会选址于市场空间中,且产业利润总比受限时大。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
不均衡模型论文参考文献
[1].陶新民,李晨曦,李青,任超,刘锐.不均衡最大软间隔SVDD轴承故障检测模型[J].振动工程学报.2019
[2].孙淑晓,郑晓娜.发展不均衡的城市中企业空间竞争模型[J].管理现代化.2019
[3].包萍,刘运节.不均衡数据集下基于生成对抗网络的改进深度模型故障识别研究[J].电子测量与仪器学报.2019
[4].姜思羽,钟晓玲,邱少健,宋恒杰.结合标签相关性和不均衡性的多标签学习模型[J].哈尔滨工业大学学报.2019
[5].张俊涛,杨耀红,田宇.基于风险的不均衡报价模糊优化模型[J].价值工程.2018
[6].崔琳爽.复合XGBoost模型在不均衡数据集分类预测上的应用[D].兰州大学.2018
[7].赵琳琳,温国锋,邵良杉.不均衡数据下的采空区煤自燃PCA-AdaBoost预测模型[J].中国安全科学学报.2018
[8].陈旭,刘鹏鹤,孙毓忠,沈曦,张磊.面向不均衡医学数据集的疾病预测模型研究[J].计算机学报.2019
[9].王璐,王沁.中国投资与消费不均衡发展的实证研究:基于因子-Copula模型[J].数理统计与管理.2012
[10].刁翠霞.面向不均衡数据集分类的W-SVM模型[D].合肥工业大学.2012