导读:本文包含了最小最大模块化支持向量机论文开题报告文献综述及选题提纲参考文献,主要关键词:半监督学习,最小最大模块化支持向量机,样本划分与分配,样本抽取
最小最大模块化支持向量机论文文献综述
吴燕平[1](2016)在《半监督最小最大模块化支持向量机研究》一文中研究指出最小最大模块化支持向量机(M3-SVM)是一种可以有效处理大规模数据分类问题的有监督集成学习算法。然而,对大规模数据进行标注是“昂贵的”,甚至是不可行的。为了将最小最大模块化支持向量机拓展以处理那些未标记数据,本文将最小最大模块化支持向量机和半监督学习相结合进行研究。本文研究的内容主要包含以下两个部分,一方面是提出一种半监督最小最大模块化支持向量机(SS-M3-SVM)算法。在SS-M3-SVM算法中,首先对有标记数据集和未标记数据集进行任务划分,然后将有标记样本子集和未标记样本子集两两结合,形成多个新的训练子集,并在这些训练子集中探索其中包含的隐藏变量。在求取了隐藏变量之后,将隐藏变量对有标记样本的后验概率作为有标记样本的新特征,这样新特征中包含了未标记样本的一些判别信息。最后在包含了新特征的有标记样本子集上分别训练支持向量机(SVM)分类器,并按照最小最大规则集成实现半监督最小最大模块化支持向量机。另一方面,在半监督最小最大模块化支持向量机算法的基础上,从未标记数据抽取以及未标记样本和有标记样本关联矩阵的角度,提出了基于抽取策略的半监督最小最大模块化支持向量机(Boost-M3-SVM)算法。与半监督最小最大模块化支持向量机不同的是,其训练子集中的未标记数据是通过抽取而不是任务划分获得的并且其有标记样本和未标记样本的关联矩阵采用相似性度量而不是距离度量。实验证明半监督策略能够有效提升传统最小最大模块化支持向量机的学习能力。(本文来源于《南京邮电大学》期刊2016-11-18)
赵研[2](2015)在《基于云平台的最小最大模块化支持向量机的研究》一文中研究指出支持向量机是一种经典的模式分类方法,它是在VC维和结构风险最小化原则等理论的基础上提出来的。由于其良好的泛化性能,支持向量机已经被广泛应用到许多领域。支持向量机的学习过程的本质是一个求解二次规划的过程,需要的学习时间随着样本个数的增多成平方级增加。因此,使用传统的支持向量机来解决大规模的学习问题是相当费时的,甚至是无法实现的。为了提高支持向量机的学习效率,Lu教授提出了最小最大模块化支持向量(M3-SVM)算法。该算法采用分而治之的思想将大规模的问题分解为若个相互独立的、规模较小的子问题,然后分别对这些子问题进行训练。虽然这样能够大幅度的降低学习需要的时间,但这些子问题依然串行学习的。为了进一步提高支持向量机的学习效率,我们将M3-SVM与Hadoop平台相结合。本论文的工作主要包括以下叁个方面:第一,基于云计算平台的最小最大模块化支持向量机研究。M3-SVM提出之初就考虑到了分布式并行计算,因此可以将M3-SVM算法与MapReduce并行框架结合,充分利用多机的计算资源,以达到提高算法效率的目的。实验结果表明:M3-SVM算法的并行化能够在保证其泛化能力的前提下,明显地提高模型的训练速率。因此,并行化的M3-SVM算法可以有效处理大规模模式分类问题。第二,基于云平台的概念漂移数据流分类的研究。现实生活中存在大量的流式数据,并且随着时间的推移,数据流中包含的概念可能发生或多或少的漂移。如何能够及时地检测出这种概念漂移,并训练出符合当前数据的分类器,是当前模式分类研究所面临的挑战之一。为此,我们将并行M3-SVM应用到数据流的分类研究中,使其能够实时地检测出漂移现象以及训练出符合当前数据的分类器模型。第叁,基于云平台的最小最大模块化支持向量机模式分类系统开发。该系统以模式分类为核心,设计了一个数据安全的、界面友好的、可交互的、可扩展的和可维护的最小最大模块化支持向量机模式分类系统。该系统最大的特点是提供模式分类算法的可视化操作,其中包含了运行平台的选择、数据集的加载以及模式分类等应用功能。(本文来源于《南京邮电大学》期刊2015-03-01)
赵研,李云[3](2014)在《基于MapReduce的并行化最小最大模块化支持向量机研究》一文中研究指出最小最大模块化支持向量机(M3-SVM)是对大规模数据进行模式分类的有效方法.为了进一步提高M3-SVM算法处理大规模数据的效率.基于MapReduce的编程模型实现了M3-SVM的并行化.并行化主要分为两个部分:1)将M3-SVM中的多个任务分解进行并行化;2)将M3-SVM中用来训练基分类器SVM的序列最小优化算法(SMO)进行并行化.在多个现实数据集上的实验结果表明基于MapReduce的并行化最小最大模块化支持向量机算法不仅具有较好的可靠性,而且比传统的最小最大模块化支持向量机算法具有更好的时间效率.(本文来源于《计算机研究与发展》期刊2014年S2期)
余艺[4](2014)在《基于随机子空间的最小最大模块化支持向量机研究与实现》一文中研究指出最小最大模块化支持向量机(M3-SVM)是一种能够有效处理大规模数据分类问题的集成学习方法。为了提高对大规模数据和不平衡数据的分类性能,本文提出一个基于随机子空间的M3-SVM算法,来实现降维和增加其特征层面上的集成机制。该方法通过提高基分类器准确率,增加基分类器之间的差异性,最终提高整个最小最大模块化“网络”的集成性能。该方法除了提高大规模数据分类的性能,还能与并行计算系统相结合,充分利用其本身具有的并行特点,极大提高其分类效率。本论文主要研究内容包括以下两个方面:第一,提出了基于随机子空间的M3-SVM算法。该方法从特征层面上对各个基分类器的训练样本进行优化,并且通过该方法获得不同的特征子集来提高基分类器之间的差异性以得到更优的分类性能,从而进一步提高最小最大模块化网络的分类性能。第二,设计和实现了基于消息传递接口(MPI)的M3-SVM算法模型。M3网络在提出之初就是考虑到要充分利用分布式并行计环境,来解决大规模数据的分类问题。因此开发了基于MPI并行环境的M3-SVM算法,充分利用分布式计算资源提高算法的运行效率。通过在现实数据集(包括不平衡数据集)上的实验,验证了随机子空间策略的有效性。同时通过实验分析了基于随机子空间的M3-SVM中基分类器之间的差异性。此外,还通过实验验证了并行M3-SVM算法的运行效率。(本文来源于《南京邮电大学》期刊2014-03-01)
余艺,吴家皋,李云[5](2014)在《基于随机子空间的最小最大模块化支持向量机》一文中研究指出最小最大模块化支持向量机(M3-SVM)是一种对大规模数据进行模式分类的有效方法.为进一步提高M3-SVM对高维大规模不平衡数据的分类性能,文中分析多种随机子空间策略,并将其与M3-SVM相结合,以实现降维和增加特征层面上的集成机制,从而得到一类基于随机子空间的最小最大模块化支持向量机(M3-SVM-RS).在现实数据集上验证随机子空间策略的有效性,同时通过实验分析M3-SVM-RS中各个子模块(基分类器)之间的差异性.(本文来源于《模式识别与人工智能》期刊2014年02期)
解晓敏[6](2012)在《最小最大模块化支持向量机数据划分及其应用研究》一文中研究指出随着信息技术的不断进步,现实领域产生了海量的数据。传统简单的分类器无法对海量数据准确地进行分类,而已有的研究表明,集成学习方法是一种有效的解决海量数据分类的方法。本文研究的是基于涌现理论的集成学习方法——最小最大模块化支持向量机(M3-SVM)。M3-SVM主要分成两个部分:首先对海量数据集采用一定的划分策略进行分解,然后通过MIN规则和MAX规则集成各个基分类器的结果。对数据集划分策略来说,算法的优劣在很大程度上影响着M3网络的性能。所以如何找到一种有效且复杂度较低的训练集划分方法,从而得到相对平衡的划分子集对M3网络非常重要。M3网络中已采用了随机划分、超平面划分、等分割聚类、谱聚类和基于先验知识等多种数据划分方法。但是这些划分方法或者没有考虑到原始数据集的分布属性,或者过于复杂。针对此问题,本文提出了一种基于优化的二分K-means的训练集划分方法,它时间复杂度较低且可以有效地避免陷入局部最优解。但是二分K-means的准则函数只考虑了簇内的紧凑性,而没有考虑到簇间的差异性,不能有效地对不平衡数据进行分类。于是本文对二分K-means的准则函数进一步研究,提出了基于均衡化函数的二分K-means的训练集划分方法。基于均衡化函数的二分K-means的训练集划分方法不仅可以得到全局最优解,且时间复杂度较低,还可以得到相对均衡的划分子集。在现实的数据集上的实验结果表明,基于均衡化函数的二分K-means划分方法在不提高时间开支的情况下有效的提高了M3-SVM的分类准确率。入侵检测数据存在着数据量大且严重不平衡的问题,为了验证基于均衡化函数的二分K-means划分方法对不均衡数据集有较好的划分效果,本文在现实的入侵检测数据集KDD CUP99上进行了实验。结果表明,本文提出的划分方法能有效提高M3-SVM的检测性能。(本文来源于《南京邮电大学》期刊2012-03-01)
叶志飞[7](2009)在《并行化最小最大模块化支持向量机及其在专利分类中的应用》一文中研究指出超大规模机器学习问题往往是许多机器学习算法在实际应用中的一大限制。这种大规模问题经常会遇到,比如专利分类。即便是像支持向量机这样高效率的学习算法,面对超大规模的数据,照样会难以克服。在这种情况下,突破单机限制,利用丰富的并行计算资源,解决这些大规模学习问题往往是比较可行的办法。最小最大模块化支持向量机(M3-SVM)是基于“分而治之”的思想解决大规模问题的有效学习算法。它通过分解大规模问题,变成大量小规模问题进行学习,并通过有效的分类器组合算法将他们重新组合,成为大规模问题的原始解,该算法具有天生的并行特性。本研究主要探讨在并行计算环境下,并行M3-SVM的实现和特点,分析其并行训练和测试时间复杂度。在原有的最小最大模块化并行测试算法基础上,提出了基于流水化作业的对称分类器选择(SCS)算法、非对称分类器选择(ACS)算法和决策树分类器选择(TCS)算法。实验证明利用流水化作业的分类器选择算法大大提高了分类器测试的效率。在问题划分环节上,我们提出了质心连线划分方法,在不使用先验知识的情况下,该划分方法有效提高了分类效果。在应用方面,本研究利用并行最小最大模块化支持向量机解决超大规模的专利分类问题。我们主要在计算机集群环境下,对日文专利分类问题进行比较深入的研究。对比M3-SVM与传统SVMlight,我们发现M3-SVM有更高的学习效率和更好的分类精度。此外,因为M3-SVM通过任务分解可以把不平衡的大规模问题分解成许多平衡的子问题,所以它能有效解决不平衡的模式分类问题。本研究在叁个不同领域的不平衡数据上,通过实验比较系统地对比了M3-SVM与几种流行的解决不平衡分类问题的方法。实验结果表明,相比代价敏感学习和SMOTE采样等方法,M3-SVM能更有效地解决不平衡分类问题。(本文来源于《上海交通大学》期刊2009-01-01)
文益民,吕宝粮[8](2005)在《最小最大模块化支持向量机改进研究》一文中研究指出该文提出了一种新的聚类算法以实现训练数据的等分割并将其应用于最小最大模块化支持向量机(M3-SVM)。仿真实验表明:当训练数据不是同分布时,与随机分割方法相比,该文提出的聚类算法不但能提高M3-SVM的一般化能力,缩短训练时间,还能减少支持向量。(本文来源于《计算机工程与应用》期刊2005年19期)
最小最大模块化支持向量机论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
支持向量机是一种经典的模式分类方法,它是在VC维和结构风险最小化原则等理论的基础上提出来的。由于其良好的泛化性能,支持向量机已经被广泛应用到许多领域。支持向量机的学习过程的本质是一个求解二次规划的过程,需要的学习时间随着样本个数的增多成平方级增加。因此,使用传统的支持向量机来解决大规模的学习问题是相当费时的,甚至是无法实现的。为了提高支持向量机的学习效率,Lu教授提出了最小最大模块化支持向量(M3-SVM)算法。该算法采用分而治之的思想将大规模的问题分解为若个相互独立的、规模较小的子问题,然后分别对这些子问题进行训练。虽然这样能够大幅度的降低学习需要的时间,但这些子问题依然串行学习的。为了进一步提高支持向量机的学习效率,我们将M3-SVM与Hadoop平台相结合。本论文的工作主要包括以下叁个方面:第一,基于云计算平台的最小最大模块化支持向量机研究。M3-SVM提出之初就考虑到了分布式并行计算,因此可以将M3-SVM算法与MapReduce并行框架结合,充分利用多机的计算资源,以达到提高算法效率的目的。实验结果表明:M3-SVM算法的并行化能够在保证其泛化能力的前提下,明显地提高模型的训练速率。因此,并行化的M3-SVM算法可以有效处理大规模模式分类问题。第二,基于云平台的概念漂移数据流分类的研究。现实生活中存在大量的流式数据,并且随着时间的推移,数据流中包含的概念可能发生或多或少的漂移。如何能够及时地检测出这种概念漂移,并训练出符合当前数据的分类器,是当前模式分类研究所面临的挑战之一。为此,我们将并行M3-SVM应用到数据流的分类研究中,使其能够实时地检测出漂移现象以及训练出符合当前数据的分类器模型。第叁,基于云平台的最小最大模块化支持向量机模式分类系统开发。该系统以模式分类为核心,设计了一个数据安全的、界面友好的、可交互的、可扩展的和可维护的最小最大模块化支持向量机模式分类系统。该系统最大的特点是提供模式分类算法的可视化操作,其中包含了运行平台的选择、数据集的加载以及模式分类等应用功能。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
最小最大模块化支持向量机论文参考文献
[1].吴燕平.半监督最小最大模块化支持向量机研究[D].南京邮电大学.2016
[2].赵研.基于云平台的最小最大模块化支持向量机的研究[D].南京邮电大学.2015
[3].赵研,李云.基于MapReduce的并行化最小最大模块化支持向量机研究[J].计算机研究与发展.2014
[4].余艺.基于随机子空间的最小最大模块化支持向量机研究与实现[D].南京邮电大学.2014
[5].余艺,吴家皋,李云.基于随机子空间的最小最大模块化支持向量机[J].模式识别与人工智能.2014
[6].解晓敏.最小最大模块化支持向量机数据划分及其应用研究[D].南京邮电大学.2012
[7].叶志飞.并行化最小最大模块化支持向量机及其在专利分类中的应用[D].上海交通大学.2009
[8].文益民,吕宝粮.最小最大模块化支持向量机改进研究[J].计算机工程与应用.2005
标签:半监督学习; 最小最大模块化支持向量机; 样本划分与分配; 样本抽取;