属性选择算法论文_李佳烨,张乐园,雷聪

导读:本文包含了属性选择算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:属性,算法,函数,空间,图拉,稀疏,理论。

属性选择算法论文文献综述

李佳烨,张乐园,雷聪[1](2019)在《基于核函数的低秩非线性属性选择算法》一文中研究指出高维的数据之间除了有线性关系之外,还有非线性的关系,为此提出一种基于核函数的低秩非线性属性选择算法。通过核函数把数据的每个属性都映射到高维空间,在高维空间中表示出属性之间的非线性关系;通过低秩约束排除噪声的干扰,利用高维空间中数据属性对应的稀疏正则化因子进行属性选择。核函数映射可以找出数据属性之间的非线性关系,低秩约束相当于对高维数据的全局结构进行子空间学习。该算法是一种嵌入了低秩结构的非线性属性选择算法。实验结果表明,该算法比其它的属性选择算法具有更好的效果。(本文来源于《计算机工程与设计》期刊2019年09期)

许力分,倪志伟,朱旭辉,贾凯,伍章俊[2](2019)在《融合基于MapReduce并行改进二元蚁群算法与分形维数的属性选择方法》一文中研究指出属性选择是数据挖掘领域用于降低数据特征维度的预处理方法.针对大数据环境下高维数据的属性约简问题,提出了融合基于MapReduce并行改进二元蚁群算法与分形维数的属性选择方法.首先,引入了参数控制的位置更新策略、对蚂蚁个体与种群进行交叉变异、重新定义阻塞机制的信息素更新,提出了并行改进的二元蚁群算法MRIBACO.其次,以并行二元蚁群算法作为离散解空间的搜索策略,结合分形维数提出了属性选择模型.在6个UCI数据集上的实验结果表明,较其他方法计算效率更优,同时表明了其有效性与稳定性.(本文来源于《系统科学与数学》期刊2019年06期)

朱永华[3](2019)在《属性选择算法研究》一文中研究指出不管是科学研究还是工业领域,都已经与各式各样的数据密不可分。随着精度要求的提高,高维数据变得愈加普遍。然而,高维数据不仅带来存储成本和计算开销的大幅增加,其中存在的大量冗余会给机器学习模型带来干扰,并最终导致获取知识的不准确。内在的认知模型往往仅存在于少数属性之中,意味着高维数据存在大量冗余,而用来决策的属性只占少数。因此,在进行数据挖掘或者知识发现之前,需要对高维数据进行预处理,即通过降低数据维度,避免冗余干扰,从而有效提高分类、回归、聚类等数据处理手段的准确性。数据降维技术作为重要的数据预处理方法在机器学习、模式识别、工业生产、科研领域都扮演着极其重要的角色。子空间学习和属性选择是两种主要的数据降维方法,子空间学习是鲁棒性的投影模型,而属性选择是解释性的选择模型,本文旨在稀疏属性选择框架中嵌入子空间正则化因子提出新的属性选择算法,使算法同时具有鲁棒性和解释性。具体来说:1.提出基于自表达和双稀疏惩罚的无监督属性选择算法。通过利用属性自表达损失函数对数据进行重构,然后同时利用l1范数正则项和l2,1范数正则项对重构系数矩阵进行稀疏惩罚,从而实现对冗余属性的双重筛选,使保留下来的属性均为最重要属性。2.提出基于自表达和主成分分析(PCA)正则项嵌入的无监督属性选择算法。通过将经典的子空间学习算法PCA嵌入到稀疏属性选择框架中,在保持数据主信息量不变的前提下学习各属性重要性,从而剔除冗余属性。3.提出基于自适应结构学习和低秩约束的属性选择算法。利用低秩正则项在充满噪声的高维数据中捕捉数据隐藏的全局结构,且利用动态图结构学习捕捉数据的真实局部结构特性,从而为模型的训练提供充足信息并最终提高属性选择的准确性。利用真实公开数据集对提出算法进行验证,在不同的评价指标下,本文提出的算法优于最新的属性选择算法。(本文来源于《广西大学》期刊2019-06-01)

甘江璋[4](2019)在《基于自步学习和鲁棒估计的属性选择算法研究》一文中研究指出信息化时代的高维大数据通常呈现高维,多样性的特点。由于这些数据在积累的过程没有经过选择,使得高维大数据存在大量的不相关,冗余的属性,而能有效表达数据功能的属性被隐藏其中。这不但会增加存储数据所需的空间,还会消耗大量的计算资源,特别是随着数据维度的增加达到某一个值时,反而会导致数据挖掘算法性能的下降。因此对高维数据进行维数约简对于解决目前高维数据面临的诸多问题具有重要意义。属性选择作为维数约简的一种有效方法,在可靠性和对结果的解释性上都好于子空间学习方法,但子空间学习可用于探索数据的内部结构。所以本文结合这两种方法,从自步学习和鲁棒估计的角度,针对目前的属性选择算法未能充分考虑噪声和异常值影响以及忽略实现世界中的数据大多存在的流行结构从而导致的数据挖掘算法性能不佳等问题,提出了两种属性选择算法。具体如下:(1)针对现有属性选择模型没有充分考虑离群训练样本的影响而导致模型泛化能力差问题,提出一种结合自步学习和稀疏学习的有监督属性选择算法。具体地,首先通过自步学习理论优先选择高置信度的样本来训练初始属性选择模型,然后依次加入次高置信度的训练样本增加初始选择模型的泛化能力,直至增加的训练样本使得模型的泛化能力减弱或者所有训练样本被用完。最后用选择的属性进行多元回归分析检验提出的SPM_RS算法的性能。六个公开的数据集上实验结果显示,该算法在回归分析中得到的结果均优于对比算法。(2)传统的属性选择模型易受异常值的影响,同时未能考虑到数据中的局部流行结构,所以在本文中,我提出通过学习一个变换矩阵来进行鲁棒图降维,在不受异常值影响的情况下将原始高维数据映射到其低维属性空间。为了做到这一点,1)我提出的方法同时自适应学习叁个矩阵。即,原始数据的反向图嵌入矩阵,变换矩阵,以及在其低维属性空间中保持原始数据局部相似性的图矩阵;2)使用鲁棒估计器,避免这叁个矩阵优化过程中的异常值的影响。因此,原始数据通过两种策略进行清理,即,基于叁个结果变量和鲁棒估计器对原始数据的预测。利用反向图嵌入和图矩阵的方法,从精确估计的属性空间中学习变换矩阵。此外,对所得的目标函数提出了一种新的优化算法,并从理论上证明了算法的收敛性。实验结果表明,该方法在不同的分类任务上优于所有的比较方法。综上所述,本文创新的将自步学习和鲁棒估计嵌入属性选择模型,自步学习作为一种鲁棒学习方法倾向于平稳的探索数据,鲁棒估计通过给异常值赋予较低的权值来最小化异常值的影响,并结合流行学习探索数据的内部结构。为了测试提出方法的性能,所有的实验均在公开数据集上进行,并与最近几年优秀的降维算法做对比,使用分类和回归作为评价方法。实验结果显示,我设计的方法性能优于对比算法,证明了我提出方法的有效性。(本文来源于《广西师范大学》期刊2019-06-01)

张标[5](2019)在《基于多属性决策与群智能优化的异构无线网络选择算法》一文中研究指出随着近年来无线网络通讯技术的迅猛发展,越来越多新的网络技术应运而生。但原有的网络技术出于多种原因,并不会立即停止运营而是会继续运营相当长的一段时间。这一普遍存在的事实容易导致移动终端经常处于多个不同种类网络共同覆盖的环境中,称之为异构网络环境。进一步,终端用户在不同业务场景中,对网络服务质量的需求也呈现出多样化特点。因此,终端用户为了获得更好的服务质量(Quality of Service,QoS),希望随着网络环境的变化,终端可以自动地无缝地接入综合性能更佳的网络。终端在不同种类网络之间的切换称为垂直切换,在同一网络的不同基站或接入点之间的切换,称为水平切换。本文不考虑水平切换而仅研究异构网络情景中垂直切换算法的决策过程及其质量评价,并把研究过程中所建立的问题模型称为异构网络选择问题,简称异构网络选择。根据在该模型中终端是否可以自主选择网络,相应地分为终端自主选择网络和终端被动接入网络两种问题。它们的一个共同点是对时效性要求都很严格,主要的区别有:终端自主选择网络问题主要是终端遇到一个决策点时,终端如何评估各候选网络的综合质量并以此排序,然后从中选择一个作为目标接入网络。该模型不考虑此次选择前后对其它实体造成的影响而单纯地从终端用户角度来考虑如何通过选择目标网络而获取尽量大的QoS但同时也应尽量避免乒乓效应,进而获得尽可能满意的体验质量(Quality of Experience,QoE)。显然,该模型常常是建立在候选网络可提供的资源非常充裕的基础上。解决此模型的算法有多种,但多属性决策算法(Multiple Attribute Decision Making,MADM)因其原理直观简单并且通过计算公式能直接得出最终结果,而常被用来解决此类问题。在终端被动接入网络问题中,终端的功能受到很大限制,常常需要从网络系统资源管理者角度对发出请求的各个终端快速地给出一个合理的网络选择分配方案,使得各个终端获得尽可能好的QoS,同时尽可能减小对网络系统的负面影响,比如影响网络负载均衡、系统吞吐量等。常使用包括群智能算法在内的各种启发式算法来解决此类问题。针对上述两个问题模型的特点,本文提出分别用混合多属性决策算法和混合群智能优化算法来加以解决。因此,全文的主要贡献有以下叁点:(1)对传统基于模糊一致矩阵的模糊层次分析法(Fuzzy Analytic Hierarchy Process,FAHP)加以改进,然后提出基于综合效用值和比例阈值的终端自主选择网络算法。为控制整个算法的运行时间,根据Entropy和TOPSIS算法特点,选择合适的同向化、归一化公式,一次性地为熵值赋权法(Entropy)和逼近理想解排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)两个算法完成这个预处理过程。为3GPP定义的四种经典业务类型分别设置不同的调节因子,用与业务类型自动匹配的线性向量组合方式将这叁个算法灵活地融合在一起。完成评估各个网络综合性能后,再使用比例阈值决定目标网络。仿真结果表明,所提算法在控制垂直切换次数、抑制不必要垂直切换以及提高垂直切换收益叁个性能度量上优于现有的叁个算法。(2)提出基于改进灰度关联分析法(Grey Relational Analysis,GRA)和差值阈值的终端自主选择网络算法。根据标准差法(Standard Deviation,SD)和GRA算法特点,通过选择合适的同向化、归一化公式,不仅省去了一个归一化过程而且显着简化了这两种算法后续的计算过程,进而有助于降低整个算法的运行时间。仿真结果表明,与现有的四种算法相比,所提算法对于所考虑的四种业务类型都能更好地减少乒乓效应。(3)提出一个基于QoS序列进化优化的终端被动接入算法。通过设置离散型网络选择序列与连续型QoS序列之间的相互映射函数,该算法以连续型QoS序列为中介,经过遗传算法(Genetic Algorithm,GA)前期离散型迭代、模拟退火(Simulated Annealing,SA)算法中期发散型检验和连续型粒子群算法(Continuous Particle Swarm Optimization,CPSO)后期连续型迭代,逐步得到群体最优解。经过这样的优化流程,该算法不仅同时具备了GA、SA和CPSO这叁个算法的优点,而且有效控制了整个算法所需的运行时间。仿真数据表明,与现有的四个算法相比,所提算法可以稳定地更快地找到高质量的最优解,显着降低陷入局部最优陷阱的概率。(本文来源于《华南理工大学》期刊2019-04-15)

许力分[6](2019)在《融合并行化改进二元蚁群算法与分形维数的属性选择方法及其应用》一文中研究指出属性选择是数据挖掘领域常见的用于降低数据特征维度的预处理方法:在不影响原始数据核心价值的前提下,属性选择方法可以大幅约简数据集中的噪声数据与冗余属性,节约存储空间与计算资源,并提升决策分析准确率。属性选择问题的实质即在众多特征维度中寻求关键的核属性,因此求解过程中每种属性均可用关键属性(状态‘1’)或非关键属性(状态‘0’)两种状态来表示。考虑到该特性,本文提出以二元蚁群算法(Binary Ant Colony Optimization,简称BACO)作为搜索策略,分形维数作为子集评估度量准则,求解属性约简问题。针对BACO算法存在着“算法运行时间长”、“易收敛到局部最优解”与“无法并行求解”等不足,本文提出了一系列改进,并结合分形理论应用于属性选择领域。本文主要的研究工作与成果总结如下:首先,针对二元蚁群算法的固有缺陷,引入了参数控制的位置更新策略、对蚂蚁个体与种群进行交叉变异并提出局部优化策略、重新定义阻塞机制的信息素更新方法,提出改进的二元蚁群算法IBACO。其次,考虑到现有属性选择方法的计算效率难以满足云计算环境下大规模复杂数据的处理需求,应用MapReduce编程模式实现并行化算法MRIBACO,定义了算法的Map与Reduce函数设计。然后,以MRIBACO算法作为离散解空间的搜索策略,结合分形维数提出了属性选择模型。在UCI数据集上的实验结果表明了算法的有效性与稳定性。最后,将该方法应用于雾霾预测领域,分析北京、上海、广州叁个城市的关键致霾因子,实验结果表明算法求解的约简结果具有较高的可信度,为后期预防与重点治理雾霾气候提供了理论支撑。(本文来源于《合肥工业大学》期刊2019-04-01)

张善文,文国秋,张乐园,李佳烨[7](2019)在《基于核函数的稀疏属性选择算法》一文中研究指出鉴于传统属性选择算法无法捕捉属性之间的关系的问题,文中提出了一种非线性属性选择方法。该方法通过引入核函数,将原始数据集投影到高维的核空间,因在核空间内进行运算,进而可以考虑到数据属性之间的关系。由于核函数自身的优越性,即使数据通过高斯核投影到无穷维的空间中,计算复杂度亦可以控制得较小。在正则化因子的限制上,使用两种范数进行双重约束,不仅提高了算法的准确率,而且使得算法实验结果的方差仅为0.74,远小于其他同类对比算法,且算法更加稳定。在8个常用的数据集上将所提算法与6个同类算法进行比较,并用SVM分类器来测试分类准确率,最终该算法得到最少1.84%,最高3.27%,平均2.75%的提升。(本文来源于《计算机科学》期刊2019年02期)

曹再辉,吴庆涛,施进发[8](2018)在《基于低秩和图拉普拉斯的属性选择算法》一文中研究指出针对无监督属性选择算法使用单一方法,未考虑数据间内在相关性和噪声等问题,提出一种基于属性自表达的低秩无监督属性选择算法。算法首先将稀疏正则化(l2,1-范数)引入属性自表达损失函数中实现无监督稀疏学习,其次在系数矩阵中加入低秩约束以降低噪声和离群点的影响,然后利用低秩结构和图拉普拉斯正则化使子空间学习兼顾数据的全局和局部结构,最后通过属性自表达实现无监督学习。经数据集上多次迭代验证,该算法能够快速收敛并达到全局最优,与SOGFS、PCA、LPP、RSR等四种算法相比分类准确率平均提高了16.11%、14.03%、9.92%和4.2%,并且在各数据集上互信息平均值也是最高的,说明该算法有效、高效。(本文来源于《计算机工程与应用》期刊2018年17期)

张乐园,李佳烨,李鹏清[9](2018)在《低秩约束的非线性属性选择算法》一文中研究指出针对高维的数据中往往存在非线性、低秩形式和属性冗余等问题,提出一种基于核函数的属性自表达无监督属性选择算法——低秩约束的非线性属性选择算法(LRNFS)。首先,将每一维的属性映射到高维的核空间上,通过核空间上的线性属性选择去实现低维空间上的非线性属性选择;然后,对自表达形式引入偏差项并对系数矩阵进行低秩与稀疏处理;最后,引入核矩阵的系数向量的稀疏正则化因子来实现属性选择。所提算法中用核矩阵来体现其非线性关系,低秩考虑数据的全局信息进行子空间学习,自表达形式确定属性的重要程度。实验结果表明,相比于基于重新调整的线性平方回归(RLSR)半监督特征选择算法,所提算法进行属性选择之后作分类的准确率提升了2. 34%。所提算法解决了数据在低维特征空间上线性不可分的问题,提升了属性选择的准确率。(本文来源于《计算机应用》期刊2018年12期)

王卓,聂斌,罗计根,杜建强,陈爱[10](2018)在《调和平均优化选择划分属性的决策树改进算法》一文中研究指出针对信息增益和信息增益率对属性取值数的偏好,提出了一种调和平均优化选择划分属性的决策树改进算法.首先计算候选划分属性的信息增益,找出信息增益高于平均水平的属性,然后分别计算这些属性的信息增益率和信息增益的调和平均值,从中筛选调和平均值最大的属性,建立分支决策,并用递归方法建立决策树.通过4份不同规模数据实验,利用信息增益、信息增益率、GINI指数以及该文提出的方法作为属性划分的标准,分别考察其准确性在训练集、测试集、10次10折交叉验证(或5次5折交叉验证),以及其平均值.实验结果表明:该方法准确性较好、运行时间较短,具有一定程度的优越性.(本文来源于《江西师范大学学报(自然科学版)》期刊2018年04期)

属性选择算法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

属性选择是数据挖掘领域用于降低数据特征维度的预处理方法.针对大数据环境下高维数据的属性约简问题,提出了融合基于MapReduce并行改进二元蚁群算法与分形维数的属性选择方法.首先,引入了参数控制的位置更新策略、对蚂蚁个体与种群进行交叉变异、重新定义阻塞机制的信息素更新,提出了并行改进的二元蚁群算法MRIBACO.其次,以并行二元蚁群算法作为离散解空间的搜索策略,结合分形维数提出了属性选择模型.在6个UCI数据集上的实验结果表明,较其他方法计算效率更优,同时表明了其有效性与稳定性.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

属性选择算法论文参考文献

[1].李佳烨,张乐园,雷聪.基于核函数的低秩非线性属性选择算法[J].计算机工程与设计.2019

[2].许力分,倪志伟,朱旭辉,贾凯,伍章俊.融合基于MapReduce并行改进二元蚁群算法与分形维数的属性选择方法[J].系统科学与数学.2019

[3].朱永华.属性选择算法研究[D].广西大学.2019

[4].甘江璋.基于自步学习和鲁棒估计的属性选择算法研究[D].广西师范大学.2019

[5].张标.基于多属性决策与群智能优化的异构无线网络选择算法[D].华南理工大学.2019

[6].许力分.融合并行化改进二元蚁群算法与分形维数的属性选择方法及其应用[D].合肥工业大学.2019

[7].张善文,文国秋,张乐园,李佳烨.基于核函数的稀疏属性选择算法[J].计算机科学.2019

[8].曹再辉,吴庆涛,施进发.基于低秩和图拉普拉斯的属性选择算法[J].计算机工程与应用.2018

[9].张乐园,李佳烨,李鹏清.低秩约束的非线性属性选择算法[J].计算机应用.2018

[10].王卓,聂斌,罗计根,杜建强,陈爱.调和平均优化选择划分属性的决策树改进算法[J].江西师范大学学报(自然科学版).2018

论文知识图

改进的属性选择算法年遥测数据采用不同属性选择算单独运行属性选择算法Fzgt又re...不同属性选择算法下SVM的分类...无监督属性选择算法流程图不同属性选择算法下NB的分类结...

标签:;  ;  ;  ;  ;  ;  ;  

属性选择算法论文_李佳烨,张乐园,雷聪
下载Doc文档

猜你喜欢