数据挖掘分类算法论文-曹素娥

数据挖掘分类算法论文-曹素娥

导读:本文包含了数据挖掘分类算法论文开题报告文献综述及选题提纲参考文献,主要关键词:数据挖掘,分类算法,可扩展性,决策树分类算法

数据挖掘分类算法论文文献综述

曹素娥[1](2019)在《数据挖掘中分类算法的可扩展性探讨》一文中研究指出为了更加灵活的应用分类算法,针对数据挖掘中分类算法的可扩展性展开分析,首先介绍决策树分类算法、K最近邻分类算法这2种常见分类算法,并且分析分类算法的可扩展性,明确分类算法的作用以及扩展分类算法的3点原因,最后从应用快速算法、及时分割数据、表达与维护数据关系这3个方面着手,阐述可扩展性的实现方法。数据挖掘中分类算法的可扩展性能够充分发挥分类算法优势,提高分类结果准确性,及时完成数据挖掘。因此本文主要研究了数据挖掘中分类算法的可扩展性,希望能够提供一定的参考价值。(本文来源于《软件》期刊2019年10期)

雷波[2](2019)在《数据挖掘中分类算法的研究与应用》一文中研究指出随着科学信息技术和电子计算机的不断发展进步,大数据的处理就成了人们的当务之急。分类算法在数据挖掘中起到了重要的作用,是我国重点研究领域。它的算法是通过对当前数据挖掘中的大数据进行筛选分类,对数据挖掘中具有显着性、代表性的优秀优质算法分类进行详细的比较与分析,并且从中总结出各种算法的特征,为使用者选择算法或对研究者总结算法提供了十分有效的证据。它能够解决很多问题,有助于解决单一组合分类的集成学习方法,并且能够很好地完成数据处理的工作。本文就以根据不同算法数据,从中找出算法之间的相同和异同等,能够进一步的推广支持分类算法,并且能够为该算法打好了扎实的基底。(本文来源于《电脑知识与技术》期刊2019年27期)

李华,黄华梅[3](2019)在《数据挖掘中PCA和LDA分类算法的比较》一文中研究指出分类是一种重要的数据挖掘问题,它的一般过程是先输入数据,再利用相关的分类算法得到分类规则,对新的数据划分类别。笔者详细介绍了两种简单的分类降维算法:PrincipalComponentAnalysis(PCA)和Linear DiscriminantAnalysis(LDA)。通过比较这两种分类算法发现,LDA是有监督的降维方法,可选择分类性能最好的投影方向,而PCA是无监督的降维方法,可选择样本点投影具有最大方差的方向。(本文来源于《信息与电脑(理论版)》期刊2019年06期)

王雨萌,武小军,罗雅晨[4](2019)在《基于数据挖掘和RandomForest算法的助学金分类研究》一文中研究指出在普及高等教育的过程中,发放助学金作为帮助贫困学生完成学业的重要手段之一。目前国内高校的助学金发放准则存在一定的问题,因此如何在高校缺乏学生的真实家庭情况以及助学金的金额有限的背景下,将助学金发放到最需要帮助的学生手上成为亟待解决的问题。文章以某高校大学生一卡通脱敏数据为原始数据,采用大数据挖掘技术和机器学习算法等AI技术进行拟合训练,以期有效预测需要帮助的学生,发挥助学金的作用。(本文来源于《中国市场》期刊2019年03期)

史逸民,史达伟,郝玲,张银意,王鹏[5](2018)在《基于数据挖掘CART算法的区域夏季降水日数分类与预测模型研究》一文中研究指出夏季降水日数的准确预测,对于保障农业、运输业、电力等行业的有序进行具有重要现实意义.利用连云港市气象局提供的1951—2012年夏季降水数据对连云港地区的降水日数特征进行分析,难以直观地发现夏季降水日数随时间分布的规律.为进一步探索降水日数的发生规律,结合国家气候中心网站提供的多种气候因子数据,基于CART决策树算法构建了连云港地区夏季降水日数是否偏多与是否偏少的分类与预测模型.该模型可以发现在多种气候因子不同条件下,夏季降水日数是否偏多(偏少)的规律,模型的分类与预测都具有良好的效果.利用52 a的数据样本训练模型,模型的训练准确率为90. 38%(86. 54%),再用剩余10 a数据样本检验模型,测试准确率为80%(80%),并且得到规则集,方便气象业务人员使用以及决策服务人员参考.同时,为降水日数的预测提供了数据挖掘的新思路.(本文来源于《南京信息工程大学学报(自然科学版)》期刊2018年06期)

陈洁[6](2018)在《数据挖掘分类算法的改进研究》一文中研究指出在全球信息化大潮的推动下,信息技术得到了迅猛的发展,社会的计算机化也导致了大量数据从我们生活的每个角落涌出。在缺乏具备强大功能的工具的条件下,人们对这些规模巨大的数据只能望洋兴叹,依靠人类的手动分析,无法探取到这些数据背后隐藏的丰富信息。为了将信息从如此海量的数据之中剥离出来,人们亟需找到一种合理的解决办法去处理信息过量所带来的挑战,研究出一种智能的自动化的替代工具,使得轻松的在大量数据中寻找有用信息变成现实。数据挖掘技术应运而生,通过对数据进行整合学习,将原始数据变换为适合操作的形式,抽取有用的数据进行挖掘,最后应用数据挖掘的各种策略来生成有用的模式和规则。利用这些模式和规则,人们可以对新的样本数据进行预测,获取信息。在数据挖掘的挖掘方法中,分类占据了很重要的地位,目前也有很多流行的分类算法,包括决策树分类算法、朴素贝叶斯分类算法、神经网络算法、SVM算法以及K-最近邻算法等,本文对其算法的思想进行了研究,并对最后对各个算法的优缺点进行了比较分析。本文针对分类算法展开研究,提出了两种改进策略与实现方法:(1)在对数据的训练开始之前,对原始数据的预处理部分做了改进。具体是对原始数据的数量级进行规范化,使得数据的值都处在同一个量级上,而后再对得到的数据进行操作。可以让数据预处理的效果更好,直接影响后续数据挖掘过程的效果和精确度,并用实验证明了改进的效果更好。(2)以最小均方算法和BP神经网络分类算法为基本算法思想,利用批量学习的规则,加入了动量项因子,设计了一种改进的批量学习BP算法。相关实验结果数据表明,改进的批量学习BP算法能够比较好地解决分类问题。(本文来源于《南京邮电大学》期刊2018-11-14)

胡栋鹏,曾坚毅[7](2018)在《数据挖掘常见分类算法比较分析》一文中研究指出数据挖掘一般指从大量的数据中提取有价值信息的过程。分类算法是数据挖掘中的最重要的技术之一。本文通过论述分析以上算法特点,以便于研究者对已有算法有所了解。(本文来源于《计算机产品与流通》期刊2018年08期)

李莉[8](2018)在《数据挖掘技术决策树分类算法(ID3算法)研究》一文中研究指出近些年来,互联网迅速发展,数据量每年都以惊人的幅度提升,人们的生活、政府的管理都和电子信息设备息息相关,特别是电子商务和科学实验数据库的迅速壮大,为我们带来了海量的数据。这些海量的数据中,往往蕴藏非常多有价值的记录和信息,等待着人们去挖掘,人们希望将这些信息分离提取出来进行更高程度的分析和统计,以便为我们所取用。而目前大部分数据库系统仅仅可以实现数据的增、删、改、查,很难找到大数据之间所蕴含的规则和关系,比较缺乏挖掘数据内部价值的有效方法,较难通过数据的维度去探索和发现、预测未来的趋势。本文通过对数据挖掘技术中决策树的分类算法做出实验分析,进行比较,给出合理的分析建议。(本文来源于《电子技术与软件工程》期刊2018年14期)

于欣平[9](2018)在《基于神经网络的数据挖掘分类算法比较和思考》一文中研究指出通过将神经网络的数据挖掘分类算法作为主要研究对象,采用分类应用实验和文献研究法,选择3种人工神经网络算法,即VM神经网络算法、BP神经网络算法以及ELM神经网络算法。在比较实验结果后可知不同的数据挖掘分类算法有着各自不同的优势特点,而在玉米种子和红酒种类分类实验中,ELM神经网络算法分类的效果最优,其正确率在83%以上,并且建模时间最短。只有结合数据量的具体情况选择与之相对应的数据挖掘分类算法,才能有效提高数据挖掘的精确度和有效性。(本文来源于《微型电脑应用》期刊2018年07期)

赵佳琪[10](2018)在《基于数据挖掘分类算法的钓鱼网站检测研究》一文中研究指出近年来,随着互联网的发展,网络逐渐成为人们工作、学习、购物以及金融交易等活动的平台,他给人们的工作和生活带来了很大的便利,在电子商务及电子金融产业日渐繁荣的同时,网络安全问题日益凸显,其中,钓鱼网站的危害尤其严重。钓鱼网站是一种基于社会工程学的攻击手段,是不法分子针对用户身份数据和金融账号进行欺骗的犯罪机制。钓鱼网站的网址、网页内容、布局等与真实网站极其相似,这使得没有安全意识的网民及其容易因此上当受骗,网络钓鱼在给人们带来巨大经济损失的同时也严重阻碍了电子商务的发展。有效遏制钓鱼网站是网络安全的保障,对网络钓鱼攻击的检测防御研究迫在眉睫。目前,国内外在防御钓鱼网站的研究上各有建树,然而都存在缺陷。近年来,在钓鱼网站检测方法的研究中,机器学习的应用取得巨大成效,将机器学习中各种分类算法应用于钓鱼网站检测识别可以有效得提高检测效率。因此,本文研究基于数据挖掘分类算法的钓鱼网站识别方法,本文研究重点在于分析比较机器学习中不同分类器算法在钓鱼网站检测上的分类性能。本文的主要工作分为叁个部分,首先,本文采用PCA主成分分析法,对选取的钓鱼网站URL异常特征和多源融合特征的重要程度进行分析,获取有效的特征。其次,利用机器学习中叁种经典的分类算法—支持向量机、随机森林、RBF神经网络从网页特征集中生成分类模型,并对其进行实验对比分析。最后,针对于叁种分类模型的不足,在此基础上提出改进的新的分类器模型—KELM分类模型,并进一步通过6种评价指标,全面评估分析其在基于URL异常特征和多源融合特征的钓鱼网站识别中的精度和性能。实验证明在使用KELM算法的条件下能有效提高其识别效率,证明了KELM分类器模型在钓鱼网站检测中的有效性。(本文来源于《内蒙古财经大学》期刊2018-06-01)

数据挖掘分类算法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着科学信息技术和电子计算机的不断发展进步,大数据的处理就成了人们的当务之急。分类算法在数据挖掘中起到了重要的作用,是我国重点研究领域。它的算法是通过对当前数据挖掘中的大数据进行筛选分类,对数据挖掘中具有显着性、代表性的优秀优质算法分类进行详细的比较与分析,并且从中总结出各种算法的特征,为使用者选择算法或对研究者总结算法提供了十分有效的证据。它能够解决很多问题,有助于解决单一组合分类的集成学习方法,并且能够很好地完成数据处理的工作。本文就以根据不同算法数据,从中找出算法之间的相同和异同等,能够进一步的推广支持分类算法,并且能够为该算法打好了扎实的基底。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数据挖掘分类算法论文参考文献

[1].曹素娥.数据挖掘中分类算法的可扩展性探讨[J].软件.2019

[2].雷波.数据挖掘中分类算法的研究与应用[J].电脑知识与技术.2019

[3].李华,黄华梅.数据挖掘中PCA和LDA分类算法的比较[J].信息与电脑(理论版).2019

[4].王雨萌,武小军,罗雅晨.基于数据挖掘和RandomForest算法的助学金分类研究[J].中国市场.2019

[5].史逸民,史达伟,郝玲,张银意,王鹏.基于数据挖掘CART算法的区域夏季降水日数分类与预测模型研究[J].南京信息工程大学学报(自然科学版).2018

[6].陈洁.数据挖掘分类算法的改进研究[D].南京邮电大学.2018

[7].胡栋鹏,曾坚毅.数据挖掘常见分类算法比较分析[J].计算机产品与流通.2018

[8].李莉.数据挖掘技术决策树分类算法(ID3算法)研究[J].电子技术与软件工程.2018

[9].于欣平.基于神经网络的数据挖掘分类算法比较和思考[J].微型电脑应用.2018

[10].赵佳琪.基于数据挖掘分类算法的钓鱼网站检测研究[D].内蒙古财经大学.2018

标签:;  ;  ;  ;  

数据挖掘分类算法论文-曹素娥
下载Doc文档

猜你喜欢