导读:本文包含了孤立点论文开题报告文献综述、选题提纲参考文献,主要关键词:孤立,数据,矩阵,算法,密度,耦合度,数据挖掘。
孤立点论文文献综述写法
陈旭,陈红平[1](2019)在《孤立点分析在审计疑点发现中的应用探讨——基于K-Means聚类算法的Python实现》一文中研究指出孤立点分析作为一种无监督方法,在结合具体审计业务选择适当审计指标的基础上,能够自主发现审计疑点。在自主学习并发现价值信息的过程中,孤立点分析方法既兼顾了对海量数据的总体分析,又可作为审计经验补充,辅助审计工作人员发现审计疑点,并实现疑点的精确定位。文章在分析孤立点研究现状及常用审计疑点发现方法的基础上,提出了基于孤立点分析的审计疑点发现方法,构建了基于孤立点分析的审计疑点发现框架,并尝试结合Y上市公司实际案例数据,利用Python语言实现建模分析,以探讨孤立点分析方法对于辅助审计疑点发现、提高审计工作效率的意义,为审计人员挖掘审计疑点提供了新思路。(本文来源于《会计之友》期刊2019年17期)
黄珍敏[2](2019)在《小阶图与n个孤立点、路及圈的联图的交叉数》一文中研究指出图的交叉数在现代图论中扮演着重要角色,它在二战期间发源于Pal Turan在砖厂碰到的一个实际问题.并引起了许多专家的关注和进行了深入的研究.但后面发现其难度比较大.M.R.Garey and D.S.Johnson在文献[1]中已经证明了想要确定一个图的交叉数目是一个NP-完全问题.至今,五阶图的交叉数大部分都已确定.本文研究具有特殊结构的六阶图与n个孤立点、路及圈的联图的交叉数.从图的结构特征出发,仔细观察和探究小阶图的一些画法,通过严格的论证得到一个新颖的结果,填补了六阶图的交叉数的一个空缺,进而讨论了它与路,圈的交叉数.目录结构如下:第一章:介绍交叉数起源和发展历程,给出交叉数的一些基本知识.第二章:连通六阶图的交叉数的确定,得到n个孤立点、路及圈的联图的交叉数.第叁章:不连通六阶图的交叉数的确定,由已给出的n个孤立点的交叉数,得到路Pn和圈Cn的联图的交叉数.第四章:我的论文工作结语和以后的研究状况.(本文来源于《湖南师范大学》期刊2019-09-01)
李硕,张萌萌,陈勇恒[3](2019)在《基于改进孤立点算法的异常交通数据识别》一文中研究指出以地磁检测数据为基础,分析导致交通数据异常的原因;基于对异常数据的识别,对基于相似系数和的孤立点算法进行改进,即对规律性的交通数据进行时段划分,计算相似系数,采用交通量和时间占有率逐次逼近基础值的方法设定阈值。通过实例对分别采用传统阈值筛选法和改进后的孤立点算法对异常交通数据的识别结果进行对比分析。研究结果表明:基于改进相似系数和的孤立点算法对异常数据识别的检测率高于85%,误检率低于25%,识别结果优于传统阈值筛选法,可快速、有效地识别交通异常数据。(本文来源于《山东交通学院学报》期刊2019年02期)
李肖[4](2019)在《基于R树的高维孤立点检测算法研究与实现》一文中研究指出高维孤立点检测算法已经在移动互联网、金融欺诈检测、网络入侵检测、生态系统失调、天气预报等风险控制领域得到了广泛的应用。基于距离的孤立点检测思想,结合高维数据特点,参考R树的相关操作算法,设计实现基于R树的高维孤立点检测算法。算法在剪枝策略,排序方法上较以前同种算法更有优势。在真实的数据集上的实验结果表明,该算法能在高维条件下有效地检测出孤立点,并且算法的效率高于嵌入循环算法。(本文来源于《数字通信世界》期刊2019年06期)
吴晓林[5](2019)在《分类型矩阵数据的孤立点检测算法研究》一文中研究指出孤立点检测是数据挖掘中的一个重要问题,旨在发现隐藏在大型数据集中的有用的异常对象和异常模式,并已广泛应用于信用卡欺诈检测、网络监测、电子商务、故障检测、恶劣天气预报和卫生系统监测等领域。现有的孤立点检测算法输入的数据集是包含9)个对象的集合且每个对象对应一条记录,但是在实际应用中,一个对象通常对应多条记录,本文中称包含多条记录的对象为矩阵对象,包含矩阵对象的数据集为矩阵数据集。目前,还没有有效的算法可以检测矩阵数据集中的孤立点,如果使用现有的孤立点检测算法来处理矩阵数据,最直接的方法是压缩和转换数据,但是,在数据压缩和转换的过程中通常会有大量信息被丢失,不足以完全反映用户的真实行为。因此,本文针对分类型矩阵数据集中的孤立点检测进行了深入细致的研究和探讨,主要工作如下:(1)由于矩阵数据集中的对象包含多条记录,所以可以把每个矩阵对象看作一个小数据集,通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度,定义矩阵对象的孤立因子,提出了一种基于信息熵的孤立点检测算法。(2)数据属性之间通常有复杂的相互作用,所以还需要考虑属性间相互作用对矩阵数据集孤立点检测的影响。因此在计算矩阵对象自身的内聚度时通过互信息度量了属性间的相互作用,进而提出了一种基于信息熵和互信息的孤立点检测算法。总之,本文针对分类型矩阵数据集如何进行孤立点检测进行了研究,提出了新的算法,并在真实数据集上对新算法的有效性和扩展性进行验证。本文的研究为矩阵数据集的孤立点检测提供了新思路与新方法,在实际应用中有一定的理论和使用价值。(本文来源于《山西大学》期刊2019-06-01)
杨莉云,颜远海[6](2019)在《基于孤立点自适应的K-means算法》一文中研究指出孤立点的存在使聚类中心的计算产生较大误差,影响K-means算法的聚类效果.针对该问题,引入谢林模型,使孤立点能够自动移动到其邻居所在位置,消除孤立点,同时,对K-means算法过程中的距离计算、初始聚类中心选取环节进行改进,提出基于孤立点自适应的K-means算法.该算法首先对原始数据进行归一化处理,以提高距离计算的准确性;然后,根据谢林模型的基本思想,将孤立点移动到其最近的多邻邻居;接着,由类簇的数目确定邻居样本的搜索范围,确定初始聚类中心;最后,根据移动后的数据集和初始聚类中心,进行K-means聚类.在UCI机器学习数据库中经典聚类数据集上的实验结果表明,该算法可显着提升聚类的精度,同时,簇的内聚性也比较好.(本文来源于《河南科学》期刊2019年04期)
王跃飞,于炯,苏国平,钱育蓉,廖彬[7](2019)在《ODIC-DBSCAN:一种新的簇内孤立点分析算法》一文中研究指出长期以来,孤立点的检测一直聚焦于簇边缘的离散点,当聚类后簇的数目低于实际数目,或孤立点被伪装在簇内的情况下,簇内孤立点的判定则会更加困难.为判定簇内孤立点,提出一种基于密度聚类DBSCAN (Density based spatial clustering of application with noise)的簇内孤立点检测方法 ODIC-DBSCAN (Outlier detection of inner-cluster based on DBSCAN).首先在建立距离矩阵的基础上,通过半径获取策略得到针对该点集的k个有效半径Radius集合,并据此构造密度矩阵;然后建立点集覆盖模型,提出了相邻有效半径构造的覆盖多维体能够覆盖点集的思想,并通过拉格朗日乘子法求取最优的覆盖多维体数目之比,输出点比阈值组;最后重建ODIC-DBSCAN的孤立点检测方法,以簇发生融合现象作为算法终止的判定条件.实验通过模拟数据集,公开benchmark与UCI数据集共同验证了ODIC-DBSCAN算法,展示了聚类过程;分析了算法性能;并通过与其他聚类、孤立点判定方法的对比,验证了算法对簇内孤立点的判定效果.(本文来源于《自动化学报》期刊2019年11期)
冯宇,苑易伟[8](2019)在《基于最小超球面密度的孤立点检测算法》一文中研究指出定义了最小超球面密度的概念,提出了一种基于最小超球面密度的孤立点检测算法(minimum hyper sphere density,MHSD)。该算法根据数据的k近邻和反k近邻获得数据的有效近邻,并使用最小超球面密度和有效近邻计算每个数据的密度背离程度,进而计算每个数据的孤立程度,将孤立程度超过规定阈值的数据视为孤立点。实验数据为一个二维人工数据集和两个高维实际数据集,检测叁个数据集的孤立点,对算法性能进行评估,并与经典的局部离群因子算法(local outlier factor,LOF)、离群影响因子算法(influenced outlierness,INFLO)和密度相似邻域离群因子算法(density similarity neighbor based outlier factor,DSNOF)进行比较。实验结果表明,基于最小超球面密度的孤立点检测算法可以准确检测出数据中的孤立点,且性能优于叁种经典算法。(本文来源于《计算机技术与发展》期刊2019年06期)
吴晓林,曹付元[9](2019)在《面向分类型矩阵数据的无监督孤立点检测算法》一文中研究指出孤立点检测是数据挖掘的重要分支之一,旨在发现一个数据集中与多数对象行为明显不同的一些对象.针对分类型矩阵数据,通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度,定义了矩阵对象的孤立因子,提出一种面向分类型矩阵数据的孤立点检测算法.在Market basket、Microsoft web和MovieLens真实数据集上的实验结果表明,与基于共同近邻(common-neighbor-based,CNB)算法、局部异常因子(local outlier factor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效检测分类型矩阵数据中的孤立点.(本文来源于《深圳大学学报(理工版)》期刊2019年01期)
张路青[10](2018)在《基于孤立点异常度的Web攻击数据挖掘算法》一文中研究指出随着Web2.0技术的迅猛发展,网络安全变得更加突出。通过Web日志数据挖掘检测恶意攻击行为已经成为网络信息安全领域研究的一项重要技术,目前市场上的Web日志分析系统都是基于特征匹配来实现攻击行为检测的,虽然检测率较高,但对于新出现的或者尚未发现攻击特征的攻击类型无法识别。因此,深入研究从海量日志中挖掘恶意攻击行为技术有很强的理论意义与应用价值。论文深入研究了聚类算法中的距离定义以及异常度的定义,提出了一种有约束聚类的分簇方法,对Web日志中的HTTP请求进行分簇,最后利用统计学的思想,提出了一种近似正太分布的检测模型,并给出了基于孤立点异常度的Web攻击数据挖掘算法。通过实验验证表明,该算法能有效发现Web日志中的攻击数据,提高了检测率并降低了误报率。(本文来源于《舰船电子工程》期刊2018年09期)
孤立点论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
图的交叉数在现代图论中扮演着重要角色,它在二战期间发源于Pal Turan在砖厂碰到的一个实际问题.并引起了许多专家的关注和进行了深入的研究.但后面发现其难度比较大.M.R.Garey and D.S.Johnson在文献[1]中已经证明了想要确定一个图的交叉数目是一个NP-完全问题.至今,五阶图的交叉数大部分都已确定.本文研究具有特殊结构的六阶图与n个孤立点、路及圈的联图的交叉数.从图的结构特征出发,仔细观察和探究小阶图的一些画法,通过严格的论证得到一个新颖的结果,填补了六阶图的交叉数的一个空缺,进而讨论了它与路,圈的交叉数.目录结构如下:第一章:介绍交叉数起源和发展历程,给出交叉数的一些基本知识.第二章:连通六阶图的交叉数的确定,得到n个孤立点、路及圈的联图的交叉数.第叁章:不连通六阶图的交叉数的确定,由已给出的n个孤立点的交叉数,得到路Pn和圈Cn的联图的交叉数.第四章:我的论文工作结语和以后的研究状况.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
孤立点论文参考文献
[1].陈旭,陈红平.孤立点分析在审计疑点发现中的应用探讨——基于K-Means聚类算法的Python实现[J].会计之友.2019
[2].黄珍敏.小阶图与n个孤立点、路及圈的联图的交叉数[D].湖南师范大学.2019
[3].李硕,张萌萌,陈勇恒.基于改进孤立点算法的异常交通数据识别[J].山东交通学院学报.2019
[4].李肖.基于R树的高维孤立点检测算法研究与实现[J].数字通信世界.2019
[5].吴晓林.分类型矩阵数据的孤立点检测算法研究[D].山西大学.2019
[6].杨莉云,颜远海.基于孤立点自适应的K-means算法[J].河南科学.2019
[7].王跃飞,于炯,苏国平,钱育蓉,廖彬.ODIC-DBSCAN:一种新的簇内孤立点分析算法[J].自动化学报.2019
[8].冯宇,苑易伟.基于最小超球面密度的孤立点检测算法[J].计算机技术与发展.2019
[9].吴晓林,曹付元.面向分类型矩阵数据的无监督孤立点检测算法[J].深圳大学学报(理工版).2019
[10].张路青.基于孤立点异常度的Web攻击数据挖掘算法[J].舰船电子工程.2018