导读:本文包含了叁维数据分析论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:数据,矩阵,数据挖掘,理论,拓扑,语义,终端。
叁维数据分析论文文献综述
吴应双,陈锐,曹杰,刘明顺[1](2019)在《基于大数据的主网生产运维数据分析系统设计》一文中研究指出主网生产运维的数据存在差异性大且统一困难、数据集成度与共享性不足等问题,造成这些数据利用率低且应用不充分,已不能满足主网生产运维的要求。本文提出基于大数据的主网生产运维数据分析系统设计方案用于解决这些问题。本文在分析主网生产运维数据特点的基础上,设计了包含数据存储、设备缺陷图谱分析、基于众包的设备故障修复、输变电设备健康度评估、主网精益化作业管理等功能的数据分析系统。该系统对主网生产运维数据进行分布式存储、关联分析、深度挖掘。此外,本文以大数据平台为核心设计了系统的软件架构,重点阐明了主网生产运维数据的存储原理。本文设计的系统面向主网的生产运维人员,旨在为他们提供设备检修、精益化管理等高级服务。(本文来源于《电力大数据》期刊2019年12期)
朱海麒,姜峰[2](2019)在《人工智能时代面向运维数据的异常检测技术研究与分析》一文中研究指出随着信息化时代的到来以及人工智能技术在各个领域的落地及实践,IT运维也迎来一个智能化运维的新时代。为了确保大型软硬件系统安全、可靠地运行,需要有专业的运维人员进行系统的部署、运行和维护。运维数据是一系列与大型软硬件系统运行状态相关的参数。运维数据异常检测技术旨在检测大型系统的健康状态,并把运维人员从纷繁复杂的告警和噪声中解放出来。但是,标记数据的稀缺以及企业对准确率的高要求等问题给运维数据异常检测技术的实际应用带来了严峻挑战。文章对运维数据异常进行了描述,并详细介绍了运维数据异常检测的研究现状;在此基础上提出了一种初步的解决方案并给出了实验结果。文章阐述了运维数据异常检测的潜在问题和可能的发展方向,力求为运维数据异常检测技术的发展提供可行的研究思路。(本文来源于《信息网络安全》期刊2019年11期)
王东岳[3](2019)在《网络运维数据分析中的数据挖掘应用研究》一文中研究指出随着我国科学技术的不断发展,计算机领域取得了更大的成就,计算机网络技术逐步被应用到了各个领域中,都取得了不小的成功。计算机数据挖掘技术便是计算机飞速发展的一大产物。该技术的出现不仅被应用于经济、建筑、数据统计等领域,尤其在网络领域中,更是大大加强了对于使用数据挖掘技术得应用。(本文来源于《数码世界》期刊2019年11期)
刘擘龙,李喆[4](2019)在《基于拓扑数据分析的高维数据隐藏模式挖掘》一文中研究指出针对传统数据分析方法寻找高维复杂数据间隐藏模式存在局限性的问题,提出基于拓扑数据分析的高维数据隐藏模式挖掘方法,通过提取复杂高维数据的特征,分析其形状和样本的相互关系来获得数据集隐藏模式。利用拓扑数据分析对高维数据集-声音的性别识别进行实例验证,同时对数据集数据子组以及相关数据子组之间关系进行可视化分析,结果表明所提方法可发现传统方法无法发现的数据子组之间隐含的关系和模式,得到了比传统方法更精细有效的结果,验证了所提方法对高维数据隐藏模式挖掘的强大性和有效性。(本文来源于《系统仿真学报》期刊2019年09期)
刘鹏,叶宾[5](2019)在《基于随机矩阵理论的高维数据线性判别分析方法》一文中研究指出线性判别分析(LDA)是机器学习和数据挖掘中一种常用的基于模型的分类方法。尽管该分类方法在许多实际应用中表现良好,但在处理高维数据时其效果却很不理想。其原因在于:当变量数目p接近或者大于样本数目n时,样本协方差矩阵不再是真实协方差矩阵的一个良好估计,导致线性判别函数值产生了较大的偏差。文中提出了一种基于随机矩阵理论的高维数据分类器正则化方法。首先,利用随机矩阵理论,分别以旋转不变估计法(当p≤n时)或者特征值截取法(当p>n时)对高维协方差矩阵进行一致估计;然后,使用估计出的高维协方差矩阵计算判别函数值。在模拟数据集和3个微阵列数据集上进行的分类实验的结果表明,所提线性判别分析方法在处理高维数据时不但适用范围更广,而且具有较高的分类正确率。(本文来源于《计算机科学》期刊2019年S1期)
刘鹏[6](2019)在《基于随机矩阵理论的高维数据分析方法研究》一文中研究指出在生产实践中收集并存储了越来越多的维度p接近甚至超过样本数n的高维数据。与传统的数据分析不同,高维数据分析更加复杂和困难。作为数据分析的重要工具,机器学习方法同样面临着高维数据的挑战。如何利用机器学习方法完成对高维数据的分析,目前已成为数据领域广泛研究的问题。随机矩阵的渐近性和非渐近性理论打破了经典多元统计分析的框架,非常适用于高维数据统计特性的研究,可以帮助机器学习算法完成对高维数据的分析,扩展其应用范围。本文针对传统的机器学习方法在高维数据分析中存在的问题,利用随机矩阵理论的相关研究成果,提出了正则化的判别分析算法、均值良好估计的正则化判别分析算法以及高维缺失数据的降维算法。论文的主要工作如下:(1)线性判别分析算法尽管在解决许多实际问题时表现良好,但是在处理高维数据时效果却很不理想。其原因在于:当数据维度p接近或者大于样本数目n时,样本协方差矩阵不再是真实协方差矩阵的一个良好估计,导致线性判别函数值产生了较大的偏差。为此,提出一种基于随机矩阵理论的正则化判别分析算法。首先,分别以非线性收缩法或特征值截取法对高维协方差矩阵做出良好估计;然后,使用估计的高维协方差矩阵计算判别函数值并进行分类。在模拟数据集和真实数据集进行的分类实验表明,所提算法不但适用范围更加广泛,而且具有较高的分类正确率。(2)判别模型中的样本均值同样受到高维数据的影响,样本均值估计会出现偏差,从而导致判别模型误分类率的增加。为此,提出一种基于均值良好估计的正则化判别分析算法。在正则化判别分析算法的基础上,首先利用最优收缩估计方法重新对判别模型中的均值进行估计;然后,将重新估计的均值代替判别模型中的样本均值,进一步提高了正则化判别模型的分类性能。通过对模拟数据集和真实数据集的分类实验分析,也显示出所提算法的优越性与有效性。(3)数据在采集和存储的过程中可能会造成一些数据的缺失。当高维数据含有缺失值时,大多数数据分析方法很难对高维缺失数据进行分析或分析效果不理想。为此,提出一种可用于高维缺失数据降维的主成分分析算法。首先,基于随机矩阵理论的相关理论,利用矩阵的Lasso估计得到高维缺失数据的协方差矩阵估计;然后,对其进行特征分解,选取主要的特征向量构成低维投影矩阵,并利用投影矩阵将高维数据投影到低维空间;最后,结合线性判别分析算法对高维缺失数据进行分类。在模拟数据集和真实数据集上的分类实验表明,所提算法可以完成对高维缺失数据的降维,同时也能提高线性判别分析算法在高维缺失数据上的分类正确率。(本文来源于《中国矿业大学》期刊2019-05-01)
王烨[7](2019)在《网络运维数据分析中的数据挖掘应用初探》一文中研究指出就其本质方面来讲,数据挖掘其实是就是发现知识的一个过程,主要指的是对各种算法进行有效应用进而在信息当中对相关规律进行充分探索。而网络运维数据分析的过程其实也就是挖掘数据的过程,在网络运维数据分析工作当中有效应用数据挖掘技术,其效率和准确性都会有所提高。在下文当中我们先是就网络运维和数据挖掘的概念进行了简单概述,接着主要就数据挖掘及时在网络运维数据分析中的具体应用进行了详细分析,希望能够为相关人士提供借鉴和参考。(本文来源于《数字通信世界》期刊2019年03期)
于震,刘学良,李怀[8](2018)在《基于移动终端的建筑设备设施管理系统及其运维数据分析》一文中研究指出本文提出一套基于移动终端的建筑设备设施管理系统,通过扫描设备二维码获取设备相关信息,并与云服务器信息通讯,经云服务器与本地楼宇自控平台及其他智能化系统进行信息交换,实现对现场设备的监控。区别于传统楼宇自控系统,该移动终端系统在完成设备设施管理工作的同时,使用过程中还可获得丰富的运行人员行为时空数据,帮助解决现场运维管理要求和智能化系统使用习惯之间的矛盾,有效提升设备设施管理水平。(本文来源于《智能建筑》期刊2018年09期)
尤东方,魏永越,张汝阳,陈峰,赵杨[9](2018)在《存在混杂时高维数据的随机森林分析》一文中研究指出目的:探讨存在混杂因素时高维数据中随机森林(random forest,RF)的分析方法。方法:通过模拟实验和实例数据分析对单纯随机森林分析、增加节点候选变量为最大值以及基于广义线性模型的残差校正混杂因素的结果进行比较,以重要变量的重要性评分排序情况进行评价。结果:模拟实验表明,增加节点候选变量的方法对混杂因素的校正效果不明显,而基于广义线性模型残差的方法能有效校正混杂效应;实际数据分析结果显示单纯随机森林分析rs3754686和rs2322660分别排在第一和第二位。增加节点候选变量后rs3754686排序变化较小,而基于残差的方法校正人群分层后这两个单核苷酸多态位点(SNPs)的排序大幅度降低,从而打破乳糖酶(LCT)基因与身高之间的虚假关联。结论:随机森林分析需要考虑混杂因素问题,基于广义线性模型的残差能有效校正混杂因素,适用于高维数据的变量筛选。(本文来源于《南京医科大学学报(自然科学版)》期刊2018年07期)
来骥,马跃,吴舜,那琼澜[10](2018)在《基于语义分析的运维数据关联知识库构建方法》一文中研究指出传统方法采用数据挖掘的方式构建运维数据关联知识库,返回的关联信息并非用户想要的最终结果,不符合用户意图。为此,提出一种新的基于语义分析的运维数据关联知识库构建方法。给出运维数据关联知识库结构。采用文档主题生成模型LDA获取关键词,通过语义相似度求出知识案例与检索词间的相近程度,将和检索词相似度最高的结果作为检索结果。对运维知识项的各个属性赋予权值,依据构成元素的权值与知识库各个属性的匹配关系计算权值和,求出相似度。采用关键词权重量化法对检索结果进行处理。将构建知识库应用于动车系统中,结果表明,通过构建知识库可有效检索运维数据关联知识,为运维人员提供依据。(本文来源于《科学技术与工程》期刊2018年19期)
叁维数据分析论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着信息化时代的到来以及人工智能技术在各个领域的落地及实践,IT运维也迎来一个智能化运维的新时代。为了确保大型软硬件系统安全、可靠地运行,需要有专业的运维人员进行系统的部署、运行和维护。运维数据是一系列与大型软硬件系统运行状态相关的参数。运维数据异常检测技术旨在检测大型系统的健康状态,并把运维人员从纷繁复杂的告警和噪声中解放出来。但是,标记数据的稀缺以及企业对准确率的高要求等问题给运维数据异常检测技术的实际应用带来了严峻挑战。文章对运维数据异常进行了描述,并详细介绍了运维数据异常检测的研究现状;在此基础上提出了一种初步的解决方案并给出了实验结果。文章阐述了运维数据异常检测的潜在问题和可能的发展方向,力求为运维数据异常检测技术的发展提供可行的研究思路。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
叁维数据分析论文参考文献
[1].吴应双,陈锐,曹杰,刘明顺.基于大数据的主网生产运维数据分析系统设计[J].电力大数据.2019
[2].朱海麒,姜峰.人工智能时代面向运维数据的异常检测技术研究与分析[J].信息网络安全.2019
[3].王东岳.网络运维数据分析中的数据挖掘应用研究[J].数码世界.2019
[4].刘擘龙,李喆.基于拓扑数据分析的高维数据隐藏模式挖掘[J].系统仿真学报.2019
[5].刘鹏,叶宾.基于随机矩阵理论的高维数据线性判别分析方法[J].计算机科学.2019
[6].刘鹏.基于随机矩阵理论的高维数据分析方法研究[D].中国矿业大学.2019
[7].王烨.网络运维数据分析中的数据挖掘应用初探[J].数字通信世界.2019
[8].于震,刘学良,李怀.基于移动终端的建筑设备设施管理系统及其运维数据分析[J].智能建筑.2018
[9].尤东方,魏永越,张汝阳,陈峰,赵杨.存在混杂时高维数据的随机森林分析[J].南京医科大学学报(自然科学版).2018
[10].来骥,马跃,吴舜,那琼澜.基于语义分析的运维数据关联知识库构建方法[J].科学技术与工程.2018