CPU利用率时间序列数据的实时监控分析

CPU利用率时间序列数据的实时监控分析

论文摘要

随着经济与科技的不断发展,在运维场景下的监控系统也逐渐朝着自动化和智能化的方向进行转变。该系统下的各项监控指标数据都是衡量企业运营状态是否达到健康级别的重要依据。CPU利用率时间序列数据作为实时监控的一项基本性能指标,对其异常值检测的研究具有非常重要的意义。然而,在实际的场景下,CPU利用率数据具有时效性强,数据量大,分布未知等特点,传统的运维方式无法有效的处理和分析此类数据。所以,本文基于滑动窗口提取出关键的特征属性,以机器学习的角度对CPU利用率数据的异常值开展研究和分析。首先,面对CPU利用率时间序列这一高频数据,以及考虑到计算机有限的内存资源,本文采取了基于滑动窗口下的数据采集方式,之后再进行相应的数据预处理。其次,面对基于滑动窗口所采集到的时间子序列可能含有一些无关且多余的信息,本文主要通过特征提取的方式对子序列数据进行降维处理,提取出该子序列的关键信息,即提取统计特征,拟合特征和分类特征,并以此作为当前时刻点的特征属性。然后,针对CPU利用率时间序列数据的异常值检测问题,本文采用了决策树算法和随机森林算法分别对CPU利用率数据的特征属性集进行二分类处理,即判定为正常点还是异常点,并对测试集的试验结果给出相应的混淆矩阵和ROC曲线,以评定这两种算法的总体效果。最后,实验结果表明,两种算法在异常点的检测问题上表现优异,尤其是随机森林,表现出良好的可扩展性和稳健型,不仅增加判定结果的准确性,而且大大提高计算的速度。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 研究背景及意义
  •   1.2 研究现状
  •     1.2.1 时间序列的定义
  •     1.2.2 时间序列的异常检测
  •     1.2.3 CPU利用率时间序列的异常检测
  •   1.3 本文的方法介绍
  •   1.4 论文的主要内容和组织结构
  • 第二章 CPU利用率数据的预处理
  •   2.1 基于滑动窗口的数据采集
  •   2.2 数据的归一化
  •   2.3 建立样本库
  • 第三章 基于滑动窗口的时间序列数据的特征提取
  •   3.1 统计特征
  •   3.2 拟合特征
  •     3.2.1 简单移动平均法
  •     3.2.2 加权移动平均法
  •     3.2.3 指数平滑法
  •   3.3 分类特征
  •     3.3.1 变异系数
  •     3.3.2 自相关系数
  •     3.3.3 熵特征
  •     3.3.4 数据的分布特征
  •   3.4 特征提取的依据
  •   3.5 小结
  • 第四章 基于机器学习的CPU利用率数据的异常值检测
  •   4.1 决策树算法
  •     4.1.1 决策树的算法思想
  •     4.1.2 决策树常见的模型简介
  •     4.1.3 剪枝处理
  •     4.1.4 连续值处理
  •     4.1.5 实验
  •   4.2 随机森林
  •     4.2.1 集成思想
  •     4.2.2 随机森林与Bagging
  •     4.2.3 结合策略
  •     4.2.4 算法流程
  •     4.2.5 实验
  •   4.3 小结
  • 第五章 总结与展望
  •   5.1 工作总结
  •   5.2 未来展望
  • 参考文献
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 阚敬婷

    导师: 江其保

    关键词: 利用率时间序列,异常点检测,特征提取,决策树,随机森林

    来源: 东南大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机硬件技术

    单位: 东南大学

    分类号: O211.61;TP332

    DOI: 10.27014/d.cnki.gdnau.2019.003148

    总页数: 48

    文件大小: 1092K

    下载量: 38

    相关论文文献

    • [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
    • [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
    • [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
    • [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
    • [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
    • [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
    • [7].王嵬作品[J]. 当代油画 2017(07)
    • [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
    • [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
    • [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
    • [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
    • [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
    • [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
    • [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
    • [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
    • [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
    • [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
    • [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
    • [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
    • [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
    • [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
    • [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
    • [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
    • [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
    • [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
    • [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
    • [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
    • [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
    • [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
    • [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)

    标签:;  ;  ;  ;  ;  

    CPU利用率时间序列数据的实时监控分析
    下载Doc文档

    猜你喜欢