时序数据二分类问题的等距短shapelet转换算法

时序数据二分类问题的等距短shapelet转换算法

论文摘要

时间序列数据在应用中无所不在,是一类非常特殊的高维数据,时序数据分类是时序数据分析中的最重要的任务。研究者对当前领域内的时序数据分类算法进行了全面客观的综合性实验,发现现有的时序数据分类算法中,存在两个比较明显的缺陷。其一是当前领域内的算法并没有关注算法对数据集的适应性,诚然没有算法能在所有数据集上跑出好结果,但是其应该给出其所适用的数据集的范围。其二是拥有最好分类性能的算法时间复杂度相当高,以至于难以投入实际应用。本文的工作内容旨在提出合适的算法改进上述两个当前领域内存在的缺陷。对于算法时间复杂度过高的问题,本文分析了作为领域内最佳算法之一的集成shapelet转换算法,从特征信息的选择,特征信息的评价,特征空间的构建以及特征空间中分类器的选择这四个方面进行优化,提出了基于等距短shapelet转换的时序数据二分类算法。对于该算法中的每一处创新和优化,我们都给出了相应的理论证明用以支撑之。而实验结果也显示我们的算法在保持最佳分类性能的同时,大幅降低了时间开销。对于算法对数据集的适应性问题,我们量化了数据集本身的一些和我们算法密切相关的特性,设计了适应性系数,通过数据集的适应性系数,我们可以有效判断给定数据集是否适合用我们的算法进行处理。相应的实验结果也证明了我们所设计的适应性系数的有效性。本文的主要贡献如下:·提出一个高效的新算法,在时序数据二分类问题上,能以极低的时间代价获得当前领域内己达到的最佳分类性能。·设计出了一个适应性系数,可以有效量化数据集的某种性质,并进一步可以借此判定给定数据集是否适合用我们提出的算法来处理。·对于一些时序数据分类算法中存在的普适性的优化策略,对其可行性给出了理论的证明。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  •   1.1 研究背景及意义
  •   1.2 研究现状
  •     1.2.1 基于完整序列度量的算法类
  •     1.2.2 基于局部段特征提取的算法类
  •     1.2.3 基于shapelet的算法类
  •     1.2.4 基于空间转换的算法类
  •     1.2.5 基于字典分类器的算法类
  •     1.2.6 基于集成方法的算法类
  •     1.2.7 算法类的关系简述
  •   1.3 研究内容
  •     1.3.1 当前研究领域所面临的挑战
  •     1.3.2 本文的研究内容及贡献
  •   1.4 本文结构安排
  • 第2章 shapelet相关知识介绍
  •   2.1 术语介绍
  •   2.2 与shapelet相关的背景及研究工作
  •     2.2.1 shapelet与时间序列的距离计算
  •     2.2.2 shapelet判别性能的评估
  •     2.2.3 基于shapelet的时序数据分类算法
  •     2.2.4 shapelet转换与集成
  • 第3章 时序数据二分类问题的等距短shapelet转换算法
  •   3.1 算法流程与创新点综述
  •   3.2 shapelet与时间序列数据的定点浮动距离
  •   3.3 震荡系数
  •   3.4 等距短shapelet候选集
  •   3.5 适应性系数
  •   3.6 shapelet的评估
  •   3.7 特征空间中的分类器
  •   3.8 算法框架与时间复杂度分析
  • 第4章 实验结果
  •   4.1 对比算法
  •   4.2 实验数据集
  •   4.3 算法超参
  •   4.4 分类性能对比
  •   4.5 时间性能和算法效率对比
  • 第5章 总结与展望
  •   5.1 本文总结
  •   5.2 本文展望
  • 参考文献
  • 致谢
  • 在读期间发表的学术论文与取得的研究成果
  • 文章来源

    类型: 硕士论文

    作者: 舒伟博

    导师: 陈欢欢

    关键词: 时间序列分类,特征选择,特征空间,模型评估,有监督学习,机器学习,人工智能

    来源: 中国科学技术大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 中国科学技术大学

    分类号: O211.61

    总页数: 83

    文件大小: 5330K

    下载量: 96

    相关论文文献

    • [1].储油罐液位时序数据模式发现[J]. 重庆大学学报 2020(03)
    • [2].时序数据库发展研究[J]. 广东通信技术 2020(03)
    • [3].基于时序数据库的工业大数据应用研究[J]. 重型机械 2020(04)
    • [4].工业互联网中时序数据处理面临的新挑战[J]. 信息通信技术与政策 2019(05)
    • [5].基于自相关函数的非平稳时序数据的辨识改进[J]. 微型机与应用 2016(13)
    • [6].基于时序数据库的监控数据存储方法研究[J]. 电子元器件与信息技术 2020(01)
    • [7].时序数据并行压缩速率改进技术研究[J]. 电子设计工程 2018(20)
    • [8].基于时序数据的辽宁省环境库兹涅茨曲线实证分析[J]. 统计与咨询 2013(04)
    • [9].基于统计特征的时序数据符号化算法[J]. 计算机学报 2008(10)
    • [10].基于相关性分析的工业时序数据异常检测[J]. 软件学报 2020(03)
    • [11].基于微局部特征的时序数据二分类算法[J]. 计算机系统应用 2019(11)
    • [12].基于动态时间规整的时序数据相似连接[J]. 计算机学报 2018(08)
    • [13].《时序数据挖掘与过程神经元网络》[J]. 全国新书目 2013(12)
    • [14].多周期时序数据的傅氏级数拟合算法[J]. 计算机系统应用 2015(07)
    • [15].时序数据曲线排齐的相关性分析方法[J]. 软件学报 2014(09)
    • [16].非平稳NDVI时序数据人工神经网络建模方法[J]. 遥感信息 2019(06)
    • [17].路灯监控系统中时序数据流的异常值检测研究[J]. 微处理机 2018(06)
    • [18].时序数据的动态有界符号化方法[J]. 控制与决策 2008(10)
    • [19].基于GARCH模型下金融时序数据的影响点识别[J]. 统计与管理 2016(11)
    • [20].小样本跳变水质时序数据预测方法[J]. 计算机应用 2010(02)
    • [21].集思特思发布新一代时序数据产品TSM7[J]. 中国水利 2009(04)
    • [22].一种平稳时序数据的高效辨识改进算法[J]. 微处理机 2019(01)
    • [23].成品油零售价格变动对销售量影响研究——基于成品油价格时序数据挖掘分析[J]. 价格理论与实践 2019(10)
    • [24].面向大规模网络安全态势分析的时序数据挖掘关键技术研究[J]. 信息化建设 2016(05)
    • [25].一种新型时序数据库在大型配电网自动化系统数据中心中的应用[J]. 中国电业(技术版) 2014(07)
    • [26].时序数据的矢量化符号方法[J]. 小型微型计算机系统 2008(12)
    • [27].基于时序数据库的转移规则挖掘算法研究[J]. 计算机仿真 2008(06)
    • [28].海量时间序列数据的相关探索[J]. 通信电源技术 2020(10)
    • [29].基于时序数据库的分布式网络波动监控系统[J]. 中国传媒科技 2018(03)
    • [30].基于自动分发多级分解TCN-BiLSTM-LightGBM家庭PV发电量预测[J]. 电子制作 2020(19)

    标签:;  ;  ;  ;  ;  ;  ;  

    时序数据二分类问题的等距短shapelet转换算法
    下载Doc文档

    猜你喜欢