时间序列数据挖掘论文开题报告文献综述

时间序列数据挖掘论文开题报告文献综述

导读:本文包含了时间序列数据挖掘论文开题报告文献综述、选题提纲参考文献,主要关键词:序列,时间,数据挖掘,度量,数据,运输量,特征。

时间序列数据挖掘论文文献综述写法

何保荣[1](2019)在《基于多目标决策的时间序列数据挖掘算法仿真》一文中研究指出采用当前算法挖掘时间序列数据时,不能有效的降低噪声对时间序列数据挖掘过程造成的影响,不能通过提高集群规模缩短数据处理时间,存在加速比低和可扩展性差的问题。将多目标决策理论应用到时间序列数据挖掘中,提出基于多目标决策的时间序列数据挖掘算法,挖掘时间序列之间对时间序列进行预处理,消除时间序列中存在的噪声,提取时间序列中存在区域极值点,对提取得到的区域极值点做等长处理,获得由极值点构成的序列。通过多目标决策方法利用获取的极值点构建决策矩阵,对比决策对象之间存在的差值,采用偏好函数将差值转变为对应的偏好度,对偏好度进行排序,根据排序结果对时间序列数据做聚类处理,实现时间序列的数据挖掘。仿真结果表明,所提算法的加速比高、可扩展性好。(本文来源于《计算机仿真》期刊2019年11期)

刘博,赵璐,单曲轶[2](2019)在《基于时间序列数据挖掘的我国民航运输量预测分析》一文中研究指出为了精准预测我国民航运输量,基于1985-2017年我国民航运输量随机时间序列数据,运用自回归单整移动平均模型(ARIMA),借助Eviews8.0统计软件,建立预测模型。利用静态预测功能,实现了2015-2019年的点预测,整体拟合度良好,相对误差小,相对误差位于0.1%-0.9%之间,证明该模型是可行的。结果表明,ARIMA模型能够短期准确预测民航运输量,为航空公司、机场、空管等部门可持续发展提供决策依据。(本文来源于《中国民航飞行学院学报》期刊2019年05期)

朱志静[3](2019)在《基于趋势和特征子序列的时间序列数据挖掘研究》一文中研究指出在当今的万物互联的大数据时代下,人类活动的各行各业都会产生数据,随着科技一次又一次的革新和发展及随着时间的流逝,数据量正在极速增长中。这些数据广泛存在于商业、气象学、农业、生物科学以及生态学等方面。例如商业市场中我们观察每周的利润,月度价格指数,年度销售数量;气象学中观察每日高温和低温,年降水量和干旱指数以及每小时风速等。这些数据中包含着很多有用的信息,若能将其完整且细致的挖掘出来,将对人类社会做出极大的贡献。但是由于这些数据范围广、数据量大,导致原始序列具有数据维度高,干扰因素多以及实时更新动态变化等特性。这些特性直接导致从原始序列中直接进行知识挖掘成为了一项复杂度极高,准确度极低甚至不可取的工作。为了能解决这些特性带来的数据挖掘上的问题,我们需要对原始数据进行有效的预处理步骤。时间序列预处理步骤的关键部分就是时间序列的分段线性表示工作以及时间序列的相似性度量工作。故而,本文将对这两个方面的工作进行相应的研究,以期数据预处理工作能达到更好的效果。本文前两章综述了本文的研究背景及意义和研究现状。本文的主要研究创新点和相应的工作主要在叁、四、五叁章中,可以总结为以下几方面内容:(1)针对目前数据的数据量巨大、高维度高复杂度的特点,以及目前已有方法分段压缩率不够高的缺点,本文的第叁章通过分析时间序列的几何形态特征,研究时间序列向上、向下趋势的几何形态,提出了上、下滤波点及上、下滤波线概念。利用上、下滤波点线对趋势的几何特性进行了分析,提出一种基于全局趋势判断方法。进一步提出一种基于趋势的时间序列分段线性表示方法,该方法的复杂度为(7)(8)On,便于编程实现。实验结果表明,与其他同类算法比较,本文算法得到的线段数目较少,逼近程度也不错。(2)针对传统欧式距离队序列值依赖较高的缺点,本文第四章统筹运用几何学中的点,角,边叁要素,点值差距,序列趋势变化以及形态差异,将几个方面都考虑到位。所提算法整合点值差距,序列趋势变化以及形态差异叁个几何特征,构建出叁角形形态距离,以此为阈值去分析两条序列的微观点距离和宏观趋势距离,从而度量出两条序列的相似性。我们将其命名为基于自适应叁角形距离的算法(Adaption Triangle Distance,ATD)算法。ATD算法实验结果表明,ATD算法对时间序列对的度量效率进行大幅度的提升。于此同时,本方法的对时间序列对的度量准确度比传统的度量算法高很多。(3)针对传统相似性度量算法无法动态处理翘楚的问题,本文第五章提出了一种基于趋势的特征子序列的时间序列度量方法。该方法引入信号中的尺度空间理论,从随机位置和长度中选择多个子序列被划分为较短的间隔用以捕获时间序列数据的信息。对于每个间隔,提取拟合回归线的趋势、值的平均差和方差等特征用以提供序列的形态、分布的情况。从这些子序列中计算出的特征生成一个新的数据集,其中每个子序列的特征提供一个实例,每个时间序列形成一个包。为每个实例定义一个标签此来度量不同位置的属性和原始序列的拓展。这提供了一个不同于DTW却和其一样可以处理翘曲的基于特征的方法。我们称之为基于自适应特征子序列的时间序列相似度量算法(Adaption and Feature Sentence,AFS)算法。与主流算法和ATD算法相比,当需要进行度量的两条时间序列长度不相同或者时间跨度不相同时,算法可以动态且自动地完成时间序列相似度量工作而无需额外的人工对序列进行维度对等处理。很大程度上降低了时间和空间复杂度。(本文来源于《江南大学》期刊2019-06-01)

杨秋翔,王冠男,王婷[4](2019)在《基于时间序列的多源日志安全数据挖掘仿真》一文中研究指出采用当前数据挖掘方法挖掘多源日志中存在的安全数据时,数据挖掘所用的时间较长,挖掘得到的数据不完整,存在挖掘效率低和数据完整度低的问题。提出基于时间序列的多源日志安全数据挖掘方法,标记时刻不同的信号在多源日志中的强度,根据信号强度计算标签数据在多源日志中的过程时间和移动速度,根据计算结果去除多源日志中存在的脏数据和冗余数据。对多源日志中的时间序列数据做分块处理,结合二维奇异值分解方法和主成分分析方法提取子矩阵中的特征,根据提取得到的特征通过最小距离方法建立数据分类器,利用数据分类器对多源日志中存在的安全数据做分类处理,完成多源日志安全数据的挖掘。仿真结果表明,所提方法的挖掘效率高、数据完整度高。(本文来源于《计算机仿真》期刊2019年02期)

燕超源,李斌,顾新桥,夏琨,李强[5](2018)在《基于时间序列大数据挖掘的ATGH模型及MCMC算法研究》一文中研究指出针对现有MCMC算法对马尔可夫链的搜索效率不高和运算时间过长的问题,引入基于Bayes计算的MCMC方法来对ATGH模型进行估计,以Gibbs抽样算法作为内核,提出新的MCGS算法,对数据建模后的参数进行迭代运算,分段对链的最小距离进行计算,并且取其最小值,来决定对相关链进行合并与否,与其它模型试验结果进行比较证明此模型的优越性~([1]),实验结果表明MCGS算法对提高马尔可夫链的搜索性,减少运算时间和减少计算机的运算负担有显着的效果。(本文来源于《自动化与仪器仪表》期刊2018年12期)

胡宇鹏[6](2018)在《时间序列数据挖掘中的特征表示与分类方法的研究》一文中研究指出时间序列作为一种与时间相关的海量高维数据,广泛遍布于现实世界几乎所有的应用领域中。时间序列不仅具有“海量、高维”的传统大数据特性,还同时具有“实时更新”的“流数据”特性,因此被称为时间序列流数据(Streaming Time Series)。基于上述数据特性,传统的基于静态时间序列的数据挖掘方法往往无法直接应用于时间序列流数据上并获得相对理想的研究结果。因此如何从“海量、高维、实时更新”时间序列中发现潜在的知识已成为当前数据挖掘研究中的热点和难点问题。根据相关研究成果表明,时间序列数据挖掘已成为21世纪数据挖掘领域10大最具挑战性的研究问题之一,并受到国内外研究者的广泛关注。本学位论文将对时间序列数据挖掘研究中的两个关键问题:时间序列特征表示和时间序列分类展开相应的研究,主要工作和创新性可以归纳为以下几个方面:(1)本文提出一种基于转折点的时间序列在线特征表示方法。该方法以“在线”的方式对具有流数据特性的时间序列进行持续地特征表示,并从单点误差和分段误差两个不同的角度对该方法的表示精度进行约束,同时利用转折点和优化合并策略确保该方法具有相对理想的运行效率。实验结果显示:本文所提出的时间序列表示方法不仅具有更高的表示精度,同时具有较高的运行效率,此外该方法受参数变化的影响较小,具有良好的鲁棒性。(2)本文提出了一种基于自适应表示索引的时间序列“多分辨率”混合表示方法。该方法是时间序列“多分辨率”分段表示和“多分辨率”符号表示的通用方法。它可以根据不同的表示需求,利用自适应表示索引快速生成不同类型的多分辨率表示结果(分段线性表示结果,分段聚合近似结果,符号聚合近似结果)。此外,该方法还支持对已经获取的分段线性表示结果进行局部调整,并能迅速获得调整后的相关表示结果的完整表示信息,从而避免了不必要的重复计算并提高了相应的表示效率。实验结果表明:本文所提出的方法不仅具有更高的索引创建效率和更高的“分段线性表示”效率,而且能够同时提供基于“分段聚合近似”以及“符号聚合近似”的多分辨率表示结果。(3)本文提出了 一种高效的局部特征选取方法对基于局部特征的时间序列分类算法进行加速。该方法通过:生成代表性时间序列集合以及精简局部特征候选集合两个相互独立的加速策略,对基于局部特征分类方法的“特征选取”效率进行提升,进而实现了分类算法整体效率的提升。实验结果表明:本文所提出的局部特征高效选取策略能够对原始分类方法的特征选取效率进行较大幅度的提升。与此同时,经本方法“加速”后的分类方法与原始分类方法的分类准确率基本处于同一精度水平。(4)本文提出了一种基于多表示深度学习模型的时间序列分类方法。该模型将基于不同时间序列特征表示方法所产生的相应表示结果看作时序特征的不同表示形式,随后利用不同的信道从不同角度学习并获取当前表示结果中的相应数据特征,并根据其获取关键数据特征对时间序列分类进行有效的指导。实验结果表明:本文提出的模型具有更加全面的特征学习能力,相比于采用单一分类器的时间序列分类方法,该模型具有更高的分类准确率。与此同时,本文所提出的深度学习模型还能利用平行注意力机制对所获取的数据特征进行重要性评分,在一定程度上实现了时间序列分类结果的可解释性。(本文来源于《山东大学》期刊2018-10-20)

王培屹[7](2018)在《时间序列数据挖掘中的特征表示与相似性度量方法研究分析》一文中研究指出随着信息技术的快速发展,时间序列的数据量增长速度也逐步加快。与此同时,数据挖掘技术在时间序列数据库中的应用也越来越普遍。通过将把相同长度和不同长度的时间序列作为对象进行深入的研究,探讨各种表示方法的内涵与特征,使这些表示方法更加完善以及更好地应用于时间序列数据的挖掘工作中,从而能够更加方便有效地获取有价值的信息。(本文来源于《电脑与电信》期刊2018年06期)

黄炜平[8](2018)在《基于EMD和BoF模型的时间序列数据挖掘及应用》一文中研究指出对时间序列进行数据挖掘获取其蕴含的有用信息具有重要的应用价值。然而相比传统静态数据,时间序列数据的各个变量值之间具有次序关系,而静态数据中,不同变量值之间的次序是不重要的。同批次的时间序列数据样本也可能存在不等长的情况,而静态数据同批次的样本通常具有相同的维度。此外时间序列数据具有数据量大、维度高、特征多、高噪声等特性。这些因素给基于时间序列的数据挖掘工作无论是在精度还是效率方面,都带来了极大的挑战。因此研究如何有效地进行时间序列处理具有重要的意义。本文以时间序列数据为对象,针对时间序列数据挖掘中各环节面临的问题,分别研究了时间序列分解、降维,以及时间序列分类叁方面内容。此外从实际应用角度出发,探讨了基于时间序列分析的工业系统运行状态监控。具体工作内容包括:1.针对时间序列分解阶段,广泛应用的噪声辅助经验模态分解方法面临的高计算复杂度问题,提出一种局部噪声辅助的快速多维经验模态分解方法。通过生成高频带限噪声并引入多维经验模态分解,实现时间序列分解过程中,在高频段通过噪声辅助抑制模态混迭,在低频段消除噪声干扰。该方法相比传统方法,在实现高精度序列分解的同时,显着降低了分解过程的计算复杂度,提高了分解效率。随后通过仿真实验验证了该方法高效的时间序列分解性能,并探讨了该方法在基于振动信号分析的轴承故障诊断中的应用。2.针对时间序列分类面临的计算复杂度过高和分类准确率不足的问题,提出了一种基于BoF:模型的时间序列分类方法。该方法首先通过一种自适应的序列分割手段实现时间序列的自适应分割,最大程度保留了序列中潜在模式的完整性;随后通过提取间隔特征和正态云模型特征,实现子序列的时间降维,;并通过高斯混合模型和Fisher向量实现特征编码;最后结合线性支持向量机实现序列分类。该序列分类方法相比其它方法,具有分类准确率高,计算复杂度显着降低的优势。在43个UCR时间序列数据集上的分类实验验证了该方法的高效分类性能。3.将所提出的基于BoF模型的时间序列分类方法进行多维扩展,以实现对多维时间序列的高效分类。主要是扩展了原方法中的序列自适应分割和局部特征提取,并沿用原方法中的特征编码和分类方法。在若干多维时间序列数据集上的实验证明了新方法具有优秀的分类能力。随后将该方法应用于空调控制系统的运行状态监控,结果表明,提出的多维时间序列分类方法能较好的识别出空调系统的不同运行状态,实现故障分类。4.针对多维时间序列高维度带来高计算复杂度和分类准确率不足的问题,提出一种基于条件互信息的多维时间序列特征选择方法。首先将条件互信息用于处理不同特征间普遍存在的相关、冗余,以及长期被忽视的特征交互关系,提出一种基于条件互信息的特征选择方法;随后用符号聚合近似算法对时间序列进行符号化表示,从而将信息熵扩展到时间序列,并结合之前的特征选择方法,最终实现多维时间序列的特征选择。该方法能够有效处理多维时间序列不同维度问复杂的相互关系。在若干UCI多维时间序列数据集上的实验证明了该方法的有效性。最后将该方法应用于空调控制系统故障数据集,用于衡量系统中不同变量对状态监控的重要性。(本文来源于《浙江大学》期刊2018-04-01)

薛钰,梅雪,支有冉,许志兴,史翔[9](2018)在《基于时间序列数据挖掘的地铁车门亚健康状态识别方法》一文中研究指出针对地铁门在开关过程出现的一些亚健康状态难以识别情况,提出一种基于时间序列数据挖掘的地铁车门亚健康状态识别的方法。该方法首先通过多尺度滑动窗口的方法并结合拓展符号聚集近似(ESAX)字符化算法对车门电机的转角、转速和电流数据进行字符化;然后计算其与车门正常运行状态下模板曲线之间的距离作为特征量,并使用主成分分析(PCA)法进行降维;最后结合基础特征利用分层模式识别模型对各类亚健康状态由粗到细逐层进行识别。以实测车门电机数据为例验证了所提方法的有效性。实验结果表明,该方法能够有效区分各类亚健康状态,识别率可达到99%。(本文来源于《计算机应用》期刊2018年03期)

龙婧[10](2018)在《面向金融时间序列奇异性特征的数据挖掘方法研究与应用》一文中研究指出股市是一个受内因和外因影响的复杂系统,具有互动的参与人数众多的特性,其市场行情也是千变万化、错综复杂。股市的金融时间序列是对金融变量变化发展的历史数据的真实测量和记录,蕴含了金融市场内在的规律和行为特征,所以如何从中挖掘更多潜在信息和规律对金融分析者执行决策和风险投资管理具有极为重要的意义。金融时间序列具有的奇异性特征对分析者的决策起着指导性作用,而传统的依靠数学建模和统计方法的技术分析模型由于涉及多个复杂参数,难以被分析者所理解和掌握。所以,为了更好地为分析者提供一个研究市场行情波动规律的新角度,本文从寻找时间序列中有意义模式入手来获取金融时间序列中隐含特征信息。虽然时间序列挖掘作为目前的研究热点,且已取得很多成果,而针对从金融时间序列中获得有价值信息或有意义片段的理论方法和研究依然匮乏。所以本文针对其中存在的关键问题,应用数据挖掘的方法展开研究,具体工作如下:(1)结合金融时间序列特性对挖掘的影响,本文采用小波方法对数据进行去噪预处理。并在此过程中研究了小波软阈值法去噪过程、阈值确定准则、小波函数和分解层次等参数的选取。(2)结合k线形态理论,通过数值计算检测了不同K线形态对应的奇异性特征序列,并通过基于小波变换的d-近邻聚类方法对特征序列分类别聚类,并通过实验数据纵向分析了金融时间序列奇异性特征的异常程度对挖掘金融时间序列有意义模式具有的重要意义。(3)从时间序列中挖掘隐含模式的意义就是希望能得到对未来预测有价值的信息。本文从分析金融时间序列奇异性特征的角度出发,提出了一个能挖掘K线形态Motif模式,且能主动预警股价反转趋势的技术分析模型。该模型将基序理论应用于K线形态理论,得到K线形态的特征序列。然后运用数据挖掘技术对特征序列进行分类学习,得出K线形态Motif模式的统计特征,最后通过实验验证了K线形态Motif模式对股价反转趋势及反转点的预测效果。(4)最后,通过对沪深A股的历史交易数据进行实证分析,结果表明:本文提出的K线形态Motif模式真实存在并能被较好的识别,且根据提出的K线形态Motif模式模拟短期趋势的投资收益计算,证明该模式应用于时间序列的短期趋势理论判断对股票后期趋势的影响是有效的。(本文来源于《昆明理工大学》期刊2018-03-01)

时间序列数据挖掘论文开题报告范文

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为了精准预测我国民航运输量,基于1985-2017年我国民航运输量随机时间序列数据,运用自回归单整移动平均模型(ARIMA),借助Eviews8.0统计软件,建立预测模型。利用静态预测功能,实现了2015-2019年的点预测,整体拟合度良好,相对误差小,相对误差位于0.1%-0.9%之间,证明该模型是可行的。结果表明,ARIMA模型能够短期准确预测民航运输量,为航空公司、机场、空管等部门可持续发展提供决策依据。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

时间序列数据挖掘论文参考文献

[1].何保荣.基于多目标决策的时间序列数据挖掘算法仿真[J].计算机仿真.2019

[2].刘博,赵璐,单曲轶.基于时间序列数据挖掘的我国民航运输量预测分析[J].中国民航飞行学院学报.2019

[3].朱志静.基于趋势和特征子序列的时间序列数据挖掘研究[D].江南大学.2019

[4].杨秋翔,王冠男,王婷.基于时间序列的多源日志安全数据挖掘仿真[J].计算机仿真.2019

[5].燕超源,李斌,顾新桥,夏琨,李强.基于时间序列大数据挖掘的ATGH模型及MCMC算法研究[J].自动化与仪器仪表.2018

[6].胡宇鹏.时间序列数据挖掘中的特征表示与分类方法的研究[D].山东大学.2018

[7].王培屹.时间序列数据挖掘中的特征表示与相似性度量方法研究分析[J].电脑与电信.2018

[8].黄炜平.基于EMD和BoF模型的时间序列数据挖掘及应用[D].浙江大学.2018

[9].薛钰,梅雪,支有冉,许志兴,史翔.基于时间序列数据挖掘的地铁车门亚健康状态识别方法[J].计算机应用.2018

[10].龙婧.面向金融时间序列奇异性特征的数据挖掘方法研究与应用[D].昆明理工大学.2018

标签:;  ;  ;  ;  ;  ;  ;  

时间序列数据挖掘论文开题报告文献综述
下载Doc文档

猜你喜欢