时间序列相似性论文-姜廷慈,李敬有,吕洪柱

时间序列相似性论文-姜廷慈,李敬有,吕洪柱

导读:本文包含了时间序列相似性论文开题报告文献综述及选题提纲参考文献,主要关键词:多元时间序列,学习行为,相似性度量,动态时间弯曲距离

时间序列相似性论文文献综述

姜廷慈,李敬有,吕洪柱[1](2019)在《基于学习行为时间序列相似性模型的研究》一文中研究指出以学习者学习行为为研究对象,提取了学习行为特征,构建了一组学习行为时间序列数据,提出了一种学习行为时间序列相似性模型;通过学习行为相似性模式的表示、度量和聚类,验证模型的有效性;结果表明,能够很好地对学习行为进行分类,对无效样本有效检验。(本文来源于《齐齐哈尔大学学报(自然科学版)》期刊2019年06期)

李敏,于长永,张峰,马海涛,赵宇海[2](2019)在《基于LSH的时间序列DTW相似性查询》一文中研究指出提出了一种新颖的基于LSH的时间序列DTW相似性近似查询算法,较好地解决了DTW相似性查询速度慢的问题.首先,分析了DTW相似性度量的特点,即时间弯曲的重要特性;其次,将该特性与LSH函数相结合,设计了高效的DTW相似时间序列过滤方法.在很大概率程度上保证了相似的时间序列至少具有一个相同的LSH函数值;最后,给出了一个基于过滤加验证框架的时间序列DTW相似性近似查询算法,该算法利用低维的Hash索引加快候选集合的筛选,从而加快查询速度.实验结果表明,在保持较好的召回率的情况下,本文提出的方法较现有算法有效地提高了DTW相似性查询速度.(本文来源于《小型微型计算机系统》期刊2019年10期)

张乔夫,何文明[3](2019)在《基于指数平滑和WKNN的金融时间序列相似性搜索》一文中研究指出采用叁重指数移动平均平滑金融时间序列。使用动态时间弯曲方法,计算当前样本与历史高收益样本之间的柔性距离。平均收益随平滑次数(0~3次)增加而提高;收益率加权KNN优于中位数KNN,后者又优于1NN;观察长度等于50时,平均收益最高。最优参数可以将平均收益从2.02%提高到4.8%。(本文来源于《现代计算机》期刊2019年29期)

陈海兰,高学东[4](2019)在《基于波动特征的时间序列相似性度量及聚类分析》一文中研究指出在时间序列数据挖掘中,传统的时间序列相似性度量算法没有考虑反映时间序列结构的关键点特征。为了解决该问题,文章提出了基于波动特征的时间序列相似性度量算法,并通过聚类进行了效果分析。研究中首先利用小波分析方法提取时间序列整体变化趋势,然后给出了针对小波分析得到的序列进行波动点识别的方法,构造出包含时间序列重要波动信息的波动点序列。最后提出了非等长时间序列的相似性度量方法计算波动点序列间的距离。实验结果表明,该时间序列度量方法能更好地反映时间序列的趋势特征。(本文来源于《统计与决策》期刊2019年11期)

魏晓辉,许国威,王兴旺,徐海啸[5](2019)在《基于节点相似性和链接次数组合时间序列的链接预测》一文中研究指出针对现有方法利用网络信息相对割裂,很难描述链接次数与相似性分数关系的问题,提出一种动态网络中的链接预测方法,用节点相似性分数和链接次数组合时间序列模型进行预测.首先通过社区演化,预测历史上各时间快照下节点间的相似性分数;然后用二元时间序列模型将其与各时间快照下节点间的事实链接次数相结合,判断下一个时间段内各节点对链接发生的可能性;最后在Weibo-Net-Tweet微博转发数据集上进行测试.实验结果表明,该方法至少提高了5%的预测准确度,证明了社区演化与链接预测之间的内在联系,验证了二元时间序列模型的有效性.(本文来源于《吉林大学学报(理学版)》期刊2019年03期)

丁一明[6](2019)在《时间序列流数据相似性搜索的研究》一文中研究指出基于相似度的时间序列检索是一项长期研究课题,是时间序列数据挖据中的一个基础性问题也是核心问题之一。它广泛应用于金融数据分析、气象数据预测、多媒体数据检索、医疗数据异常检测等领域。本文研究的主要问题对时间序列流数据进行相似性检索,即给定查询序列,随着时间序列流数据到达,找出其上与查询序列相似的时间序列片段。该问题大致可以分为两个阶段:时间序列表示和相似性搜索。时间序列表示阶段是对原始时间序列进行降维表示,以减少后续搜索工作的时间和空间代价,且过滤噪音干扰,提高搜索效率和准确率。相似性搜索阶段是指在表示的基础上采用多种高效搜索技术,结合相似度计算,找出相似结果集。本文在分析国内外时间序列数据挖掘最新研究成果的基础上,从时间序列相似性搜索出发,研究了时间序列的分段线性表示和高效相似性搜索的关键技术等问题,主要完成了以下工作:1.本文研究并分析了分段线性近似表示和分段累积近似表示两种特征表示法,将其中具有代表性的多分辨率的重要点检索表示(MIP)法和分段累积近似表示(PAA)法中的分割部分相结合,提出了基于重要点的平均分割算法对时间序列进行分段划分。该算法相较MIP方法,时间复杂度低,计算效率高,相较PAA方法,可以保留时间序列中重要的特征点,为后续的相似性搜索工作做好准备。2.基于对时间序列的分段划分,本文提出了一种多分辨率精确搜索策略。借助二叉搜索树的结构对时间序列进行多分辨率表示。在多分辨率表示的过程中,从低级到高级,增量计算下界距离,对待搜索序列进行逐级过滤。实验结果显示对于大部分待搜索序列,均可在较低分辨率下完成过滤,从而节省计算成本,提高搜索效率。3.基于对时间序列的分段划分,本文提出一种高效近似搜索策略。该方案对时间序列执行近似相似搜索。将分段后的时间序列分段线性表示,并计算其近似距离。该近似距离的计算方式保留了分段序列的斜率特征,使得过滤效率提高,实验结果显示搜索结果较为准确。但是该方法不满足下界定理,因此无法保证结果非漏报。相较于传统时间序列相似性搜索的一般策略——建立索引,本文提出的两种搜索策略更侧重于增量计算,以适应流数据变化更新快的特点,而无需应对建立索引的维度灾难问题和更新索引所需付出的巨大代价。实验证明,两种搜索策略下,在时间序列流数据集上进行的相似性搜索,相较于已有的策略,搜索结果准确,搜索效率有所提高。(本文来源于《山东大学》期刊2019-05-20)

石亮缘,周任军,李娟,王昱,许福鹿[7](2019)在《基于时间序列相似性度量的新能源-负荷特性指标》一文中研究指出为满足新能源高渗透率电力系统在曲线性状、特征、度量上对负荷特性指标的新需求,提出一种将新能源出力和用电负荷曲线的负荷特性指标拓展为可表达其相互关系的新能源-负荷特性指标。计及数据分布特性与形态波动特征,改进时间序列相似性度量方法,将欧氏距离与改进后的动态时间弯曲距离相结合求取负荷曲线和新能源出力曲线的相似性距离,将其定义为源荷相似性距离作为新能源-负荷特性指标。算例表明,所提指标比传统负荷特性指标能更有效描述新能源高渗透率电力系统负荷特性。(本文来源于《电力自动化设备》期刊2019年05期)

曹洋洋[8](2019)在《时间序列的特征表示和相似性度量方法研究》一文中研究指出随着时间的推移,客观对象某一属性的取值不断变化,采集得到的数据集合就构成了时间序列数据。时间序列是一种重要的数据类型,这种新数据类型被广泛应用在社会生活的方方面面,典型的有某一时间段国内外的生产总值、气象预报、股票期货最终成交价格以及其他类型数据的指数大小。对时间序列的研究有助于挖掘出数据中与时间相关的有价值信息,实现知识的提取。现实世界中由于时间是无尽头的,所以时间序列类型的数据库规模非常大,能达到TB单位的数量级。时间序列本身的高维、复杂、动态以及高噪声的特性注定了直接对原始序列进行研究势必会造成挖掘时间效率低下,挖掘结果的不准确以及研究结论的可信度降低。因此如何有效的对时间序列进行预处理成了最具挑战性的研究课题之一。预处理分为模式表示和相似性度量两个方面。时间序列的模式表示可以将时间序列关键的特征提取出来,降低特征空间维数,保留原始序列的形态,为下一步的研究做铺垫。由于模式表示的压缩率高、形式简单,许多学者参与了对此的研究。本文针对传统的时间序列模式表示算法往往忽略时间序列的时间特性,导致分段结果不够精确的问题,提出了基于双曲正切函数约束的时间序列建模表示算法。该算法在分段聚合近似的基础上引入双曲正切函数,并且提出了移动增强因子的概念。移动增强因子考虑了时间对各个子序列所含信息量差异的影响,促使时间序列分段后的模型更加契合原始时间序列,完成最终的时间序列分段表示。相似性度量,顾名思义是为了比较序列之间的相似性,在指定的数据库中找到与给定序列在某一定义下相似的序列,在数据挖掘领域是一项重要且基础的识别时间序列模式的预处理任务,对时间序列的异常检测和预测都有至关重要的意义。针对传统的动态时间弯曲算法容易受到离群点以及局部噪声点的影响导致运算结果的准确性不高,不能较精确的处理复杂时间序列数据。对此,文中提出基于形态距离及自适应权重的相似性度量算法。该算法首先利用趋势滤波对原始待比较序列进行降维,压缩;其次引入形态距离计算两时间序列的距离矩阵;最后采用自适应赋权的距离函数抽取出各个子序列所含信息量的差异,利用动态时间弯曲的算法思想完成相似度量工作。最后在大量公开数据集上进行了一系列的实验,结果表明:(1)基于双曲正切函数约束的时间序列建模表示算法有较小的拟合误差,利用此算法对序列完成分段,能够保证在满足时间序列动态增长的条件下,更好的完成序列的宏观相似性查找等工作,算法的通用性,准确性均有所提高。(2)基于形态距离及自适应权重的相似性度量算法鲁棒性更高,在完成宏观的相似性度量的基础上更好的保留了序列的形态特征,同时能更加精确,高效的处理复杂的时间数列。(本文来源于《江南大学》期刊2019-05-01)

桑发文[9](2019)在《深度核极限学习机和相似性LSSVM时间序列预测模型研究》一文中研究指出随着各类新型数据采集手段和大规模快速存储技术的广泛应用,各领域积累了海量的数据,并呈指数级增长,从数据挖掘价值、实现价值增值成为人们的共识。时间序列预测通过研究时间序列随时间变化的规律和时间序列本身的内在联系,对研究对象未来发展趋势进行估计和判断。当前,以机器学习、神经网络、深度学习技术为代表的数据分析及预测模型大量涌现,为解决海量复杂数据的分析问题提供了重要选择。无论是普适性模型还是针对某一特定领域的模型,如何有效提高预测精度一直是时间序列预测研究的重点问题。本文从两个方面进行研究:借鉴深度学习技术基本思想,以核极限学习机(Extreme Learning Machine with Kernel,KELM)为基本构件,提出了一种新的多隐层堆迭的深度时间序列预测模型;通过分析医院日门诊量变化的特点和规律,综合应用相似性方法、粒子群方法(Particle Swarm Optimization,PSO)和最小二乘支持向量机方法(Least Square Support Vector Machine,LSSVM),构建了新的组合模型,对医院门诊量短期预测进行研究。(1)深度核极限学习机时间序列预测模型。受深度学习思想启发,本文以KELM为基本构件,构造了新的自编码器KELM-AE,并以此为基础提出了新的多隐层堆迭网络模型深度核极限学习机(DL-KELM),其每个隐含层权值由KELM-AE独立确定,一经确定,无需调整,最后一个隐含层的输出作为KELM的输入来进行回归和分类。该模型通过引入KELM有效克服了ELM自身容易过拟合、结果受初始化参数影响较大的固有缺点,具有较高的计算速度。在多个领域的数据集上进行单步和多步预测实验表明,该模型具有较高的预测精度。(2)基于相似性方法和PSO-LSSVM的组合预测模型及医院门诊量预测研究。此部分主要针对医院门诊量短期预测这一具体问题开展研究,提出解决方案。通过对医院门诊量变化趋势进行分析,发现门诊量具有“周”周期性特点,即门诊量以七天为一个周期变化,周一门诊量最高,接着逐渐下降,周日最低。基于上述的规律性,本文组合相似性方法、粒子群优化算法和最小二乘支持向量机方法构造了新的组合预测模型。采用位于兰州市和乌鲁木齐市的两所叁甲综合性医院日门诊量数据对模型预测性能进行验证,实验表明该方法预测精度较高,具有良好的应用前景。(本文来源于《兰州大学》期刊2019-04-01)

王丹[10](2019)在《基于HP滤波和相似性度量的新方法在时间序列中的应用》一文中研究指出大数据时代下时间序列出现高维性、海量性、随机性、信噪比低等特征,传统时间序列模型分析已经无法满足现代分析要求。因此,对时间序列进行信息提取,降低数据维度和复杂度具有重要意义。本文所使用的HP滤波法和相似性度量能对数据中的长期趋势,波动循环,相似波动等信息进行提取,有利于更好地进行时间序列分析。滤波技术最初起源于电子工程领域,通过过滤信号中特定频率的波段,去除干扰信号。HP滤波方法是一种比较成熟的、简单易操作的高通滤波法,能将信号中的高频成分和其他成分进行分离。利用HP滤波法对时间序列进行分解,可以去除其中长期增长趋势成分得到平稳的周期波动成分。经济学者们常用HP滤波法分解经济指标,从而得到其中隐含的经济波动信息、分析经济周期、研究经济波动与增长之间的关系。目前学者对HP滤波的研究大都局限于直接应用,但其仍有不足之处。首先,平滑参数的取值缺乏统一标准。其次,序列分解结果受序列长度影响,尾部分解不稳定。本文第四章针对这里两个问题提出了有效的解决办法。在平滑参数取值方面,提出利用分解所得波动序列与波动率序列的极值点重合率对平滑参数进行选择的方法。在尾部分解的修正方面,提出延长序列法,并通过延长后序列分解所得波动序列的修正距离确定延长期数。利用本文所改进的HP滤波法对GDP年度数据进行滤波,所得波动成分与实际经济波动更相符,能更细致的分析宏观经济发展变化规律。相似性度量是对数据进行分类、聚类、模式发现等数据挖掘的基础。长时间序列中利用有效的相似性度量方法对其子序列段进行相似性搜索,发现相似波动,剔除多余信息,能有效的优化数据分析效果。本文第五章提出一种综合考虑了序列波动趋势和程度的分层相似性度量方法,并通过编程实现相似性搜索。实证分析中首先利用第四章所改进的HP滤波方法对股价时间序列进行滤波,得到去除了长期增长趋势的纯波动序列,再对纯波动序列进行相似性度量和搜索,最终基于相似性搜索结果建立S-BP神经网络模型。结果表明:该方法具有良好的相似性度量效果,利用历史中相似波动时期的股价对未来股价进行预测,相较于使用近期历史股价能更好的预测未来股价变化趋势。本文针对宏观经济指标序列提出基于HP滤波分解和传统时间序列模型的预测分析,针对股价时间序列提出基于相似性度量和神经网络模型的预测分析。实证表明:本文对隐含周期波动的短时间序列与具有相似波动的长时间序列所提出的分析方法在未来值预测方面具有较好效果。(本文来源于《西华师范大学》期刊2019-04-01)

时间序列相似性论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

提出了一种新颖的基于LSH的时间序列DTW相似性近似查询算法,较好地解决了DTW相似性查询速度慢的问题.首先,分析了DTW相似性度量的特点,即时间弯曲的重要特性;其次,将该特性与LSH函数相结合,设计了高效的DTW相似时间序列过滤方法.在很大概率程度上保证了相似的时间序列至少具有一个相同的LSH函数值;最后,给出了一个基于过滤加验证框架的时间序列DTW相似性近似查询算法,该算法利用低维的Hash索引加快候选集合的筛选,从而加快查询速度.实验结果表明,在保持较好的召回率的情况下,本文提出的方法较现有算法有效地提高了DTW相似性查询速度.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

时间序列相似性论文参考文献

[1].姜廷慈,李敬有,吕洪柱.基于学习行为时间序列相似性模型的研究[J].齐齐哈尔大学学报(自然科学版).2019

[2].李敏,于长永,张峰,马海涛,赵宇海.基于LSH的时间序列DTW相似性查询[J].小型微型计算机系统.2019

[3].张乔夫,何文明.基于指数平滑和WKNN的金融时间序列相似性搜索[J].现代计算机.2019

[4].陈海兰,高学东.基于波动特征的时间序列相似性度量及聚类分析[J].统计与决策.2019

[5].魏晓辉,许国威,王兴旺,徐海啸.基于节点相似性和链接次数组合时间序列的链接预测[J].吉林大学学报(理学版).2019

[6].丁一明.时间序列流数据相似性搜索的研究[D].山东大学.2019

[7].石亮缘,周任军,李娟,王昱,许福鹿.基于时间序列相似性度量的新能源-负荷特性指标[J].电力自动化设备.2019

[8].曹洋洋.时间序列的特征表示和相似性度量方法研究[D].江南大学.2019

[9].桑发文.深度核极限学习机和相似性LSSVM时间序列预测模型研究[D].兰州大学.2019

[10].王丹.基于HP滤波和相似性度量的新方法在时间序列中的应用[D].西华师范大学.2019

标签:;  ;  ;  ;  

时间序列相似性论文-姜廷慈,李敬有,吕洪柱
下载Doc文档

猜你喜欢