论文摘要
时间序列预测通过对事物历史数据的分析来预测未来一段时间的发展趋势,广泛应用于气象、农业等各个领域。由于时间序列数据具有数据量大、非线性、影响因素众多的特点,使得时间序列预测成为了研究难点。时间序列预测方法主要有传统的时间序列预测方法和基于机器学习的时间序列预测方法。其中传统的时间序列预测方法主要是基于统计学理论,建模技术单一,预测精度不高。基于机器学习的时间序列预测方法不仅提高了预测的精度,而且泛化能力强。虽然目前有许多基于机器学习的时间序列预测方面的研究,但是仍有一些需要解决的问题,特征提取就是其中之一。目前在特征提取方面主要有两个问题:一是特征提取方式。特征提取的方式主要是人工,该方式具有一定的主观性和不完备性;二是有效特征的选择。特征的质量直接影响了建模的水平,特征数目较多时如何选取出有效特征,这也是机器学习的研究热点之一。本文针对这两个问题,提出了一种将人工特征和基于深度学习生成的隐性特征相融合,并将融合后的特征集植入集成学习算法进行预测的方法。该方法使用改进的卷积神经网络自动提取隐性特征,然后将隐性特征与人工特征融合形成总特征集,最后利用随机森林从中选取有效特征后植入LightGBM算法中进行有监督的训练。基于所提出方法,本文使用两种时间序列数据进行验证,分别建立了汽车上牌量预测和农产品价格预测,与其它预测方法的对比结果显示该方法预测准确度更高,表明了该方法的可行性和有效性。
论文目录
摘要abstract第一章 绪论 1.1 研究背景与意义 1.2 国内外研究现状 1.3 课题研究内容与论文结构 1.3.1 主要研究内容 1.3.2 论文结构第二章 相关理论基础 2.1 时间序列 2.1.1 时间序列概述 2.1.2 时间序列特点 2.1.3 时间序列预测过程 2.2 集成学习 2.2.1 Bagging 2.2.2 随机森林 2.2.3 Boosting 2.2.4 LightGBM 2.3 深度学习 2.3.1 人工神经网络 2.3.2 卷积神经网络 2.4 本章小结第三章 TPFF方法 3.1 整体设计框架 3.2 特征提取模块设计 3.2.1 预处理 3.2.2 隐性特征提取 3.3 预测模块设计 3.3.1 特征选择 3.3.2 预测算法 3.4 本章小结第四章 基于TPFF的汽车上牌量预测 4.1 预处理 4.2 基于CNN的汽车上牌量特征提取 4.2.1 输入样本长度的选择 4.2.2 卷积和池化层数的选择 4.2.3 卷积核大小的选择 4.2.4 卷积核个数的选择 4.3 基于RF的汽车上牌量特征选择 4.3.1 人工特征 4.3.2 特征重要度分析 4.4 LightGBM预测算法 4.5 实验结果及分析 4.6 本章小结第五章 基于TPFF的农产品价格预测 5.1 预处理 5.2 基于CNN的农产品特征提取 5.2.1 输入样本长度的选择 5.2.2 卷积和池化层数的选择 5.2.3 卷积核大小的选择 5.2.4 卷积核个数的选择 5.3 基于RF的农产品特征选择 5.3.1 人工特征 5.3.2 特征重要度分析 5.4 LightGBM预测算法 5.5 实验结果及分析 5.6 本章小结总结与展望参考文献攻读学位期间取得的研究成果致谢
文章来源
类型: 硕士论文
作者: 屈乐
导师: 范中磊
关键词: 特征融合,时间序列,特征提取,特征选择
来源: 长安大学
年度: 2019
分类: 基础科学,信息科技
专业: 数学,自动化技术
单位: 长安大学
分类号: O211.61;TP18
总页数: 79
文件大小: 4976K
下载量: 223
相关论文文献
标签:特征融合论文; 时间序列论文; 特征提取论文; 特征选择论文;