(长沙理工大学数学与统计学院,长沙湖南410114)
摘要:为了建立更为贴近股市实际情况的预测模型,将神经网络在股票价格预测上的应用作为基础,利用神经网络的鲁棒性,建立添加了模拟股市波动干扰的神经网络,利用有外部信息扰动的神经网络验证了不同神经网络应对干扰的能力。在模拟股市真实情况对股票特征数据和神经网络进行摄动时,相比RNN和GRU,LSTM在应对外部信息时更能保持相对稳定的预测结果。这一结果为后续对股市具体情况的模拟和更深层次的基于外部信息的股市研究提供了参考。
关键词:神经网络;股票预测;外部信息;鲁棒性
我国的证券市场已经在数十年的发展中不断趋于完善,研究者们对股票数据的研究也日趋准确细化,随着机器学习和深度学习方法的出现,股票数据的预测分析在时间跨度和预测精度上都有了巨大提升,我们希望能够尽可能地模拟金融市场的外部信息对市场造成的影响,通过对神经网络和深度学习算法的研究使得股票市场的具体机制的演绎和市场环境的模拟也愈加完备,从而使得股票预测能够在合理且切实的环境中进行,并设想能够利用神经网络的鲁棒性来对抗股市的随机因素。
1.网络扰动方法
我们针对股票数据(时序数据),改动模型训练层,添加随机噪声层。通过利用这种方法训练模型数据,测试不同的神经网络,对常用的时序数据预测神经网络进行验证。测试神经网络识别这种干扰项的能力,也就是测试神经网络能否将随机噪声数据识别为无用数据从而在输出时不受影响。
在下一部分我们基于这种假设,验证多个常用神经网络的鲁棒性,寻找在具有外部信息的股价预测时表现更为稳定的神经网络。
2.噪声扰动网络实验
为了对模型效果进行比较分析,我们针对三种神经网络RNN(循环神经网络),GRU(门控循环单元)和LSTM(长短期记忆网络),分别进行训练。常规的训练过程,通常包含训练集,验证集及测试集三个部分,在此,我们将加入新的预测集。在训练集和测试集中,我们利用加入噪声的数据进行训练和测试。而在预测集中,我们将噪声项归零,消除噪声影响。我们分别用对RNN,GRU,LSTM以这三种方法对数据进行训练,红线为方法(1),绿线为方法(2),与红色基本重合的蓝线为方法(3)。
从结果可以看出,LSTM能够识别出实际数据中的噪声数据,并在训练中降低噪声数据对模型的影响,GRU的这种能力相较于LSTM较弱,从而误差相对较大,RNN在这类噪声干扰下,从误差数据中提取了较多信息作为模型的组成部分,从而误差加大。基于误差的波动性,LSTM的波动相较于GRU和RNN来说较小,RNN的波动最大也就是稳定性最低。方法(3)的结果表明,误差和方差同原始神经网络对比并没有加大,从而可认为加入噪声层对模型本身的准确性和稳定性没有干扰。
3.结论
我们参照股市实际存在的不确定因素,作为外部信息向股票预测模型中添加了噪声层,从整体结果上分析,噪声层不会破坏神经网络原有的准确性和鲁棒性,并在应对股票市场中存在的实际问题能够起到一定的应对作用。我们可以将这种添加了噪声层的模型,作为更具鲁棒性的模型在股票预测时应用。在后期研究中,我们可以以此为基础,建立更符合股市实际情况的,外部信息和限制条件更为复杂的神经网络模型,例如将新闻信息、投资者情绪变化、世界总体经济变化趋势等以不同形式加入神经网络,据此对神经网络在股票市场的应用进行更深一步地研究。
参考文献
[1]程卓.高频交易发展综述及典型数据挖掘方法股指预测[D].北京:中国科学院数学与系统科学研究院,2016:35-49.
[2]杨波.量化投资理论及其在A股市场中的模拟试验[D].北京:中国科学院数学与系统科学研究院,2017,18-35.
[3]A.Ben-Tal,M.Teboulle.Anold-newconceptofconvexriskmeasures:theoptimizedcertaintyequivalent[J],MathematicalFinance,2007,17(3):449-476.