基于LSTM神经网络的多因子选股模型实证研究

基于LSTM神经网络的多因子选股模型实证研究

论文摘要

近年来,人工智能AI发展之势迅猛,人工智能机器人AlphaGO对战人类大获全胜,“智能+”首次写入2019年国务院政府工作报告,种种迹象无不说明人工智能在我们生活中扮演着日益重要的角色。量化投资为金融领域的一个庞大分支,其中,多因子选股是一项较为成熟的选股技术。因此,本文将深度学习应用于多因子选股,构建了基于LSTM神经网络算法的多因子选股模型。通过与SVM算法对比,发现LSTM神经网络算法比SVM算法更适用股票这类时间序列数据,并将LSTM预测出来的股票进行回测发现其能够获得超过比较基准的收益率。本文选取2012年1月至2018年12月的每一周最后一个交易日的动态沪深300成分股的因子截面数据作为数据样本,其中2012年1月到2017年12月的数据作为模型的训练数据和验证数据,2018年1月至2018年12月作为模型的测试数据。在选取候选因子方面,分别选取质量、动量、价值、常用技术指标、每股指标、情绪、成长、分析师预期、基础科目与衍生和收益与风险等十类因子,合计因子244个,这在广度和深度上均扩大了候选因子的选取范围。本文模型的构建主要分为以下几个步骤:首先,对原始数据依次进行数据预处理、标签标记和主成分分析降维,然后将处理后得到的新数据喂入支持向量机模型和长短期记忆神经网络模型中作比较分析,通过对比发现LSTM模型更适合股票这类非线性的时间序列数据。其次,在LSTM模型中进行训练、学习,并通过学习得到一个优质模型。最后,将测试数据喂入学习得到的优质模型中进行预测,并依据模型预测得到的结果,选择一些股票构建等权重投资组合作回测检验,以期获得超过同期基准的收益率。通过年化收益率、夏普比率、信息比率和最大回测等评价指标对模型进行评估发现,本文构建的回测模型在2018年这一年间的年化收益率超过比较基准的收益率。

论文目录

  • 摘要
  • abstract
  • 第1章 绪论
  •   1.1 研究背景与意义
  •     1.1.1 研究背景
  •     1.1.2 研究意义
  •   1.2 国内外现状
  •     1.2.1 多因子选股模型的研究现状
  •     1.2.2 LSTM模型的研究现状
  •   1.3 研究思路及论文结构
  •     1.3.1 研究思路
  •     1.3.2 论文结构
  •   1.4 本文创新
  • 第2章 相关理论概述
  •   2.1 多因子选股模型
  •   2.2 RNN神经网络
  •     2.2.1 RNN的含义和结构图
  •     2.2.2 RNN神经网络模型
  •   2.3 LSTM神经网络
  •     2.3.1 LSTM的含义和结构图
  •     2.3.2 LSTM神经网络模型
  • 第3章 数据的预处理
  •   3.1 数据获取
  •   3.2 候选因子的选取
  •   3.3 数据预处理
  •   3.4 主成分分析降维
  • 第4章 多因子模型的构建
  •   4.1 SVM对比模型
  •   4.2 LSTM模型的构建
  •     4.2.1 LSTM模型的参数优化
  •     4.2.2 模型的实验结果分析
  • 第5章 总结与展望
  •   5.1 研究总结
  •   5.2 模型的不足之处
  • 参考文献
  • 致谢
  • 附录 A
  • 文章来源

    类型: 硕士论文

    作者: 黄媛

    导师: 谢语权

    关键词: 神经网络,多因子选股模型,量化投资

    来源: 湘潭大学

    年度: 2019

    分类: 基础科学,经济与管理科学

    专业: 数学,宏观经济管理与可持续发展,金融,证券,投资

    单位: 湘潭大学

    分类号: F832.51;F224

    DOI: 10.27426/d.cnki.gxtdu.2019.001330

    总页数: 44

    文件大小: 1853K

    下载量: 218

    相关论文文献

    • [1].考虑上下游的LSTM短时交通流量预测[J]. 哈尔滨理工大学学报 2019(05)
    • [2].基于双向LSTM的图书分类系统的设计与实现[J]. 信息技术 2020(01)
    • [3].LSTM神经网络在驾驶行为分析中的应用[J]. 电脑编程技巧与维护 2020(01)
    • [4].基于LSTM的时政新闻摘要提取研究[J]. 信息技术与信息化 2020(01)
    • [5].基于LSTM的藏语语音识别[J]. 电脑知识与技术 2020(04)
    • [6].LSTM循环神经网络与企业盈利预测研究[J]. 全国流通经济 2020(01)
    • [7].基于LSTM和时间序列分析法的短期风速预测[J]. 计算机仿真 2020(03)
    • [8].基于深度双向LSTM网络的说话人识别[J]. 计算机工程与设计 2020(06)
    • [9].运用LSTM神经网络预测武汉市居民存款余额[J]. 金融理论与教学 2020(03)
    • [10].基于LSTM网络的语音服务质检推荐技术[J]. 计算机与现代化 2020(07)
    • [11].基于LSTM的动车组故障率预测模型[J]. 中国铁路 2020(07)
    • [12].基于LSTM的风机滚动轴承剩余寿命预测研究[J]. 工业控制计算机 2020(06)
    • [13].基于改进LSTM模型的大气温度预测[J]. 通化师范学院学报 2020(08)
    • [14].基于LSTM神经网络模型对大宗矿产资源放行风险预测研究[J]. 中国口岸科学技术 2020(06)
    • [15].基于LSTM模型的高速公路流量预测与应用[J]. 中国交通信息化 2020(10)
    • [16].基于LSTM神经网络的肉牛动态称重算法研究[J]. 黑龙江畜牧兽医 2020(20)
    • [17].基于可分离卷积与LSTM的语音情感识别研究[J]. 信息技术 2020(10)
    • [18].基于LSTM神经网络的乌鲁木齐市流感样病例的预测研究[J]. 科技视界 2019(31)
    • [19].基于上下文增强LSTM的多模态情感分析[J]. 计算机科学 2019(11)
    • [20].深度学习框架下LSTM网络在短期电力负荷预测中的应用[J]. 电力信息与通信技术 2017(05)
    • [21].基于LSTM的舰船运动姿态短期预测[J]. 舰船科学技术 2017(13)
    • [22].LSTM对上证指数的实证分析[J]. 现代经济信息 2017(09)
    • [23].基于LSTM网络鄱阳湖抚河流域径流模拟研究[J]. 华中师范大学学报(自然科学版) 2020(01)
    • [24].基于深度LSTM的端到端的语音识别[J]. 中北大学学报(自然科学版) 2020(03)
    • [25].基于LSTM的视频行为识别技术与应用分析[J]. 信息与电脑(理论版) 2020(04)
    • [26].基于LSTM的监控视频中步态识别方法研究[J]. 中国人民公安大学学报(自然科学版) 2020(02)
    • [27].基于自然语言处理及LSTM模型的产业上下游关系识别[J]. 统计与决策 2020(14)
    • [28].基于LSTM循环神经网络的大地电磁工频干扰压制[J]. 地球物理学进展 2020(05)
    • [29].基于LSTM模型的北京首都国际机场路面交通拥堵预测[J]. 数理统计与管理 2020(05)
    • [30].基于深度学习LSTM网络的沥青路面性能预测研究[J]. 公路交通科技(应用技术版) 2020(08)

    标签:;  ;  ;  

    基于LSTM神经网络的多因子选股模型实证研究
    下载Doc文档

    猜你喜欢