机器学习模型在中国A股市场的应用

机器学习模型在中国A股市场的应用

论文摘要

金融市场在现代经济中扮演着重要的作用,一方面对政策制定者来说对金融市场的有效预测能使其更好的对宏观经济进行预判,进而制定相关政策引导经济健康运行,另一方面对金融市场的参与者来说,金融市场的预测对构建投资组合、进行风险管理尤为重要。但金融市场的复杂性导致传统的ARMA等模型预测结果往往不是很理想。而自上世纪九十年代以来,人工智能作为计算机科学的一个分支,其概念被不断提及,学术界、工商业,乃至社会大众无不对人工智能趋之若鹜。随着计算机性能的提高和算法的不断优化,人工智能的理论、方法和技术都得到了普遍的重视和提升。尤其在图像识别、语音识别、自动驾驶、机器翻译等领域,人工智能逐渐从幕后走向前台,并开始大展拳脚,在很多相关行业应用的范围也在不断扩大,这不禁让人联想到人工智能应用在金融市场的美好前景。本文将机器学习模型应用到中国A股市场上,主要使用支持向量机模型、人工神经网络模型、随机森林模型和三者的集成模型对中国A股股票未来三天涨跌的方向进行预测,并根据涨跌的概率选择最大的M只股票构建投资组合,建模包括获取数据、确立特征变量和目标变量、划分训练集和测试集、数据预处理、特征选择、模型参数调优、模型评价等过程。结果显示基于向量机模型、人工神经网络模型、随机森林模型三者的集成模型表现最优,其中M取值5时表现最好,夏普比率最大为1.35,年化复合收益率为44.69%,并且集成模型的表现显著优于沪深300指数和中证500指数。此外策略组合的行业分布也呈一定差异,并不是均衡分布,表明模型能在一定程度上捕捉A股行业轮动的信息,为量化研究、量化选股提供了新的思路。其他参考文献往往使用单一模型,或者在单一模型的基础之上又集成了其他用以特征选择的模型,本文创造性地将相关性很低、内在逻辑数理基础不同的支持向量机模型、人工神经网络模型、随机森林模型集成起来,结果表明集成之后的模型表现优于任何一个单一模型,体现了模型集成的优势。此外,本文也丰富了数据维度,在简单的技术指标之上,又加入了一些日频数据,包括估值数据、换手率数据、波动性数据、动量反转数据等,从而使数据维度更加多元,反映的信息更充分,进而提高模型预测的准确性和依此构建的投资组合的收益率等。这些都更符合金融市场非线性、非平稳的属性,在预测和构建投资策略时能够产生更好的应用效果。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第1章 绪论
  •   1.1 研究背景与研究意义
  •   1.2 国内外研究概况
  •     1.2.1 国外研究概况
  •     1.2.2 国内研究概况
  •   1.3 本文的创新点
  •   1.4 本文的组织结构
  • 第2章 模型基本原理
  •   2.1 支持向量机模型
  •     2.1.1 支持向量机分类
  •     2.1.2 序列最小化算法
  •   2.2 随机森林模型
  •     2.2.1 决策树的基本原理
  •     2.2.2 随机森林模型的基本原理
  •   2.3 神经网络模型
  •     2.3.1 神经网络模型简介
  •     2.3.2 处理梯度消失和梯度爆炸问题
  •   2.4 集成模型
  • 第3章 实证分析
  •   3.1 数据获取和相关软件
  •   3.2 特征变量和目标变量的选择
  •     3.2.1 技术指标
  •     3.2.2 其他指标
  •     3.2.3 目标变量的选择
  •     3.2.4 训练集和测试集的划分
  •   3.3 数据预处理
  •     3.3.1 异常值处理
  •     3.3.2 空值填充
  •     3.3.3 标准化处理
  •   3.4 特征选择
  •   3.5 模型调参
  •   3.6 模型评价
  • 第4章 策略分析与评价
  •   4.1 策略表现
  •     4.1.1 支持向量机模型策略表现
  •     4.1.2 人工神经网络模型策略表现
  •     4.1.3 随机森林模型策略表现
  •     4.1.4 集成模型策略表现
  •   4.2 模型分析与评价
  •   4.3 策略组合行业分布
  •   4.4 子时间段模型表现分析
  •   4.5 策略组合净值表现
  • 第5章 结论与展望
  •   5.1 结论
  •   5.2 展望
  • 参考文献
  • 致谢
  • 学位论文评阅及答辩情况表
  • 文章来源

    类型: 硕士论文

    作者: 胡锐

    导师: 宫晓琳

    关键词: 支持向量机,人工神经网络,随机森林

    来源: 山东大学

    年度: 2019

    分类: 基础科学,经济与管理科学

    专业: 数学,宏观经济管理与可持续发展,金融,证券,投资,市场研究与信息

    单位: 山东大学

    分类号: F832.51;F224

    总页数: 51

    文件大小: 2689K

    下载量: 251

    相关论文文献

    • [1].基于迭代随机森林算法的糖尿病预测[J]. 长春工业大学学报 2019(06)
    • [2].基于改进随机森林的城市河流水生态健康评价研究[J]. 海河水利 2019(06)
    • [3].基于随机森林癫痫患者脑电数据的分析研究[J]. 中国数字医学 2020(01)
    • [4].基于局部均值分解和迭代随机森林的脑电分类[J]. 吉林大学学报(信息科学版) 2020(01)
    • [5].网贷平台数据的随机森林预测模型实证分析[J]. 宜宾学院学报 2019(12)
    • [6].采用单类随机森林的异常检测方法及应用[J]. 西安交通大学学报 2020(02)
    • [7].随机森林数据情感挖掘方法分析[J]. 通讯世界 2020(01)
    • [8].运用最大熵模型和随机森林模型对东北红松分布的模拟[J]. 东北林业大学学报 2020(03)
    • [9].基于随机森林算法的城区土地覆盖分类研究[J]. 河北省科学院学报 2020(01)
    • [10].运用随机森林模型对北京市林分蓄积生长量的预测[J]. 东北林业大学学报 2020(05)
    • [11].融合人工鱼群和随机森林算法的膝关节接触力预测[J]. 中国医学物理学杂志 2020(04)
    • [12].结合特征选择和优化随机森林的无线网络数据丢失重建[J]. 上海电力大学学报 2020(03)
    • [13].基于随机森林算法的耕地质量定级指标体系研究[J]. 华南农业大学学报 2020(04)
    • [14].一种基于随机森林的组合分类算法设计与应用[J]. 电子设计工程 2020(16)
    • [15].基于随机森林算法的日光温室内气温预测模型研究[J]. 中国农学通报 2020(25)
    • [16].基于因子分析和迭代随机森林方法的学生成绩综合评价——以都匀市某高中为例[J]. 黔南民族师范学院学报 2020(04)
    • [17].基于随机森林模拟的辽宁省降水量空间分布研究[J]. 陕西水利 2020(09)
    • [18].随机森林模型在膝关节炎患者结构特征与症状定量分析中的应用(英文)[J]. 磁共振成像 2020(10)
    • [19].基于特征选择的极限随机森林算法研究[J]. 计算机应用研究 2020(09)
    • [20].随机森林回归分析方法在代谢组学批次效应移除中的应用[J]. 中国卫生统计 2020(05)
    • [21].一种面向非均衡分类的随机森林算法[J]. 计算机与现代化 2018(12)
    • [22].随机森林模型和决策树模型在肝硬化上消化道出血预后中的应用[J]. 中国卫生统计 2019(02)
    • [23].基于随机森林的债券违约分析[J]. 当代经济 2018(03)
    • [24].基于改进网格搜索算法的随机森林参数优化[J]. 计算机工程与应用 2018(10)
    • [25].随机森林在城市不透水面提取中的应用研究[J]. 云南师范大学学报(自然科学版) 2017(03)
    • [26].一种顺序响应的随机森林:变量预测和选择[J]. 小型微型计算机系统 2017(08)
    • [27].基于随机森林回归的军械器材需求预测[J]. 自动化应用 2017(09)
    • [28].流式大数据下随机森林方法及应用[J]. 西北工业大学学报 2015(06)
    • [29].面向高维数据的随机森林算法优化探讨[J]. 商 2016(04)
    • [30].深度随机森林在离网预测中的应用[J]. 计算机科学 2016(06)

    标签:;  ;  ;  

    机器学习模型在中国A股市场的应用
    下载Doc文档

    猜你喜欢