迁移学习在量化选股中的应用研究

迁移学习在量化选股中的应用研究

论文摘要

随着近年来机器学习、人工智能领域的快速发展,很多国内外学者尝试着将机器学习与量化投资相结合,试图通过数据挖掘的手段,比如SVM(支持向量机模型)、神经网络,集成学习等模型探索因子与股票收益之间的关系,进而建立多因子模型对股票未来收益进行预测。但上述算法在金融领域应用时存在两个主要问题:1.数据样本不足。虽然金融市场中存在着大量高低频数据可供研究,但是在模型训练过程中时真正有效的样本数据是非常有限的,如何高效利用有限数据构建出泛化误差较小的机器学习模型是值得研究的。2.金融市场是不断变化的,分别处于不同时间节点的训练样本和测试样本往往很难保持同分布,因此会导致机器学习模型的延伸性比较差。本文尝试引入迁移学习的思想与多因子选股模型相结合来处理上述问题,在TrAdaboost算法的基础上进行补充,通过构造辅助训练样本集和源训练样本集,从前者中学习知识并提取部分与源训练样本集分布相似的股票样本与源训练样本集一起重组为迁移学习量化选股模型的训练样本,从而规避常规机器学习模型中需要假设训练样本和测试样本相同分布的问题。本文设计了一个包含因子筛选和数据降维的因子库建立体系,同时给出了完整的迁移学习量化选股模型框架,通过2013年至2018年底的真实市场交易数据对该模型进行实证分析,将其结果与未使用迁移学习思想的Adaboost多因子选股模型进行对比,证明了本文研究的迁移学习多因子选股模型的有效性,在参数相同的条件下,合理设计辅助训练样本集和源训练样本集的采样方式可以提升传统机器学习模型的绩效。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 选题背景及研究意义
  •     1.1.1 选题背景
  •     1.1.2 研究意义
  •   1.2 国内外研究现状
  •     1.2.1 多因子选股模型的国内外研究现状
  •     1.2.2 迁移学习国内外研究现状
  •   1.3 研究方法和技术路线
  •   1.4 组织架构和创新点
  • 第二章 多因子选股模型介绍
  •   2.1 CAPM模型及Alpha收益
  •   2.2 APT模型
  •   2.3 Fama-French三因子模型
  •   2.4 多因子选股模型框架
  •   2.5 本章小结
  • 第三章 迁移学习相关理论
  •   3.1 迁移学习相关概念和理论
  •     3.1.1 领域和任务的概念
  •     3.1.2 相关理论支撑
  •   3.2 基于样本的迁移学习
  •   3.3 TrAdaboost模型
  •     3.3.1 AdaBoost与 Hedge(β)技术
  •     3.3.2 TrAdaboost算法描述
  •   3.4 本章小结
  • 第四章 迁移学习量化选股模型的构建
  •   4.1 股票收益率分布相关问题验证
  •     4.1.1 收益率正态分布检验
  •     4.1.2 滞后相关统计检验
  •     4.1.3 均值方差时变性检验
  •   4.2 因子库的建立和筛选
  •     4.2.1 因子库简介
  •     4.2.2 因子筛选
  •     4.2.3 数据降维
  •   4.3 TrAdaboost算法适用性修改
  •   4.4 迁移学习多因子选股模型框架
  •   4.5 本章小结
  • 第五章 交易模型实证分析
  •   5.1 数据预处理及策略参数设置
  •   5.2 基分类器的选择及参数设置
  •   5.3 迁移学习量化选股模型的训练与测试
  •   5.4 策略回测收益及风险评估
  •   5.5 本章小节
  • 总结与展望
  • 参考文献
  • 攻读硕士学位期间取得的研究成果
  • 致谢
  • 附件
  • 文章来源

    类型: 硕士论文

    作者: 王旭

    导师: 梁满发

    关键词: 量化投资,多因子选股模型,迁移学习,样本分布

    来源: 华南理工大学

    年度: 2019

    分类: 基础科学,经济与管理科学

    专业: 数学,宏观经济管理与可持续发展,金融,证券,投资

    单位: 华南理工大学

    分类号: F224;F830.91

    DOI: 10.27151/d.cnki.ghnlu.2019.001301

    总页数: 68

    文件大小: 3254K

    下载量: 113

    相关论文文献

    • [1].基于训练样本集扩展的隐式篇章关系分类[J]. 中文信息学报 2016(05)
    • [2].一种新的支持向量机大规模训练样本集缩减策略[J]. 计算机应用 2009(10)
    • [3].基于类中心的SVM训练样本集缩减改进策略[J]. 重庆交通大学学报(自然科学版) 2014(02)
    • [4].基于大训练样本集的ε-SVR改进算法研究[J]. 计算机仿真 2010(10)
    • [5].基于密度裁剪的SVM分类算法[J]. 青岛大学学报(自然科学版) 2018(03)
    • [6].基于SVM主动学习的网络入侵检测算法研究[J]. 计算机与信息技术 2009(12)
    • [7].改进的KNN快速分类算法[J]. 青岛大学学报(自然科学版) 2014(04)
    • [8].一种在线稀疏LSSVM及其在系统建模中的应用[J]. 湖南大学学报(自然科学版) 2010(04)
    • [9].入侵检测系统中基于凝聚聚类算法的训练样本集的构造[J]. 计算机工程与科学 2009(06)
    • [10].论训练样本集结构和稀疏表示分类算法的关系[J]. 电子测试 2016(06)
    • [11].一种SVM训练样本集寻优算法[J]. 计算机应用与软件 2010(09)
    • [12].基于数据均值化及LSSVM算法的峰谷电价需求响应模型[J]. 中国电力 2016(09)
    • [13].基于虚拟样本图像集的多流形鉴别学习算法[J]. 计算机应用研究 2018(06)
    • [14].一种新的支持向量分类算法ACNN-SVM[J]. 郑州大学学报(理学版) 2008(03)
    • [15].基于神经网络的系统辨识研究[J]. 信息技术与信息化 2015(08)
    • [16].小波神经网络在电磁无损检测中的应用[J]. 无线电通信技术 2011(05)
    • [17].大数据的分层分类优化识别仿真研究[J]. 计算机仿真 2015(10)
    • [18].不同样本分布的SVDD单目标土地覆盖分类方法研究[J]. 遥感学报 2013(06)
    • [19].基于智能选择多维特征的肺部CT图像检索[J]. 计算机应用 2010(07)
    • [20].基于粒分布的支持向量机加速训练方法[J]. 南京大学学报(自然科学版) 2013(05)
    • [21].基于支持向量机的配电网低电压预警方法[J]. 电器与能效管理技术 2020(06)
    • [22].判别性子图挖掘方法及其在MCI分类中的应用[J]. 南京大学学报(自然科学) 2015(02)
    • [23].基于原型选择的图嵌入方法研究[J]. 电脑知识与技术 2015(02)
    • [24].基于聚类的加速k-近邻分类方法[J]. 计算机应用与软件 2015(10)
    • [25].草面温度在霜预报中的应用[J]. 中国农学通报 2020(15)
    • [26].基于朴素贝叶斯分类器的硬件木马检测方法[J]. 计算机应用研究 2017(10)
    • [27].基于深度学习的人体行为识别[J]. 武汉大学学报(信息科学版) 2016(04)
    • [28].基于类内K-means聚簇的KNN改进算法[J]. 木工机床 2015(04)
    • [29].基于记忆的SVM相关反馈算法[J]. 计算机科学 2011(10)
    • [30].新的贝叶斯网络结构学习方法[J]. 计算机工程与设计 2008(05)

    标签:;  ;  ;  ;  

    迁移学习在量化选股中的应用研究
    下载Doc文档

    猜你喜欢