量化交易中数据分析技术的研究与实现

量化交易中数据分析技术的研究与实现

论文摘要

由于量化投资的兴起,对股票价格时间序列的分析显得日趋重要。金融量化中,通过对相似股票价格时间序列的搜索和金融模型匹配可以有效预测未来股票的发展趋势。为了解决现有搜索和模型匹配算法时间复杂度过高,准确率较低的问题,本文通过一种基于动态规整距离的相似股票识别方法、一种基于关键点提取的混合金融模型匹配算法等研究,提高相似序列搜索和金融模型匹配的效率和准确性,并设计实现了一套面向量化交易的数据分析平台。论文的主要研究内容如下。(1)提出了一种基于动态规整距离的相似股票识别算法。首先,我们的方法基于极值点等降维方法提取序列的趋势特征。其次,我们使用该特征作为条件来搜索具有相同特征的序列以形成候选集。然后,针对候选集中的每个序列,我们过滤出重要点并将其添加到特征点列表中以更好地保持原始序列的形状特征。最后,基于动态时间规整距离得出相似的时间序列。在真实股票数据集上的实验结果表明,该方法可以提高相似股票搜索效率和准确率。(2)提出一种基于关键点提取的混合金融模型匹配算法。首先,我们对股票序列进行降维,并在降维结果的基础上,根据金融模型对价值、时间的要求提取股票价格时间序列中的金融模型关键特征点,以减少股票价格序列中噪声和趋势小幅度波动的影响。然后,我们构建混合金融模型,并基于该模型和金融模型关键特征点对时间序列进行过滤,以便我们可以快速准确地从股价时间序列中定位到满足此金融模型的子序列。在真实价格数据集上的实验表明,与传统方法相比,该方法能够提高匹配的准确性,降低匹配过程花费的时间。(3)设计并实现一套面向量化交易的数据分析平台。系统划分为用户交互模块、计算引擎模块、数据抽取模块和数据清洗模块四个模块,分别负责接受用户请求并执行相关业务逻辑、实现相似股票搜索和金融模型匹配功能、维护数据库数据并提供读写接口和进行数据检查提高其数据可用性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景及意义
  •     1.1.1 金融数据分析及其重要性
  •     1.1.2 金融数据分析的当前问题
  •     1.1.3 研究现状及其不足
  •   1.2 研究内容和目标
  •   1.3 论文组织结构
  • 第二章 相关技术及理论
  •   2.1 概述
  •   2.2 时间序列建模
  •   2.3 时间序列数据预处理
  •   2.4 时间序列数据表示法
  •     2.4.1 时间域连续表示
  •     2.4.2 基于变化的表示
  •     2.4.3 基于离散化的表示
  •   2.5 相似性度量
  •     2.5.1 相似性定义
  •     2.5.2 查询问题分类
  •     2.5.3 欧式距离
  •     2.5.4 动态弯曲距离(DTW)
  •   2.6 时间序列数据索引
  •   2.7 时间序列相似性查询方法
  •   2.8 金融模型
  •     2.8.1 双顶模型
  •     2.8.2 头肩顶模型
  •     2.8.3 双底模型
  •   2.9 本章小结
  • 第三章 基于动态规整距离的相似股票识别模型算法
  •   3.1 概述
  •   3.2 算法流程
  •   3.3 特征提取
  •   3.4 候选集构造
  •   3.5 重要点插入
  •   3.6 基于DTW的相似时间序列查找
  •   3.7 实验评估
  •     3.7.1 环境设置
  •     3.7.2 实验结果
  •   3.8 小结
  • 第四章 基于关键点提取的混合金融模型匹配算法
  •   4.1 概述
  •   4.2 算法流程
  •   4.3 金融特征点提取算法
  •   4.4 混合金融模型匹配算法
  •   4.5 实验
  •   4.6 小结
  • 第五章 面向量化交易的数据分析平台构建
  •   5.1 需求分析
  •     5.1.1 功能需求
  •     5.1.2 性能需求
  •   5.2 面向量化交易的数据分析平台的设计
  •     5.2.1 系统总体架构概述
  •     5.2.2 用户交互模块
  •     5.2.3 数据获取模块
  •     5.2.4 数据清洗模块
  •     5.2.5 计算引擎模块
  •   5.3 实现
  •     5.3.1 用户交互模块模块
  •     5.3.2 数据获取模块
  •     5.3.3 数据清洗模块
  •     5.3.4 计算引擎模块
  •   5.4 测试
  •     5.4.1 测试环境
  •     5.4.2 测试结果
  •     5.4.3 平台效果演示
  •   5.5 小结
  • 第六章 结束语
  •   6.1 总结
  •   6.2 未来工作
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表和录用的论文
  • 文章来源

    类型: 硕士论文

    作者: 原媛

    导师: 杨放春

    关键词: 量化金融,股票价格,时间序列,相似性查找金融模型

    来源: 北京邮电大学

    年度: 2019

    分类: 基础科学,经济与管理科学

    专业: 数学,金融,证券,投资

    单位: 北京邮电大学

    分类号: O211.61;F830.9

    总页数: 94

    文件大小: 8256K

    下载量: 541

    相关论文文献

    • [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
    • [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
    • [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
    • [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
    • [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
    • [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
    • [7].王嵬作品[J]. 当代油画 2017(07)
    • [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
    • [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
    • [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
    • [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
    • [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
    • [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
    • [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
    • [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
    • [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
    • [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
    • [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
    • [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
    • [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
    • [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
    • [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
    • [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
    • [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
    • [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
    • [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
    • [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
    • [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
    • [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
    • [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)

    标签:;  ;  ;  ;  

    量化交易中数据分析技术的研究与实现
    下载Doc文档

    猜你喜欢