整合网络股评舆情的股价涨跌预测建模与评价

整合网络股评舆情的股价涨跌预测建模与评价

论文摘要

当今社会,股票已成为一种重要的金融工具被大众广泛接受,作为经济运行的“晴雨表”,股票投资也成为越来越多人的理财手段,实现股票价格的预测对实现理财目标、稳定经济发展具有重要的影响。过去互联网只是一个简单的信息发布技术平台,随着网络技术的发展,互联网已变为一种重要的社会化媒体,网络信息在不同领域的应用也越来越广泛。很多上市公司开通了官方微博,通过微博来发布消息,并积极与网友互动;而投资者则可以在股票论坛中交流讨论,发布个人观点或对他人的信息进行评论,进而利用这些网络信息制定或调整投资决策。在这样的背景下,将网络信息加入到股票行业的研究中,实现更为精准的股票价格涨跌预测具有重要的学术意义和现实意义。本文研究的主要目标是利用股票交易的基本面数据和股民网络评论实现股票价格涨跌预测,构建具有推广、参考价值的综合预测体系,实现互联网舆情分析和股票金融研究间的相互促进。研究过程中采用了网络爬虫、自然语言处理、机器学习、深度学习、计量经济学等技术,具有很强的学科交叉性。首先,本文通过网络爬虫技术爬取东方财富网股吧论坛中股民对股价波动的预期、评论文本,以及证券机构对股票行业的研究报告,先对这些网络文本进行分词处理,描述统计实现初步的处理和筛选,同时从股票数据库中获取沪深300指数成份股2018年每个交易日的交易数据。其次,运用自然语言处理技术将评论文本进行处理,分析文字背后蕴含的情感态度,获得评论文本情感得分,经过加权、匹配、衰减等处理,将评论情感得分与股票、交易日一一对应。然后在当下运用广泛、效果优异的机器学习算法中选择最新的适合二分类预测的CatBoost算法,以及善于实现时间序列、顺序关联的LSTM算法对整理好的数据建模,分别训练300支股票综合的CatBoost算法、每一只股票的CatBoost算法、每一只股票价格的LSTM算法,从不同的角度研究影响股价涨跌的影响因素及其影响程度,实现初步的股价涨跌预测。最后将三个算法实现的股价涨跌预测结果用计量Logit模型进行整合,充分考虑到三个算法各自对股价涨跌预测的准确率,构建综合股价涨跌预测体系,进一步提升预测精度,并提升该模型的实践推广价值。结果显示:股票网络评论对股价的涨跌具有较明显的影响作用,且该作用具有滞后效应,除此之外,股票的基本信息和交易量数据对股价的涨跌影响也很明显;300支股票综合的CatBoost算法对股价涨跌预测的准确率为54.13%,并且存在“看跌”预测的明显偏斜;对每一只股票分别进行CatBoost算法训练后,股价涨跌预测的平均准确率上升至60.67%,预测的偏斜也有了明显的缓解;对每一支股票的股价搭建LSTM神经网络后,股价涨跌预测的平均准确率进一步上升至64.22%;上述三个算法对股价涨跌预测结果通过Logit模型复合以后,平均准确率达到70.20%,同时对股价下跌情况的预测精度很高,能有效帮助投资者识别风险。本文得出的结论均为沪深300指数成分股上的平均结果,有效排除了因选股不同而导致准确率偏高或偏低的随机性,具有更强的推广价值。综上,本文利用丰富的网络评论文本和股票交易数据,进行新兴机器学习算法训练,设计股价涨跌综合模型,不仅证明网络股评对股价涨跌具有显著影响,还在沪深300成分股股价涨跌预测上获得了较好的效果,在学界和实践领域都具有一定的推广价值。

论文目录

  • 摘要
  • ABSTRACT
  • 1 引言
  •   1.1 研究背景与意义
  •     1.1.1 研究背景
  •     1.1.2 研究意义
  •   1.2 文献综述
  •     1.2.1 网络舆情相关研究
  •     1.2.2 股票价格预测
  •     1.2.3 基于网络舆情的股票价格预测
  •     1.2.4 文献述评
  •   1.3 研究内容和方法
  •     1.3.1 研究内容
  •     1.3.2 研究方法
  •   1.4 研究创新和不足
  •     1.4.1 研究创新
  •     1.4.2 不足与展望
  • 2 研究方法理论基础
  •   2.1 网络爬虫设计
  •   2.2 自然语言情感分析
  •     2.2.1 股评文本分词
  •     2.2.2 文本特征提取
  •     2.2.3 文本情感分析
  •     2.2.4 网络股评舆情对股票价格的影响机制
  •   2.3 CatBoost机器学习算法
  •   2.4 长短期循环神经网络
  •   2.5 定性响应回归Logit模型
  • 3 整合网络舆情的股价涨跌预测模型构建和评价
  •   3.1 数据采集
  •     3.1.1 数据源及样本选取
  •     3.1.2 股评文本爬取
  •     3.1.3 行业研报爬取
  •     3.1.4 交易数据采集
  •   3.2 数据预处理
  •     3.2.1 区分主客观文本
  •     3.2.2 计算主观文本情感得分
  •     3.2.3 数据整合
  •   3.3 模型构建
  •     3.3.1 CatBoost算法训练
  •     3.3.2 LSTM算法训练
  •     3.3.3 综合预测体系构建
  • 4 结论和建议
  •   4.1 研究结论
  •   4.2 研究展望
  • 参考文献
  • 后记
  • 文章来源

    类型: 硕士论文

    作者: 牛雪琪

    导师: 马晓君

    关键词: 网络股评舆情,股价涨跌预测,文本情感分析,机器学习算法,回归模型

    来源: 东北财经大学

    年度: 2019

    分类: 基础科学,经济与管理科学

    专业: 数学,宏观经济管理与可持续发展,金融,证券,投资

    单位: 东北财经大学

    分类号: F832.51;F224

    DOI: 10.27006/d.cnki.gdbcu.2019.000847

    总页数: 56

    文件大小: 3224K

    下载量: 64

    相关论文文献

    • [1].公司高管减持同伴效应与股价崩盘风险研究[J]. 经济研究 2019(11)
    • [2].影子银行业务会增加股价崩盘风险吗[J]. 财贸研究 2019(11)
    • [3].信息不对称下的股价崩盘风险综述[J]. 纳税 2020(03)
    • [4].产权性质、分析师预测与股价崩盘风险[J]. 商讯 2020(02)
    • [5].信任氛围对公司股价崩盘风险的影响:基于内部控制的调节作用[J]. 系统工程 2020(01)
    • [6].私募股权投资、制度环境与股价崩盘风险[J]. 管理评论 2020(02)
    • [7].机构投资者网络与股价同步性[J]. 现代财经(天津财经大学学报) 2020(03)
    • [8].塔牌集团:减持猛如虎 股价久承压[J]. 股市动态分析 2020(03)
    • [9].媒体关注、信息不透明与股价崩盘风险[J]. 时代金融 2020(09)
    • [10].并购商誉减值对股价崩盘风险的影响研究[J]. 中国注册会计师 2020(03)
    • [11].商业银行发行理财产品与股价崩盘风险[J]. 经济管理 2020(03)
    • [12].地方官员更替、制度环境与股价崩盘风险[J]. 投资研究 2020(01)
    • [13].企业绩效、盈余管理和股价崩盘风险[J]. 长春理工大学学报(社会科学版) 2020(02)
    • [14].股价崩盘风险国内外研究综述[J]. 中国物价 2020(05)
    • [15].高管舆情危机是否扩大了股价崩盘风险[J]. 金融经济学研究 2019(06)
    • [16].投资者情绪与股价崩盘风险[J]. 合作经济与科技 2020(09)
    • [17].上市公司定向增发对股价的影响管窥[J]. 城市建设理论研究(电子版) 2020(09)
    • [18].股权质押与股价崩盘风险[J]. 浙江金融 2020(04)
    • [19].年报预约披露推迟、机构投资者持股与股价崩盘风险[J]. 福州大学学报(哲学社会科学版) 2020(03)
    • [20].股价崩盘风险研究述评与未来展望[J]. 西安财经大学学报 2020(04)
    • [21].险资介入、投资者情绪与股价崩盘风险[J]. 金融论坛 2020(06)
    • [22].并购商誉减值、内部控制与股价崩盘风险关系研究[J]. 广东石油化工学院学报 2020(03)
    • [23].揭秘庄家边拉边减 卖比买多股价大涨现象[J]. 股市动态分析 2020(20)
    • [24].美团股价年内已翻倍,王兴身家飙至500亿[J]. 福建轻纺 2019(10)
    • [25].股价崩盘风险与分析师关注:“趋之若鹜”还是“退避三舍”[J]. 上海财经大学学报 2019(05)
    • [26].分析师关注与股价同步性——一个文献综述[J]. 现代管理科学 2019(11)
    • [27].股权质押、大股东掏空与股价同步性[J]. 兰州财经大学学报 2019(05)
    • [28].盘中股价升跌引起持股者情绪变化[J]. 股市动态分析 2019(42)
    • [29].股价崩盘风险文献综述[J]. 现代商贸工业 2019(36)
    • [30].业绩预告、大股东减持与股价崩盘风险研究[J]. 经济理论与经济管理 2019(11)

    标签:;  ;  ;  ;  ;  

    整合网络股评舆情的股价涨跌预测建模与评价
    下载Doc文档

    猜你喜欢