基于决策树最优组合的企业违约预测模型

基于决策树最优组合的企业违约预测模型

论文摘要

信用风险即违约风险,是指借款人因主观原因不愿或无力履行合同约定,而造成违约,致使银行等金融机构、投资者遭受损失的可能性。企业的违约预测是在目前的时刻推断企业未来时刻的违约概率。根据违约预测结果,公司的利益相关者可以调整投资策略以避免信用风险和信用危机。本研究是基于决策树最优组合的违约预测模型的研究,包括五部分内容:第一章是绪论。第二章是基于决策树最优组合的违约预测模型的基本原理。第三章是基于决策树最优组合的违约预测模型的构建。第四章是以中国上市公司为例的实证研究。第五章是结论。本研究的研究重点包括:一是在典型的随机欠采样方法中,若违约样本和非违约样本的数量比例不同,则模型的预测精度不一样。客观上必然存在一个最优的样本比例,使模型的违约预测精度最高。二是在决策树组合模型中,若决策树模型的个数不同,则预测的精度也不一样。客观上必然存在一个最优的决策树个数,使预测精度最高。三是模型的预测期问题。例如贷款决策发生在过去或现在,企业还款发生在将来,这样看来用当年的数据和当年的企业违约状态进行违约判别就没有意义,模型的违约预测期限太短,作用不大。本研究的特色与创新包括:一是在遍历违约企业与非违约企业两类样本比例的情况下,根据模型的预测精度最高反推最优比例;在多个决策树中,根据模型的预测精度最高反推决策树组合的最优决策树的个数,构建了按违约企业和非违约企业数量最优比例随机欠采样的决策树最优组合违约预测模型。二是在现有研究预测期限为3年的基础上,本研究通过以t-k年的指标数据与第t年的违约状态建模,构建了可以应用第t年的数据、预测第t+k(k=1,2,3,4,5)年企业违约概率的模型,拓展了模型的预测期限。通过与典型预测模型进行对比分析,本研究建立的违约预测模型精度最高,预测期限最长。研究发现,中国上市公司的信用特征为:“交通运输,仓储和邮政业”,“信息传输、软件和信息技术服务业”这两个行业公司的信用资质最好,而“采矿业”和“房地产业”两个行业公司的信用资质最差。北京、上海、深圳等一线城市的公司信用资质最高。舟山、开封、宝鸡等四线城市公司的信用资质最差。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 选题背景及意义
  •     1.1.1 选题背景
  •     1.1.2 选题意义
  •   1.2 研究综述
  •     1.2.1 信用违约判别模型研究现状
  •     1.2.2 非平衡数据处理研究现状
  •     1.2.3 预测期限研究现状
  •   1.3 研究内容及框架
  •     1.3.1 研究内容与方法
  •     1.3.2 研究框架
  • 2 基于决策树最优组合的违约预测模型的基本原理
  •   2.1 科学问题的性质、难点及解决思路
  •     2.1.1 科学问题的性质
  •     2.1.2 问题的难点
  •     2.1.3 解决问题的思路
  •   2.2 决策树模型的基本原理
  •     2.2.1 决策树模型的构造
  •     2.2.2 决策树模型的生成
  •   2.3 决策树组合的构建原理
  •   2.4 随机欠采样方法处理非平衡数据的基本原理
  •   2.5 本章小结
  • 3 基于决策树最优组合的违约预测模型的构建
  •   3.1 组合中单个决策树模型的确定
  •   3.2 建立预测模型的样本比例的选择
  •   3.3 预测精度的检验方法
  •   3.4 本章小结
  • 4 实证分析
  •   4.1 数据来源和样本选取
  •   4.2 指标体系确定
  •   4.3 样本分组及两类客户数量比例的确定
  •   4.4 基于决策树最优组合的预测模型的建立
  •     4.4.1 决策树组合预测模型的构建
  •     4.4.2 最优数量比例的确定
  •     4.4.3 预测期限的确定
  •   4.5 对比分析
  •   4.6 信用特征分析
  •   4.7 本章小结
  • 5 结论
  •   5.1 主要结论
  •   5.2 主要创新与特色
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 陈丽

    导师: 周颖,迟国泰

    关键词: 违约预测,信用风险,决策树最优组合,非平衡数据比例,大数据

    来源: 大连理工大学

    年度: 2019

    分类: 基础科学,经济与管理科学

    专业: 数学,宏观经济管理与可持续发展,金融,证券,投资

    单位: 大连理工大学

    基金: 国家自然科学基金重点项目(71731003),爱德力智能科技(厦门)有限公司智能风险管控模型与算法项目(2019-01)

    分类号: F832.51;F224

    DOI: 10.26991/d.cnki.gdllu.2019.000204

    总页数: 59

    文件大小: 1236K

    下载量: 243

    相关论文文献

    • [1].改进灰色预测模型在热电厂热负荷预测中的应用[J]. 电力学报 2019(06)
    • [2].西安地区卒中患者1年卒中复发预测模型的构建[J]. 中国卒中杂志 2020(01)
    • [3].常用统计预测模型及其在结核病疫情预测中的应用[J]. 热带病与寄生虫学 2020(01)
    • [4].预测模型法在油田二次开发中的应用[J]. 云南化工 2020(04)
    • [5].基于灰色预测模型的舰船动力系统故障检测算法[J]. 舰船科学技术 2020(08)
    • [6].社区老年人居家不出危险因素分析及风险预测模型构建[J]. 护理学报 2020(08)
    • [7].高炉煤气流分布过程的多算法融合预测模型[J]. 控制理论与应用 2020(06)
    • [8].压力性损伤风险预测模型的研究进展[J]. 中华护理杂志 2020(04)
    • [9].无诱因复发性静脉血栓预测模型的研究进展[J]. 同济大学学报(医学版) 2020(03)
    • [10].一种可预测弥漫大B细胞淋巴瘤患者生存的新型6基因预测模型[J]. 中国癌症防治杂志 2020(03)
    • [11].基于序列特征的点击率预测模型[J]. 华东师范大学学报(自然科学版) 2020(04)
    • [12].基于灰色理论的生态经济警度预测模型及其应用[J]. 统计与决策 2020(13)
    • [13].临床预测模型:新预测因子的预测增量值[J]. 中国循证心血管医学杂志 2020(06)
    • [14].基于在校数据挖掘的大学生心理抑郁预测模型以及分析[J]. 中国新通信 2020(17)
    • [15].灰色预测模型在公共卫生事件胜利日预测中的应用——以新型冠状病毒疫情为例[J]. 卫生软科学 2020(11)
    • [16].临床预测模型:模型的建立[J]. 中国循证心血管医学杂志 2019(01)
    • [17].零转弯半径割草机连续翻滚特性参数化预测模型[J]. 农机化研究 2018(01)
    • [18].基于情景数据的火灾预测模型设计与实现[J]. 科技创新与应用 2018(26)
    • [19].灰色预测模型在预测话音网关故障中的研究与应用[J]. 计算机测量与控制 2016(11)
    • [20].应用预测模型对云南省2020年生产总值的预测[J]. 科技创新导报 2016(32)
    • [21].灰色预测模型在山东省保费预测中的应用[J]. 保险职业学院学报 2017(01)
    • [22].基于灰色预测模型的山西省批发零售业人员需求分析[J]. 数学的实践与认识 2017(04)
    • [23].烧结过程SO_2排放预测模型研究[J]. 资源节约与环保 2017(08)
    • [24].混沌时间序列的2阶预测模型[J]. 数学的实践与认识 2016(05)
    • [25].建设项目环境影响评价预测模型发展现状[J]. 绿色科技 2016(08)
    • [26].多项式预测模型在沉降变形监测当中的应用[J]. 矿山测量 2015(02)
    • [27].疾病发病风险预测模型的应用与建立[J]. 中国卫生统计 2015(04)
    • [28].基于大数据背景下出版产业人才需求综合预测分析[J]. 明日风尚 2017(19)
    • [29].一类优化的预测模型[J]. 山西青年 2013(24)
    • [30].一种基于大数据的脱贫预测模型构建研究[J]. 无线互联科技 2019(21)

    标签:;  ;  ;  ;  ;  

    基于决策树最优组合的企业违约预测模型
    下载Doc文档

    猜你喜欢