随机森林方法在个人信用风险分析中的应用

随机森林方法在个人信用风险分析中的应用

论文摘要

随着金融服务业的不断改革,消费观念的转变以及互联网金融的兴起,个人信贷业务发展迅速,其规模也在持续扩大,但是信贷风险也随之而增长。因此,加强对个人信用风险管理,找出科学合理的评估方法,对于推动个人信贷市场的良好稳步发展显得尤为重要。本文利用来自互联网信贷平台的个人贷款数据进行实证研究。首先,基于个人贷款数据不平衡的特点对数据采用不同方式进行处理,通过以随机森林为主的机器学习方法构建了个人信用贷款模型,并与决策树模型,Logistic模型进行对比,预测客户是否有违约倾向。论文所做工作如下:首先介绍了个人信贷风险评估领域目前主要采用的机器学习方法理论以及对分类器的评价标准;其次对原始数据预处理,包括对缺失值的插补,异常值的处理等,之后对于贷款数据自身违约与未违约样本严重不平衡的特点,分别利用SMOTE过采样以及随机欠采样的方法,改进样本不平衡的问题;并与不同机器学习算法相结合建立不同模型,对各个模型的AUC值进行比较。结果表明通过SMOTE算法处理信贷数据不平衡并与随机森林相结合的模型性能最佳,并利用两组数据集来验证,两组数据不平衡程度不同,指标数量不同,也较好说明了随机森林模型在个人信用风险评估中的实用性和准确性,以及SMOTE算法在处理不平衡样本时的有效性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 研究背景
  •   1.2 信用评估方法的国内外研究现状
  •     1.2.1 国外研究现状
  •     1.2.2 国内研究现状
  •     1.2.3 研究评述
  •   1.3 本文研究目的、研究内容及框架
  •     1.3.1 研究目的和内容
  •     1.3.2 研究思路及框架
  • 第2章 研究方法理论介绍
  •   2.1 决策树
  •     2.1.1 决策树简介
  •     2.1.2 决策树的分裂算法
  •   2.2 随机森林
  •     2.2.1 随机森林简介
  •     2.2.2 随机森林算法
  •   2.3 Logistic模型
  •   2.4 性能评价指标
  • 第3章 个人信贷风险模型实证分析
  •   3.1 数据来源及说明
  •   3.2 数据预处理
  •     3.2.1 缺失值处理
  •     3.2.2 异常值处理
  •     3.2.3 样本不平衡处理
  •   3.3 模型实证与比较
  •     3.3.1 数据集A随机森林模型训练
  •     3.3.2 数据集A随机森林模型评估
  •     3.3.3 数据集A不同模型对比
  •   3.4 数据集B模型比较
  •     3.4.1 数据集B随机森林模型构建
  •   3.5 两组数据集模型比较结论
  • 第4章 结论与展望
  •   4.1 研究结论
  •   4.2 研究展望
  • 参考文献
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 李宵宵

    导师: 张理

    关键词: 随机森林模型,算法,个人信用风险

    来源: 云南大学

    年度: 2019

    分类: 基础科学,经济与管理科学

    专业: 数学,宏观经济管理与可持续发展,贸易经济,金融

    单位: 云南大学

    分类号: F832.4;F224;F724.6

    总页数: 55

    文件大小: 3329K

    下载量: 441

    相关论文文献

    • [1].基于迭代随机森林算法的糖尿病预测[J]. 长春工业大学学报 2019(06)
    • [2].基于改进随机森林的城市河流水生态健康评价研究[J]. 海河水利 2019(06)
    • [3].基于随机森林癫痫患者脑电数据的分析研究[J]. 中国数字医学 2020(01)
    • [4].基于局部均值分解和迭代随机森林的脑电分类[J]. 吉林大学学报(信息科学版) 2020(01)
    • [5].网贷平台数据的随机森林预测模型实证分析[J]. 宜宾学院学报 2019(12)
    • [6].采用单类随机森林的异常检测方法及应用[J]. 西安交通大学学报 2020(02)
    • [7].随机森林数据情感挖掘方法分析[J]. 通讯世界 2020(01)
    • [8].运用最大熵模型和随机森林模型对东北红松分布的模拟[J]. 东北林业大学学报 2020(03)
    • [9].基于随机森林算法的城区土地覆盖分类研究[J]. 河北省科学院学报 2020(01)
    • [10].运用随机森林模型对北京市林分蓄积生长量的预测[J]. 东北林业大学学报 2020(05)
    • [11].融合人工鱼群和随机森林算法的膝关节接触力预测[J]. 中国医学物理学杂志 2020(04)
    • [12].结合特征选择和优化随机森林的无线网络数据丢失重建[J]. 上海电力大学学报 2020(03)
    • [13].基于随机森林算法的耕地质量定级指标体系研究[J]. 华南农业大学学报 2020(04)
    • [14].一种基于随机森林的组合分类算法设计与应用[J]. 电子设计工程 2020(16)
    • [15].基于随机森林算法的日光温室内气温预测模型研究[J]. 中国农学通报 2020(25)
    • [16].基于因子分析和迭代随机森林方法的学生成绩综合评价——以都匀市某高中为例[J]. 黔南民族师范学院学报 2020(04)
    • [17].基于随机森林模拟的辽宁省降水量空间分布研究[J]. 陕西水利 2020(09)
    • [18].随机森林模型在膝关节炎患者结构特征与症状定量分析中的应用(英文)[J]. 磁共振成像 2020(10)
    • [19].基于特征选择的极限随机森林算法研究[J]. 计算机应用研究 2020(09)
    • [20].随机森林回归分析方法在代谢组学批次效应移除中的应用[J]. 中国卫生统计 2020(05)
    • [21].一种面向非均衡分类的随机森林算法[J]. 计算机与现代化 2018(12)
    • [22].随机森林模型和决策树模型在肝硬化上消化道出血预后中的应用[J]. 中国卫生统计 2019(02)
    • [23].基于随机森林的债券违约分析[J]. 当代经济 2018(03)
    • [24].基于改进网格搜索算法的随机森林参数优化[J]. 计算机工程与应用 2018(10)
    • [25].随机森林在城市不透水面提取中的应用研究[J]. 云南师范大学学报(自然科学版) 2017(03)
    • [26].一种顺序响应的随机森林:变量预测和选择[J]. 小型微型计算机系统 2017(08)
    • [27].基于随机森林回归的军械器材需求预测[J]. 自动化应用 2017(09)
    • [28].流式大数据下随机森林方法及应用[J]. 西北工业大学学报 2015(06)
    • [29].面向高维数据的随机森林算法优化探讨[J]. 商 2016(04)
    • [30].深度随机森林在离网预测中的应用[J]. 计算机科学 2016(06)

    标签:;  ;  ;  

    随机森林方法在个人信用风险分析中的应用
    下载Doc文档

    猜你喜欢