胡忠义:基于多分类器动态集成的P2P违约风险评估论文

胡忠义:基于多分类器动态集成的P2P违约风险评估论文

摘要: 针对P2P违约风险评估问题,构建基于K均值聚类的多分类器动态集成模型。通过K均值聚类将P2P借贷样本集划分为多个区域,并在每个区域分别构建多个基分类器模型,进行多分类器集成;在给定新的测试样本时,基于样本特征动态选择样本归属区域的基分类器,进行模型集成与违约风险评估。以Lending Club借款数据为例,对网贷违约风险评估进行实证分析表明,基于多分类器动态集成的P2P违约评估模型,比单一模型和静态集成模型的准确性更好,且基于神经网络的动态集成模型效果最好。

关键词: P2P网络借贷; 多分类器集成; 动态选择; K均值聚类

随着互联网的快速发展,P2P网络借贷(peer-to-peer online lending)迅速兴起。在这一模式下,电子商务技术、互联网技术、金融服务模式和民间借贷等实现了有效融合,通过网络可直接促成借贷行为的实现。和传统金融模式相比,P2P借贷收益高、速度快、方便灵活、交易对象范围广,不仅能为中小型投资者提供高收益的便捷投资机会,同时还能改善我国小微企业融资难的困境。

P2P网贷行业在飞速发展中遇到了信用风险、技术风险、合规风险等一系列风险防范的挑战。其中,借款人的信用风险是P2P平台面临的最突出的风险与挑战之一[1,2]。一方面,P2P网贷因网络环境的特殊性导致信息不对称现象严重,虚假信息难以甄别[3];另一方面,随着P2P网贷行业的快速发展和信息技术的提高,网贷平台每天产生大量繁杂的网贷交易数据、借贷信息与用户信息[4],这些海量数据在为综合评估P2P用户信用与违约风险提供便捷性的同时,也增加了高效评估P2P借贷违约风险的难度。由此,利用P2P网贷中的繁杂数据构建更为有效的P2P用户违约风险评估模型,有效识别网贷用户的违约风险,对P2P平台保护投资者利益、控制运营风险及保障平台健康发展有重要的现实意义。

本研究针对P2P个人违约风险评估问题,构建了基于K均值聚类的多分类器动态集成模型。该模型首先依据样本相似性将样本数据划分为多个区域样本子集,然后在各区域样本上构建基于多种基分类器的集成模型;在给定新的测试样本时,基于样本特征,动态地选择区域子集训练的多分类器,并进行集成预测,以提高P2P违约风险评估模型的准确性,为P2P借贷平台准确识别个人借贷风险、保护投资者和平台利益提供一种新的思路和方法。

1 文献回顾

为了有效识别P2P网贷中借款用户的违约风险,国内外学者主要从影响因素和评估模型两个方面对P2P个人违约风险评估问题进行研究。

在影响因素方面,相关学者采用统计方法,量化地研究了借款人的身份信息、社交信息、标的信息等因素对借款人贷款违约的影响。如,JEFFERSON等[5]基于Prosper网站用户的照片信息,研究用户的外貌与违约的关系。LIN等[6]通过分析社交网络,得出借款人朋友的身份是否认证以及是否参与平台借款对于借款人是否违约有显著影响。利用Logistic 回归模型,李杰等[7]认为,借款人的还款能力、还款意愿和线上浏览行为,在一定程度上可以反映借款人是否有违约的风险。另外,借款金额、借款期限、借款利率、借款人的收入、学历和信用评级等,对违约行为也有显著影响[3,8,9]。

在本研究所考虑的P2P个人违约风险评估中,模型的输出结果为违约或按时还款两种类别,分别记为1和0,用变量c表示。假定基于各基分类器训练的模型表示为{hm},m∈{1,2,…,5},模型hm在样本上的评估结果为hm(x)∈{0,1}。为了将这些基分类器模型集成为最终的集成模型,本研究分别采用投票法和学习法两类方式实现。

上述文献回顾表明,P2P个人违约风险评估受许多因素的影响,基于机器学习技术可以构建有效的违约风险评估模型,且集成模型往往比单一模型更有效。然而,现有基于集成模型的P2P违约风险评估研究中,对所有样本均使用同一个集成模型进行风险评估,属于静态集成模型;没有考虑P2P网络借贷中借贷数据多、样本特征繁杂的情况,限制了集成模型的性能。依据样本特征构建不同的基分类器,并在此基础上实现动态的集成模型(dynamic ensemble model,DEM)[22],可以有效弥补传统静态集成模型的缺陷。基于此,本研究提出基于多分类器动态集成的P2P个人违约风险评估模型,将P2P平台借贷样本数据依据样本特征划分成不同的区域,并在每个区域分别构建集成模型;在对样本进行风险评估时,可以动态选择与待测样本最相似区域的集成模型,从而提高P2P个人违约风险评估的准确性。

2 多分类器动态集成模型构建

为了对P2P个人违约风险进行有效评估,本研究提出基于多分类器动态集成的违约风险评估模型(见图1)。由图1可知,构建的多分类器动态集成模型包括两个重要阶段:多分类器动态选择和多分类器集成。

图1 基于多分类器动态集成的P2P违约风险评估模型

2.1 多分类器动态选择

多分类器动态选择是利用新样本自身特征,动态地选择一个或者一组最适合该样本特征、分类效果最好的分类器,因此具有较高的准确率和稳定性,在多分类器系统研究领域已经引起了学者们的广泛关注,并且被认为是最有前途的方法之一[22]。

在评价指标分析和归一化的基础上,利用GIS计算出每一个单元格的7项评价指标归一化值,然后在ArcGIS平台中将各指标归一化数值按照权重分配结果进行信息叠加计算,公式如下:

为了实现多分类器的动态选择,本研究首先采用高效的K均值聚类技术,将样本集合划分为多个区域。给定P2P借贷样本集D={xi},i∈{1,2,…,N},K均值聚类将该样本集划分为K个样本区域C∈{Ck},k∈{1,2,…,K},其中Ck表示第k个样本子集。每个区域的中心(即聚类中心)由区域内所有样本的各变量的均值表示为其中|Ck|表示聚类区域Ck中的样本个数。K均值聚类的具体步骤如下:①初始化聚类中心,从借贷样本集D中任意选择K个借贷样本作为初始聚类中心,即{μk},k∈{1,2,…,K};②更新聚类区域的样本,计算各样本xi与各聚类中心μk的欧氏距离dik=‖xi-μk‖2,依据距离最近的聚类中心确定xi所属的聚类区域标记将样本xi划入到相应的聚类区域,Cλi=Cλi∪{xi};③更新聚类中心,针对每个区域,采用区域内所有样本变量的均值更新聚类中心,即④重复步骤②③,直至每个聚类中心不再发生变化,算法结束。

基于K均值聚类,可以将借贷样本划分成K个区域,每个区域内的样本具有较大的相似性,而区域间的样本相似性较弱。在后续的集成阶段,针对不同区域分别构建该区域违约风险评估的基分类器与集成模型。由此,在给定新的样本数据时,可以依据样本特征的相似性,动态选择样本的归属区域,并采用该区域内的基分类器和集成模型进行预测。

2.2 多分类器集成

2.2.1基分类器模型构建

针对前面划分的多个样本区域,分别在每个区域构建多个基分类器,并遵循一定规则,将各自的基分类器集成为最终的违约风险评估模型。图1中的“集成”部分展示了多分类器集成的框架,主要分为基分类器模型构建与基分类器模型集成两个阶段。

2.2.2基分类器模型集成

本项目属于跨学科项目,涉及网络营销、艺术设计、建筑以及装修方面的知识,借助工院这个大平台,项目组成员整合了包括旅游管理系、建筑工程系、艺术系的学生,并且团队成员也有在外从事建筑装饰的工作经验,从学科知识和技术经验上,都有较好的基础条件。

基于以上基分类器,通过调整模型结构和参数,在采用K均值聚类划分得到的各区域借贷样本集上,分别训练得到各自区域的违约风险基分类器模型。

3)基于人工智能、车联网等技术的应用普及,通过人脸识别、语音识别等技术,未来出行者方式更加多样,交通管理者执法方式也多样化,进而全方位地提高交通管理的效率.

为了构建基分类器模型,本研究选择常用的决策树算法(decision tree,DT)、人工神经网络算法(artificial neural network,ANN)、最邻近分类算法(K-nearest neighbor,KNN)、支持向量机(support vector machine, SVM)、逻辑回归(logistic regression,LR)作为基分类器。考虑到DT、ANN、KNN、SVM和LR是数据挖掘与机器学习领域中常用的建模技术,且本研究的重点是构建多分类器动态集成模型,因此,本研究不对这些基分类器的算法做深入介绍,感兴趣的读者可以参考相关资料[23]。

为有效控制漳州核电工程前期费用、提高资金使用率、降低项目建设成本,根据项目前期工作实际进展及FCD 前工作计划,前期投资以不超过投资估算总资金的10%为原则进行控制,综合研判FCD前工作量,签订可量化的FCD前工作协议,通过工程量核算方式减少前期费用投入约3亿元。其次建立支付、变更管理台账,对项目管理费、设计费、设备费、建安费进行从严从紧控制并与兄弟核电厂对标参考,优化完善FCD前支付控制曲线。

另一方面,随着P2P借贷平台海量数据的产生及机器学习技术的快速发展,基于先进的机器学习构建有效的P2P违约风险评估模型的研究得到较广泛关注。国内外学者先后构建了基于Logistic回归、神经网络、贝叶斯网络、支持向量机等机器学习技术的P2P违约风险评估模型。肖会敏等[10]基于P2P 网络借贷中借款人的信用评估指标体系,构建了BP 神经网络模型,提高了评估的准确性和可靠性。裴平等[11]发现,基于贪婪搜索法的贝叶斯网络模型,能够较为准确地进行信用评价。阮素梅等[12]则运用决策树和支持向量机,构建了违约风险评估模型。但这些基于单一算法构建的违约风险评估模型,泛化能力和稳定性较差[13]。通过融合若干个基分类器构建集成学习模型(ensemble model,EM),可以有效提升模型的准确率和稳定性[14, 15],因此有不少学者提出了基于集成学习的违约风险评估模型。XIA等[16]基于Bagging和Stacking提出了异构集成评估模型,研究表明,所提模型的效果显著优于单个模型和同质集成模型。HE等[17]扩展了BalanceCascade方法,研究表明,该方法有效提升了基分类器的综合表现。操玮等[18]则根据中国网贷数据的实际情况,对比分析了几种常见的集成方法, 探究适合中国P2P个人信用风险预警的方法。MA等[19]利用用户的电话使用数据(包括通信信息、位置信息和APP信息),基于Adaboost算法构建了P2P违约预测模型。作为常用的集成学习模型,随机森林的识别效果也显著优于单分类器模型[4,20,21]。由于能够使用一系列基分类器进行二次学习,集成模型在以上研究中均得到了比单一模型更好的效果。

投票法采用相对多数投票的方式集成各基分类器模型,即

其中,count(·)表示对c类别进行计数。该式表明,基分类器结果中票数最多的类别即为样本x基于集成模型的违约风险评估结果。

实施“四化”建设标准化采购是油田改造和优化传统物资采购供应模式的一次重大变革,也是油田在开创高质量发展中,点石成金的“必备武器”和“胜利攻略”。

2013年,白鑫用阿语出版了《中国道路:奇迹和秘诀》一书,向阿拉伯世界介绍中国的发展成就,为阿拉伯读者提供一个了解中国的渠道与视角。2015年9月,阿拉伯国家出版商协会驻中国办事处正式落地银川,授权智慧宫对接阿拉伯图书版权和翻译业务。

“民以食为天,食以安为先”。对于食品企业来说,只有切实保证了源头的安全,才能全力保障肉品的质量。目前汪记生产的“鑫汪记”品牌肉在涿州市场已经占据了主导地位,同时覆盖了保定、张家口、石家庄、唐山等省内周边县市区,并且远销至内蒙古、辽宁、山西、浙江等地。

3 实证分析

3.1 数据收集和处理

本研究选取Lending Club公开的P2P个人借款数据为研究对象。Lending Club是全球最大的 P2P 网络借贷公司,自2007年创立以来,标准贷款项目放款量的增长趋势迅猛。截至2016年底,该平台已发放了近250亿美元的贷款,拥有超过180万的借款人。该平台公布了大量脱敏的个人借款数据,在已有P2P违约风险研究中引起广泛关注。

表1P2P违约风险评估指标

类型变量含义基本信息V1收入来源是否有认证(0:未认证;1:认证)V2借款人每月需要偿还的借款V3剩余未偿还本金总额V4工作年限(0:工作时间1年以下;10:工作时间10年及以上;1~10:工作时间1~10年)借款情况V5借款数量 V6借款利率V7最初的借款要求(0:允许只借部分;1:借款金额必须要满足) V8借款期限(36:借款期限是36个月;60:借款期限是60个月) V9借款人目前的信用额度总数 V10借款人开设的信用卡账户个数信用记录V11过去两年借款人信用档案逾期30天以上的次数V12个人信用等级(1~7分别代表等级G~A,数字越大,等级越高)V13不良公共记录的次数V14过去6个月的信用查询次数(不包括汽车及按揭查询)个人资产V15房屋所有权(0:房屋是租的;1:房屋在按揭中;2:房屋是自有;3:其他情况) V16借款人的年收入其他借款比率/费用V17循环借款使用率或借款人的信用额度 V18借款人的年收入V19总信贷循环余额V20收到的借款总额V21到期收到的本金V22到期收到的利息V23到目前为止收到的滞纳金V24收取的平台费用V25注销的总费用V26最后收到的还款总额类别标签L0:全部偿还; 1:违约拖欠

首先,从该平台收集了2007~2015年的个人借款记录,并对数据做初步清洗,删除缺失值过多的样本与指标变量,对离散型指标进行重新编码。然后,通过参考以往文献中指标的选取[3,20,24],并结合数据集中可获取的指标,构建了包括借款人基本信息、借款情况、信用记录、个人资产和其他借款比率/费用5个维度的指标体系,包括借款数量、借款利率、年收入、信用等级等26个违约风险评估指标(见表1)。为便于高效地验证评估模型,从数十万条个人借款数据中,随机选取了无违约记录和有违约记录的样本数据各5 000条,共计10 000条P2P借款数据。此外,为了进一步筛选有效的指标变量,降低变量维度,进而提高模型效率与准确性,本研究还采用经典的后向特征选择算法进行特征筛选。最终,剔除掉了V1、V4、V11、V134个评估指标,仅保留剩余的22个评估指标,用于构建P2P违约风险评估模型。

但是,如果孕妇摄入的能量太多,远远超过了能量所需,就会导致体重增长太多、太快,对母体和胎儿有害,一般可根据体重的增长来调整能量摄入和身体活动水平。尤其是高龄孕妇发生剖宫产、妊娠期糖尿病和妊娠期高血压的可能性较高,更应避免能量摄入过多而导致体重增长太快。

3.2 模型评价准则

判断借款人将来是否会违约是典型的二分类问题。在现实生活中,按时还款的比例远多于违约的比例,违约更容易出现错分;另外,违约的错分代价更大, 因此违约的识别率更重要。本研究基于二分类问题的混淆矩阵(见表2),采用4种评价指标评价构建模型的违约风险评估性能。表2中, 违约借款样本数目为P,按时还款样本数目为N,FP表示将按时还款样本错分成违约借款的数目,FN表示将违约借款样本错分成按时还款的数目,TP和TN分别表示违约借款和按时还款样本被正确分类的数目。

表2 二分类的混淆矩阵

类别判断会按时还款判断会违约借款实际按时还款TNFP实际违约借款FN TP

据此得到4类性能评价指标,分别如以下公式所示:算法的准确率为

Accuracy=(TP+TN)/(TP+TN+FP+FN);

(1)

违约借款样本的查全率(召回率)为

基于前述制剂生产特点,如没有信息系统的帮助,单靠一两个统计和财务人员手工操作,制剂成本核算盲目追求理论上的按品种的产品成本等完全成本核算方式,不但核算工作量太大,而且容易产生偏差误导决策。随着信息技术的不断发展,信息系统在医院财务管理中的应用越来越广泛,医院制剂的生产和核算信息化必将成为改善制剂管理的有力手段。一方面,制剂部门配备专门的制剂库存管理软件,实现对制剂物资的高效管理;另一方面,系统软件逐一计算每种药品的材料及费用,从而实现单个制剂成品的成本核算。

Recall=TP/(TP+FN) ;

(2)

违约借款样本的查准率为

Precision=TP/(TP+FP) ;

(3)

违约借款样本的查全率与查准率的调和平均值(F值)为

F-measure=

(2·Recall·Precision)/(Recall+Precision) 。

(4)

由式(4)可知,性能指标F-measure既考虑违约借款样本的查全率,又考虑其查准率, 只有在查全率和查准率的值都比较大的前提下,F-measure值才会大,因此能综合地体现出评估模型对按时还款和违约借款的分类效果,而且侧重于体现违约借款样本的分类效果。不同于准确率和F值对分类模型的性能进行综合评价,查准率与查全率从正类(违约类)的角度评价一个模型的性能。其中,查准率(又名精确率)表示被正确识别出来的违约类占所有被识别为违约类的比例,而查全率(又名召回率)表示违约类被正确识别出来的比例。

不同于投票法直接采用计数的方式投票产生集成模型的最终评估结果,学习法基于基分类器模型的评估结果和样本的原始类别标签,构造新的数据集。该数据集中,基分类器模型的预测结果作为变量,样本的原始类别标签作为新数据集的类别标签。以该新数据集为样本数据,重新训练一个次学习器模型,用以预测最终结果。为了实现对基分类器进行非线性集成,本研究分别采用SVM和ANN进行集成模型的训练,以构建不同类型的动态集成模型。基本流程如下:①给定某聚类区域的样本数据,采用DT、ANN、KNN、SVM、LR这5个基分类器训练,得到5个基分类器模型{hm},m∈{1,2,…,5}。②把5个基分类器模型对样本的违约风险预测和样本的真实违约情况作为次级训练集,记为D′={(h1(xi),h2(xi),h3(xi),h4(xi),h5(xi),ci)},i∈{1,2,…,N},其中,ci表示第i个样本的类别标签。基于该数据集,采用次级分类器(如支持向量机、神经网络等)训练次级分类器模型,用以集成基分类器模型的预测结果。③以次级分类器模型预测的违约风险结果作为动态集成模型的结果。

4 结果分析

为了有效检验本研究构建的基于K均值聚类的多分类器动态集成模型在P2P违约借款识别中的有效性,采用10折交叉验证的方法进行训练和测试,每组实验均独立重复40次,最后计算40次实验结果的平均值。数据处理、模型训练及结果分析等所有实验均在R语言环境下进行。实验结果与分析如下。

4.1 基于K均值的聚类

在本研究构建的基于K均值聚类的多分类器动态集成中,首先采用K均值聚类对样本进行区域划分,将具有相似特征的样本归为一类。在进行K均值聚类时,数据的取值范围和K的取值对聚类结果有较大影响,因此,为了找到最佳K值,本研究首先对数据进行了z-score标准化处理,然后基于轮廓系数(衡量一个对象与集群的相似程度,轮廓系数的取值范围为-1~1,值越高表明聚类效果越好[25])筛选最优的K值。设定K的范围为2~10,在每个K值上重复进行50次K均值聚类,以避免局部最优,并计算该K的平均轮廓系数,结果表明K取2时轮廓系数最大,聚类效果最佳,因此本实验将样本分为两个区域。进一步计算两个聚类中心的欧氏距离,并由此计算出区域相似度为0.21,远小于1,再次表明这两个区域存在较大差异,有必要进行聚类。各区域违约记录与按时还款记录的样本数见表3。由表3可知,采用K均值聚类划分得到的两个区域,违约记录与按时还款记录的数量是近乎均衡的。

表3 各区域样本分布

类别区域1区域2按时还款3 3951 605违约借款3 4011 599共计6 7963 204

4.2 多分类器的动态集成与实验对比

采用DT、ANN、KNN、SVM和LR作为基分类器,分别在区域1和区域2构建分类模型,并分别使用投票法和学习法对基分类器进行动态集成。其中,使用学习法时,分别将SVM和ANN作为次分类器,对基分类器的结果进行集成。根据测试样本与区域1、区域2聚类中心欧氏距离的远近,动态地确定测试样本所属区域和基分类器模型,并分别进行多数投票动态集成模型(DEM-Voting)、支持向量机动态集成模型(DEM-SVM)、神经网络动态集成模型(DEM-ANN)。其中,采用支持向量机动态集成时,对几个常用核函数进行了反复试验,最终确定分别采用线性核函数和高斯核函数,构建线性支持向量机动态集成模型(DEM-lSVM)和非线性支持向量机动态集成模型(DEM-nSVM)。

我能学有所成登上教书育人的讲台,是凭共产党、毛主席才翻身得解放,走到了这一步,也是我的老师们在我身上倾注血汗的结果。我教学后不久,父亲就提醒我去看望了我的小学启蒙老师李文治和初中班主任李连旭,去感谢他们对我的教育教诲。

另外,为了验证本研究提出的动态集成模型的有效性,将该模型与单一模型、静态集成模型进行了对比。对比模型简要介绍如下:①单一模型是只用一个分类器对所有待测样本进行预测,本次对比实验中选择了本研究使用的基分类器,即DT、ANN、KNN、SVM和LR作为单一模型;②不同于本研究提出的基于聚类的动态集成模型,静态集成模型不考虑样本的特征,而是对所有样本构建相同的基分类器模型和集成模型,本研究选择了几种常见的静态集成模型,包括Bagging、Adaboost、随机森林(random forest,RF)、多数投票法静态集成模型(EM-Voting)、线性支持向量机静态集成模型(EM-lSVM)、非线性支持向量机静态集成模型(EM-nSVM)和神经网络静态集成模型(EM-ANN)。其中,Bagging是采用随机有放回的抽样方法选择训练数据,获得N个训练集,然后对每个子集采用决策树算法,构造分类器,最终结果为N个分类器结果的多数投票;Adaboost与Bagging类似,但是抽样和投票的方式与Bagging有所不同,即在这两个过程中考虑了各样本和各分类器的权重;RF是Bagging的扩展,将Bagging和随机特征选择结合起来,引入了随机属性选择;多数投票法采用本研究使用的5个基分类器训练模型,并投票产生最后的预测结果;与动态集成类似,支持向量机静态集成和神经网络静态集成对5个基分类器的结果进行再次学习,获得最后的预测结果。为了保证实验结果的公平性和可比较性,在进行集成的时候,参数的选择和本研究构建的动态集成的参数保持一致。各模型的实验结果见表4。

表4 各模型结果对比

模型类型算法准确率查准率查全率F值单一模型DT0.810 0.915 0.684 0.782 KNN0.770 0.787 0.739 0.762ANN0.849 0.906 0.769 0.838 SVM0.818 0.8550.767 0.808LR0.849 0.991 0.704 0.823 静态集成Bagging0.835 0.955 0.704 0.810 Adaboost0.850 0.913 0.773 0.837 RF0.852 0.927 0.765 0.838 EM-Voting0.865 0.994 0.735 0.845 EM-nSVM0.807 0.795 0.827 0.811 EM-lSVM0.818 0.854 0.767 0.808 EM-ANN0.807 0.795 0.826 0.810 动态集成DEM-Voting0.870 0.972 0.761 0.854 DEM-nSVM0.862 0.944 0.769 0.848 DEM-lSVM0.858 0.930 0.774 0.845 DEM-ANN0.868 0.949 0.779 0.856

从表4可以看出:①5个单一模型中,分类效果最好的是ANN,准确率为0.849,F值为0.838,而KNN效果最差,其准确率仅为0.770,F值为0.762。②静态集成模型中,表现最好的模型是EM-Voting,其准确率为0.865,F值为0.845;RF和Adaboost的整体表现也不错,其F值分别为0.838和0.837,比EM-Voting略低;其余4个静态集成模型的F值相差不是很大,都在0.810左右;EM-lSVM表现相对较差,F值最小,为0.808。另外,与单一模型相比,静态集成模型的表现整体上要优于单一模型,再次反映出集成模型的优势。③动态集成模型中,DEM-ANN效果最优,准确率为0.868,F值为0.856;DEM-Voting排名第二,F值为0.854;DEM-nSVM排名第三,DEM-lSVM的F值最低,为0.845。④动态集成模型与单一模型、静态集成模型相比,可以看出动态集成模型整体表现要优于单一模型和静态集成模型。尽管动态集成中DEM-lSVM的F值最低(0.845),其仍然明显优于所有单一模型的表现;与静态集成模型相比,除了和EM-Voting基本一样外,均明显高于其他静态集成模型。

由表4可知,4种动态集成模型的查全率整体上优于大部分单一模型和静态集成模型。尽管在静态集成模型中,EM-nSVM和EM-ANN的查全率较高(分别为0.827和0.826),但这两个模型的准确率和查准率很低;特别是它们的查准率(均为0.795)远低于本研究构建的动态集成模型(介于0.930~0.972之间),这说明有很多按时还款的用户也被误判为违约用户,一定程度上影响了结果的可信度。由此,综合来看,基于多分类器动态集成的P2P违约风险评估模型是有优势的,能够比较准确地判断P2P借款用户的违约风险。

5 统计检验分析

为了进一步验证基于多分类器动态集成的违约风险评估模型取得的效果同单一模型和静态集成模型的显著差异,本研究对结果进行了非参数检验——Wilcoxon符号秩检验。具体地,首先对所有模型独立重复40次试验,获得了每个模型的40个F-measure值,然后基于F-measure值对两两模型进行Wilcoxon符号秩检验,结果见表5。在表5中,小于显著性水平0.05的p值已加粗标注。由表5可知:①单一模型中,ANN的表现显著优于DT、KNN、SVM和LR,且ANN和静态集成模型Adaboost、RF没有显著差异,但是所有动态集成模型的表现都显著优于单一模型;②静态集成模型中,EM-Voting的表现显著优于其他静态集成模型,与动态集成模型相比,除EM-Voting与DEM-lSVM无显著差异外,其余所有动态集成模型的表现都优于静态集成模型;③动态集成模型中,各个模型之间均存在显著差异,其中DEM-ANN效果最好,显著优于其余3个动态集成模型。由统计检验结果可以看出,基于多分类器动态集成的违约风险评估模型,尤其是DEM-ANN能够准确有效地进行P2P个人违约风险评估。

表5Wilcoxon符号秩检验结果

模型KNNANNSVMLRBaggingAdaboostRFEM-VotingEM-nSVMEM-lSVMEM-ANNDEM-VotingDEM-nSVMDEM-lSVMDEM-ANNDT000000000000000KNN00000000000000ANN0000.3270.35400000000SVM0000000.18100000LR00000000000Bagging0000.13200.9950000Adaboost0.00600000000RF00000000EM-Voting000000.6180EM-nSVM00.0040000EM-lSVM00000EM-ANN0000DEM-Voting000DEM-nSVM00DEM-lSVM0

注:为便于展示,小于10-8的p值用0表示。

6 结语

为了有效评估P2P平台借款用户的违约风险,提高违约借款识别准确性,本研究构建了基于多分类器动态集成的P2P 违约风险评估模型。以Lending Club提供的用户借款数据为测试样本,采用基于K均值聚类的多分类器动态集成方法进行违约风险评估模型的构建,并与多个单一模型和静态集成模型进行实验对比与统计检验。研究结果表明:①单一模型中神经网络的分类性能最好,但是整体来看,单一模型的准确性较差;②静态集成模型表现优于单一模型,其中基于多数投票的静态集成模型表现最好;③动态集成模型优于单一模型和静态集成模型,有较高的准确率和稳定性,并且采用神经网络集成的动态集成模型取得的识别效果最优。综上所述,本研究构建的多分类器动态集成模型能够较为准确地识别违约用户,对后续P2P个人违约风险与信用评估模型的研究具有借鉴意义。

然而,本研究在实证研究中,仅采用了来自Lending Club的部分个人借款数据,未来将尝试收集更多国内外P2P网贷平台的借款数据,以验证构建的P2P个人违约风险评估模型的识别性能。此外,未来还将考虑违约还款与按时还款样本数量失衡的问题,进一步改进与提高基于多分类器动态集成的违约风险评估模型。

参考文献

[1] 涂艳, 王翔宇. 基于机器学习的P2P网络借贷违约风险预警研究——来自“拍拍贷”的借贷交易证据[J]. 统计与信息论坛, 2018, 33(6): 69-76.

[2] 董纪昌, 王国梁, 沙思颖, 等. P2P网贷平台信任形成机制研究[J]. 管理学报, 2017, 14(10): 1 532-1 537.

[3] SERRANO-CINCA C, GUTIERREZ-NIETO B, LOPEZ-PALACIOS L. Determinants of Default in P2P Lending[EB/OL].(2015-10-01)[2018-10-23]. https://doi.org/10.1371/journal.pone.0139427.

[4] 柳向东,李凤. 大数据背景下网络借贷的信用风险评估——以人人贷为例[J]. 统计与信息论坛, 2016, 31(5): 41-48.

[5] JEFFERSON D, SIEGEL S, YOUNG L. Trust and Credit: The Role of Appearance in Peer-to-Peer Lending[J]. Review of Financial Studies, 2012, 25(8): 2 455-2 483.

[6] LIN M F, PRABHALA N R, VISWANATHAN S. Judging Borrowers by the Company They Keep: Friendship Networks and Information Asymmetry in Online Peer-to-Peer Lending[J]. Management Science, 2013, 59(1): 17-35.

[7] 李杰, 刘露, CHU C H. P2P网络借贷借款人违约风险影响因素研究[J]. 商业研究, 2018(9): 45-54.

[8] 吕勇斌, 姜艺伟, 张小青. 我国P2P平台网络借贷逾期行为和羊群行为研究[J]. 统计与决策, 2016(4): 162-165.

[9] 李思瑶, 王积田, 柳立超. 基于生存分析的P2P网络借贷违约风险影响因素研究[J]. 经济体制改革, 2016(6): 156-160.

[10] 肖会敏, 侯宇,崔春生. 基于BP神经网络的P2P网贷借款人信用评估[J]. 运筹与管理, 2018, 27(9): 112-118.

[11] 裴平, 郭永济. 基于贝叶斯网络的P2P网贷借款人信用评价模型[J]. 中国经济问题, 2017(2): 29-41.

[12] 阮素梅, 何浩然, 李敬明. P2P借贷中借款人的违约风险评估——基于“人人贷”数据的实证分析[J]. 经济问题, 2017(12): 45-50,99.

[13] LIM M K, SOHN S Y. Cluster-Based Dynamic Scoring Model[J]. Expert Systems with Applications, 2007, 32(2): 427-431.

[14] KO A H R, SABOURIN R, BRITTO A S. From Dynamic Classifier Selection to Dynamic Ensemble Selection[J]. Pattern Recognition, 2008, 41(5): 1 718-1 731.

[15] TSYMBAL A, PECHENIZKIY M, CUNNINGHAM P. Diversity in Search Strategies for Ensemble Feature Selection[J]. Information Fusion, 2005, 6(1): 83-98.

[16] XIA Y F, LIU C Z, DA B, et al. A Novel Heterogeneous Ensemble Credit Scoring Model Based on Bstacking Approach[J]. Expert Systems with Applications, 2018, 93:182-199.

[17] HE H L, ZHANG W Y, ZHANG S. A Novel Ensemble Method for Credit Scoring: Adaption of Different Imbalance Ratios[J]. Expert Systems with Applications, 2018, 98: 105-117.

[18] 操玮, 李灿, 贺婷婷, 等. 基于集成学习的中国P2P网络借贷信用风险预警模型的对比研究[J]. 数据分析与知识发现, 2018,2(10): 65-76.

[19] MA L, ZHAO X, ZHOU Z L, et al. A New Aspect on P2P Online Lending Default Prediction Using Meta-Level Phone Usage Data in China[J]. Decision Support Systems, 2018, 111: 60-71.

[20] MALEKIPIRBAZARI M, AKSAKALLI V. Risk Assessment in Social Lending via Random Forests[J]. Expert Systems with Applications, 2015, 42(10): 4 621-4 631.

[21] 李毅, 姜天英, 刘亚茹. 基于不平衡样本的互联网个人信用评估研究[J]. 统计与信息论坛, 2017, 32(2): 84-90.

[22] CRUZ R M O, SABOURIN R, CAVALCANTI G D C. Dynamic Classifier Selection: Recent Advances and Perspectives[J]. Information Fusion, 2018, 41: 195-216.

[23] 周志华. 机器学习[M]. 北京:清华大学出版社, 2016:73-145.

[24] 张卫国, 卢媛媛,刘勇军. 基于非均衡模糊近似支持向量机的P2P网贷借款人信用风险评估及应用[J]. 系统工程理论与实践, 2018, 38(10): 2 466-2 478.

[25] ROUSSEEUW P J. Silhouettes: A Graphical Aid to the Interpretation and Validation of Cluster Analysis[J]. Journal of Computational & Applied Mathematics, 1987, 20:53-65.

P2PDefaultRiskAssessmentBasedontheDynamicAggregationofMultipleClassifiers

HU Zhongyi1 WANG Chaoqun1 CHEN Yuan1 WU Jiang1 BAO Yukun2

(1. Wuhan University, Wuhan, China; 2. Huazhong University of Science and Technology, Wuhan, China)

Abstract: To evaluate the personal default risk on P2P lending platforms, this study proposes a multiple classifier dynamic aggregation model based on K-means clustering. The samples of P2P lending are divided into several subgroups by means of K-means clustering, and multiple classifiers are built for model aggregation in each subgroup. Given new testing samples, the corresponding multiple classifiers and aggregated model are dynamically selected based on the similarity between the testing samples and subgroups to assess the default risk. Taking dataset from Lending Club as a case of P2P personal credit scoring, the experimental results show that the proposed dynamic aggregation model outperforms both single and static aggregation models; additionally, dynamic aggregation model based on neural network is the best amongst examined models.

Keywords: P2P online lending; multiple classifier aggregation; dynamic selection; K-means clustering

DOI编码:10.3969/j.issn.1672-884x.2019.06.014

中图法分类号:C93

文献标志码:A

文章编号:1672-884X(2019)06-0915-08

收稿日期:2018-11-15

基金项目:国家自然科学基金资助重大项目(91646206);国家自然科学基金资助项目(71573197);国家自然科学基金资助青年项目(71601147)

(编辑 桂林)

通讯作者:胡忠义(1987~),男,山东泰安人。武汉大学(武汉市 430072)信息管理学院讲师,博士。研究方向为数据挖掘、互联网金融等。E-mail:zhongyi.hu@whu.edu.cn

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

胡忠义:基于多分类器动态集成的P2P违约风险评估论文
下载Doc文档

猜你喜欢