基于Logistic回归和BP神经网络的机动车辆保险欺诈识别与管理研究

基于Logistic回归和BP神经网络的机动车辆保险欺诈识别与管理研究

沈阳航空航天大学辽宁省沈阳市110136

摘要:随着经济的不断发展,机动车辆的不断增加,机动车辆保险已经成为中国财产保险业务中最大的险种,但其居高不下的赔付率一直困扰着我国的财产保险公司,本文基于A公司的210组机动车辆索赔案件进行识别研究,运用相关性分析、多重共线性分析和显著性检验,还有Logistic回归和BP(BackPropagation)神经网络的方法对所有的索赔案件进行识别。对机动车辆保险欺诈识别过程得出改进和管理启示。

关键词:机动车辆保险;保险欺诈;欺诈识别;Logistic回归;BP神经网络

一、引言

随着我国财产保险公司车险保费收入的快速增长,居高不下的车险赔付率一直困扰着我国财产保险公司。虽然车险相比其它财产保险具有出险频度高的特点,但从我国财产保险实务来看,保险欺诈也是导致车险赔付率居高不下的重要原因,因此对于机动车辆保险欺诈的识别和管理问题亟待解决。

二、机动车辆保险欺诈识别指标说明与初选

(一)数据来源与案件说明

本文随机选择A公司车险部200组已结案件作为研究机动车辆保险欺诈的样本数据,剩余10件已结案件作为检验样本。其中200组已结案件样本有44件被鉴定为欺诈索赔,剩余156件被鉴定为诚实索赔。

(二)识别指标说明

机动车辆保险欺诈的识别既要考虑数据的实用性和特征要求,也要衡量识别标准对于欺诈的权重和显著性要求,并且根据过往欺诈案例得出可能会影响车险欺诈的16项指标。

(三)识别指标间相关性分析

将随机选取的200组出险车辆作为样本,为避免样本向量之间存在多重共线性问题,将200组样本数据进行相关性分析,各指标间相关系数的最大值为0.343,表明16项识别指标间均属于弱相关和低度相关,初步判断不存在多重共线性的问题。

(四)多重共线性检验

通过SPSS22.0进行了共线性检验,并且结合共线性检验的结果和步骤,各维度的特征值不存在约等于0的数,各维度的条件指数也不存在大于10的数,方差比例中也不存在接近1的数,因此各识别指标之间不存在多重共线性。

三、机动车辆保险欺诈识别指标的筛选与模型应用

(一)机动车辆欺诈识别指标的筛选

根据识别指标的选择原则,显著性小于0.05的指标相比于其它指标具有更强的显著性,也就是X1、X4、X5、X6、X8、X11、X12、X13八项识别指标对于车险欺诈识别模型的构建更具有研究意义。

(二)Logistic回归预测

为了检验回归模型对原始数据的拟合度情况,必须对回归模型进行拟合度检验,结果显示,模型的显著性Sig=0.896大于0.5,接受零假设,因此由X1、X4、X5、X6、X8、X11、X12、X13八项识别指标构成的回归模型能够很好地拟合样本数据。模型对诚实和欺诈索赔案件的总正确预测率为92.0%。

(二)BP神经网络在机动车辆保险欺诈识别中的应用

输入层为经过显著性检验后八项指标构成的数据,经BP神经网络处理后,可得到输出层结果也就是预测概率。

在样本集和循环迭代次数相同的情况下,通过比较系统总误差来比较具有不同隐含层节点数的BP神经网络的泛化分类能力,从而确定隐含层节点数。

当隐含层数目为5时系统训练实际精度为0.000975,在10组数据中精度最小,而且每组样本的误差率总和为1.886也是最小,也就是最终确定模型的网络结构为8-5-1。测试集样本数据的预测值都能够准确的预测出欺诈案件。

四、基于机动车辆保险欺诈识别的改进与管理启示

(一)增加初始的识别指标,寻求更多显著识别指标

根据每年的欺诈案例更新现有的识别指标,以确保保险公司能快速和准确地定位索赔案件的关键信息。如果不能及时增加和更新初始的识别指标,找到更多的显著识别指标,模型将无法识别出最新型的欺诈类型。

(二)重点关注显著识别指标,提高欺诈识别的准确性

在构建识别模型的过程中,并不是所有的识别指标对模型构建都是有利的,有些指标则会干扰模型的判断,从而影响模型整体的准确性,因此必须先要对识别指标进行筛选,选出有利于模型识别的显著性指标,以提高欺诈识别的准确性。

(三)综合运用合理有效的识别方法,提高欺诈识别的正确率

在运用Logistic回归模型和BP神经网络进行机动车辆保险欺诈识别的过程中,首先必须对欺诈识别指标进行筛选,选出真正对构建模型进而对欺诈案件有效识别的显著性指标。经过了指标的显著性检验进而将显著性指标输入到BP神经网络中进行训练,才能使有效的提高模型对欺诈案件的正确率。

(四)时刻扩充识别模型的数据库,使识别模型做到与时俱进

机动车辆保险逐步完善,与此同时保险欺诈的手段也会随之发生改变,因此为识别更多类型的欺诈案件,必须时刻扩充识别模型的数据库,使识别模型做到与时俱进。

参考文献:

[1]吕振通,张凌云.SPSS统计分析与应用[M].北京:机械工业出版社,2009

[2]榻思杰.A公司机动车辆保险欺诈识别指标研究[D].长沙:湖南大学,2016

[3]叶明华.我国机动车保险欺诈识别的因子分析一基于江、浙、沪机动车保险索赔样本数据[J].华东经济管理,2010,2

[4]晃增.我国车险理赔环节的欺诈问题与对策研究[J].产业与科技论坛,2017,6

[5]王慧卿.中国机动车辆保险反欺诈研究[D].沈阳:辽宁大学,2015

标签:;  ;  ;  

基于Logistic回归和BP神经网络的机动车辆保险欺诈识别与管理研究
下载Doc文档

猜你喜欢