一种数据驱动的车险欺诈识别方法技术

技术编号:25482242 阅读:84 留言:0更新日期:2020-09-01 23:02
本发明专利技术涉及一种数据驱动的车险欺诈识别方法,获取车险理赔历史数据的数据集;对初始的训练数据通过递归特征消除与交叉验证的方式进行特征的选择;采用梯度提升决策树算法对训练数据进行模型训练,将训练生成的模型用于测试数据进行预测;对训练好的模型进行调参,并利用准确率进行评估。本发明专利技术运用梯度提升决策树算法建立车险欺诈识别模型,并以此构建车险欺诈识别算法,可以给出具体案例是否疑似欺诈的概率值,还可以让使用者看到理赔的相关重要指标以及包含的重要性,弥补现有技术的不足。

【技术实现步骤摘要】
一种数据驱动的车险欺诈识别方法
本专利技术涉及用于识别保险欺诈的数据处理技术,特别涉及一种数据驱动的车险欺诈识别方法。
技术介绍
随着汽车数量的增加,每年因交通事故造成的财产损失、人员伤亡逐年上升,汽车的增多为人们的生活引入了更多、更大的风险。机动车辆保险为车辆所有者提供了机动车因意外事故造成的车辆财产损失保障的同时,也为因意外事故导致的人身伤亡提供经济给付。然而,机动车辆保险骗赔现象的普遍存在。由于投保人和保险人之间信息的不对称,机动车辆保险的骗赔已经成为机动车辆保险发展的主要障碍。如果具有良好的欺诈检测和预防能力管理系统,保险公司就可以提高客户满意度,减少损失调整费用。目前常用于检测欺诈索赔的方法,是使用自己的指令来分析数据。为此,保险公司的人员需要复杂而耗时的调查,并且要处理不同的知识领域,而指令设置、数据分析等的效率和准确率仍有待提升。
技术实现思路
本专利技术的目的在于提供一种数据驱动的车险欺诈识别方法,从历史车险理赔数据集出发,运用梯度提升决策树算法建立车险欺诈模型,实现车辆保险欺诈识别。r>为了达到上述目的本文档来自技高网...

【技术保护点】
1.一种数据驱动的车险欺诈识别方法,其特征在于,/n对来自于车险理赔历史数据的数据集,运用梯度提升决策树算法建立车险欺诈识别模型,进而构建车险欺诈识别算法;/n其中,对初始的训练数据,通过递归特征消除与交叉验证的方式进行特征的选择,采用的基模型为决策树,使用信息熵来进行特征的选择和划分;/n采用梯度提升决策树算法对训练数据进行模型训练,并且将训练生成的模型用于测试数据进行预测;/n对训练好的模型进行调参,包含对梯度提升决策树算法的分类器的步长、迭代次数、决策树最大深度、内部节点再划分所需最小样本数、叶子节点最少样本数进行调参,用调整后的参数拟合数据;利用准确率对模型预测的结果进行评估。/n

【技术特征摘要】
1.一种数据驱动的车险欺诈识别方法,其特征在于,
对来自于车险理赔历史数据的数据集,运用梯度提升决策树算法建立车险欺诈识别模型,进而构建车险欺诈识别算法;
其中,对初始的训练数据,通过递归特征消除与交叉验证的方式进行特征的选择,采用的基模型为决策树,使用信息熵来进行特征的选择和划分;
采用梯度提升决策树算法对训练数据进行模型训练,并且将训练生成的模型用于测试数据进行预测;
对训练好的模型进行调参,包含对梯度提升决策树算法的分类器的步长、迭代次数、决策树最大深度、内部节点再划分所需最小样本数、叶子节点最少样本数进行调参,用调整后的参数拟合数据;利用准确率对模型预测的结果进行评估。


2.如权利要求1所述数据驱动的车险欺诈识别方法,其特征在于,
来自于车险理赔历史数据的数据集中,每一条原始数据包含了多个数据项以及是否为欺诈的认定。


3.如权利要求1所述数据驱动的车险欺诈识别方法,其特征在于,
对数据集进行预处理,包含:删除无用的数据项,对数据集进行划分,得到初始的数据表;对缺失值进行填补,对时间数据进行序列化处理。


4.如权利要求3所述数据驱动的车险欺诈识别方法,其特征在于,
对类别型变量无法直接处理的数据项,采用one-hot编码方式进行编码。

【专利技术属性】
技术研发人员:程文坛孙伟
申请(专利权)人:上海海事大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1