保险理赔智能反欺诈判定方法和系统技术方案

技术编号:20120491 阅读:56 留言:0更新日期:2019-01-16 12:32
本发明专利技术涉及一种保险理赔智能反欺诈判定方法,包括特征构建步骤、模型构造步骤、模型的学习和训练步骤,所述特征构建步骤包括划分数据类型,根据数据类型构建特征库的步骤,所述模型构造步骤包括一LR模型和一MLP模型,所述MLP模型为一个包含由4个隐藏层构成的线性整流函数的神经元网络模型;所述模型的学习和训练步骤采用BP反向传播算法;本发明专利技术采用LR模型与MLP模型结合构造保险理赔反欺诈核心算法,以及根据原始数据的不同类型分别采用不同的数据处理方法来构建特征库,使得特征库更能反映案件特征,因而其特征处理和挖掘的能力更强,更新更加便捷,能够明显提升保险理赔欺诈判定的准确率和效率。

Intelligent Anti-fraud Judgment Method and System for Insurance Claims

The invention relates to an intelligent anti-fraud judgment method for insurance claims, which includes feature construction steps, model construction steps, model learning and training steps. The feature construction steps include dividing data types and constructing feature library according to data types. The model construction steps include LR model and MLP model. The MLP model is composed of four hidden layers. The neuron network model of linear rectification function is formed; the learning and training steps of the model are BP back propagation algorithm; the LR model and MLP model are combined to construct the core algorithm of insurance claims anti-fraud, and different data processing methods are used to construct the feature database according to the different types of original data, so that the feature database can better reflect the characteristics of the case, and thus the feature database can be used to construct the core algorithm of insurance claims anti-fraud. The ability of feature processing and mining is stronger and the update is more convenient, which can obviously improve the accuracy and efficiency of insurance claims fraud determination.

【技术实现步骤摘要】
保险理赔智能反欺诈判定方法和系统
本专利技术涉及反欺诈自动判别算法
,特别涉及一种保险理赔智能反欺诈判定方法和系统。
技术介绍
目前在保险理赔领域存在大量的欺诈行为,如何检测欺诈一直是保险从业者和保险科技领域的难题。传统的反欺诈技术多依赖于规则引擎和统计模型。规则引擎在部署实施的过程中,需要业务专家不断的更新规则,耗费大量人力;而统计模型很难深入发掘模型因子间的关联关系,特别是高阶关联关系,因此其处理能力受到极大限制。同时,保险欺诈存在地域性差异及时间性差异,导致当前没有更完善的方法能够准确、高效的检测保险理赔欺诈。保险理赔反欺诈技术的核心在于通过数据所表征的特征及其关联关系,发现异常的出险报案。传统的统计模型主要是依据数值进行判断,对于欺诈理赔中的类型数据需要进行数值化处理后,方可进行处理。数值化过程中引入了很多人为因素,使得传统模型的处理能力受到很大限制。同时,统计模型以线性模型为基础,对于非线性问题需要进行线性化才能处理,限制了模型对高阶特征关联的发现能力。规则引擎是根据输入数据按照预设的规则进行判定,其模型有效性的关键在预设的规则,而这些规则背后的判定条件需要保险业务专本文档来自技高网...

【技术保护点】
1.一种保险理赔智能反欺诈判定方法,其特征在于,包括步骤:特征构建步骤:划分数据类型,根据数据类型构建特征库;模型构造步骤:分别构建一逻辑回归LR模型和一多层感知器MLP模型,所述LR模型表征如下:y=ωTx+b其中,x=[x1,x2,...,xd],表示包含d个特征的向量;ω=[ω1,ω2,...,ωd],表示特征对应的模型参数;T=[1,2,……,d];b为模型偏置值;所述多层感知器MLP模型为一个包含由4个隐藏层构成的线性整流函数的神经元网络模型;模型的学习和训练步骤:采用通用神经元网络训练方法,且代价函数采用以下交叉熵:

【技术特征摘要】
1.一种保险理赔智能反欺诈判定方法,其特征在于,包括步骤:特征构建步骤:划分数据类型,根据数据类型构建特征库;模型构造步骤:分别构建一逻辑回归LR模型和一多层感知器MLP模型,所述LR模型表征如下:y=ωTx+b其中,x=[x1,x2,...,xd],表示包含d个特征的向量;ω=[ω1,ω2,...,ωd],表示特征对应的模型参数;T=[1,2,……,d];b为模型偏置值;所述多层感知器MLP模型为一个包含由4个隐藏层构成的线性整流函数的神经元网络模型;模型的学习和训练步骤:采用通用神经元网络训练方法,且代价函数采用以下交叉熵:θ指的不同的特征数据,y(i)指的是该特征数据对应的某个事件发生的概率,对于一个一定会发生的事件,其发生概率为1;所述训练方法采用BP反向传播算法。2.如权利要求1所述的保险理赔智能反欺诈判定方法,其特征在于,所述特征构建步骤具体包括:将数据分为三类,第一类数值型,第二类为确定类型数据,第三类为未确定类型数据;根据不同的数据类型构建特征库,对于第一类数据,直接对原始数据构建特征库;对于第二类数据,采用one-hot编码方式进行编码,每一位表示一种类型;对于第三类数据,采用embedding编码方式进行编码,以将高维稀疏型数据信息置换成低维稠密向量。3.如权利要求2所述的保险理赔智能反欺诈判定方法,其特征在于,所述对于第一类数据,直接对原始数据构建特征库的步骤具体包括:直接使用,对于可直接使用的数值,直接将原始数据放入特征库;数据封箱,根据数据的业务含义,将数据分段,作为第二类数据处理;数据归一化处理,根据数据的累计分布函数CDF,将原始数据映射至[0,1]集。4.如权利要求1所述的保险理赔智能反欺诈判定方法,其特征在于,所述LR模型的特征库包含原始特征及其组合特征,所述组合特征为多类型的叉乘特征组合,用于记忆特定的特征组合。5.如权利要求1所述的保险理赔智能反欺诈判定方法,其特征在于,所述MLP模型的输入层与隐藏层...

【专利技术属性】
技术研发人员:肖延国周忠球黄维林
申请(专利权)人:上海远眸软件有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1