自动特征交叉的保险理赔智能反欺诈方法和系统技术方案

技术编号:21434428 阅读:45 留言:0更新日期:2019-06-22 12:36
本发明专利技术涉及一种自动特征交叉的保险理赔智能反欺诈方法,包括单特征构建步骤,用于根据不同的数据类型构建特征库、特征交叉步骤,用于对所述特征库中的特征进行多层特征交叉计算,并构造每一项特征的权重和偏移量、网络模型构造步骤,用于在stacking层上构造平行的交叉网络和深度神经网络,将所述交叉网络和深度神经网络作为一个组合层,然后将整个组合层输入到一logits函数层,以及模型的训练步骤,采用通用神经网络BP反向传播算法进行训练。本发明专利技术还提供一种自动特征交叉的保险理赔智能反欺诈系统。本发明专利技术能够解决现有深度模型中交叉特征构建问题,实现交叉特征的自动构建与优化,从而减少特征构建过程中的人力投入。

【技术实现步骤摘要】
自动特征交叉的保险理赔智能反欺诈方法和系统
本专利技术涉及反欺诈自动判别算法
,特别涉及一种自动特征交叉的保险理赔智能反欺诈方法和系统。
技术介绍
目前在保险理赔领域存在大量的欺诈行为,如何检测欺诈一直是保险从业者和保险科技领域的难题。随着机器学习技术的发展,各种深度神经网络开始应用于保险反欺诈领域。现有的深度学习反欺诈模型需要大量的人工特征工程,才能保证反欺诈模型的有效性,通常而言基于单个特征的分析无法实现反欺诈模型,需要将多个特征进行交叉组合构建新的特征。而这样的交叉特征构建通常涉及到上千种组合,仅仅依靠人工构建,效率很低,而且效果有限。保险反欺诈技术的关键在发现保险理赔业务过程中各种数据之间的关联,并从中发现异常的出险报案。传统的统计模型的能力受限,而规则引擎又受到专家能力的制约,因此基于深度学习的模型因其出色的数据高阶关系发现能力,开始在保险反欺诈领域受到重视。但深度学习模型的组合特征构建,一直是亟待解决的问题。现有的组合特征构建,需要人工分析其数据字段的类型、统计分布及其业务含义构建特征,同时分析数据字段的关联性及其业务含义,将其组合构建新的组合特征。对于单数据字段的本文档来自技高网...

【技术保护点】
1.一种自动特征交叉的保险理赔智能反欺诈方法,其特征在于,包括步骤:单特征构建,根据不同的数据类型构建特征库;特征交叉,对所述特征库中的特征进行多层特征交叉计算,并构造每一项特征的权重和偏移量;网络模型构造,在stacking层上构造平行的交叉网络和深度神经网络,将所述交叉网络和深度神经网络作为一个组合层,然后将整个组合层输入到一logits函数层;模型的训练,采用通用神经网络BP反向传播算法进行训练,且代价函数采用以下交叉熵:

【技术特征摘要】
1.一种自动特征交叉的保险理赔智能反欺诈方法,其特征在于,包括步骤:单特征构建,根据不同的数据类型构建特征库;特征交叉,对所述特征库中的特征进行多层特征交叉计算,并构造每一项特征的权重和偏移量;网络模型构造,在stacking层上构造平行的交叉网络和深度神经网络,将所述交叉网络和深度神经网络作为一个组合层,然后将整个组合层输入到一logits函数层;模型的训练,采用通用神经网络BP反向传播算法进行训练,且代价函数采用以下交叉熵:θ指的不同的特征数据,y(i)指的是该特征数据对应的某个事件发生的概率,对于一个一定会发生的事件,其发生概率为1。2.如权利要求1所述的保险理赔智能反欺诈方法,其特征在于,所述单特征构建步骤具体包括:将特征数据分为三类,第一类为数值型数据,第二类为确定类型数据,第三类为未确定类型数据;根据不同的数据类型构建特征库,对于第一类数据,直接对原始数据构建特征库;对于第二类数据,采用one-hot编码方式进行编码,每种类型用数据中一位表示,数据属于哪种类型,该数据位就被置为1;对于第三类数据,采用embedding编码方式进行编码,以将高维稀疏型数据信息置换成低维稠密向量。3.如权利要求2所述的保险理赔智能反欺诈方法,其特征在于,所述特征交叉步骤具体包括:对所述三类特征数据进行多层特征交叉计算,每层的交叉特征有如下表现形式:其中,xl,xl+1∈Rd分别是交叉层第l层和l+1层的输出的列矢量;wl,bl∈Rd分别是第l层的权重和偏差;每层交叉层在做完交叉计算后再加入自己的输入层,映射函数f:Rd→Rd拟合了(xl+1-xl)的残差。4.如权利要求3所述的保险理赔智能反欺诈方法,其特征在于:假设则可以对上述交叉计算式中的交叉项进行如下简化:其中,w∈Rd。5.如权利要求1所述的保险理赔智能反欺诈方法,其特征在于,所述网络模型构造步骤具体包括:构建stacking层,对所述特征库中的第三类数据特征作stacking处理,将高维稀疏型数据信息置换成低维稠密向量;在stacking层上构造平行的交叉网络和深度神经网络,所述交叉网络总共包含四层,所述深度神经网络为一个包括由四个隐藏层构成的基于ReLU激活函数的MLP模型;将所述特征库中的第一类、第二类和第三类数据特征进行拼接,构建所述MLP模型的输入层;将所述交叉网络和深度神经网络作为一个组合层,并将整个组合层输入到所述logits函数层,最终输出是否是欺诈行为的判定依据。6.如权利要求5所述的保险理赔智能反...

【专利技术属性】
技术研发人员:肖延国周忠球黄维林
申请(专利权)人:上海远眸软件有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1