基于数据融合匹配的反欺诈分析方法、装置、设备及介质制造方法及图纸

技术编号:36908970 阅读:33 留言:0更新日期:2023-03-18 09:27
本发明专利技术涉及数据融合技术,揭露了一种基于数据融合匹配的反欺诈分析方法,包括:将基本信息数据、信用数据及理赔数据进行数据融合,得到历史融合数据;根据历史融合数据构建风险决策树,将用户对应的融合数据输入至风险决策树中,得到用户的风险评分值;确定融合数据的融合权值,根据风险评分值和融合权值计算用户的理赔概率;将理赔概率和融合数据中的理赔数据输入至反欺诈方案匹配模型中,得到用户对应的反欺诈方案;根据反欺诈方案中理赔补偿方式确定用户的理赔金额,根据理赔概率、理赔数据及理赔金额计算理赔的可行性。本发明专利技术还提出一种基于数据融合匹配的反欺诈分析装置、电子设备以及存储介质。本发明专利技术可以提高反欺诈分析的可行性。可行性。可行性。

【技术实现步骤摘要】
基于数据融合匹配的反欺诈分析方法、装置、设备及介质


[0001]本专利技术涉及数据融合
,尤其涉及一种基于数据融合匹配的反欺诈分析方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着保险市场竞争越来越激烈,降本增效对于公司管理层来说是迫切需要的,为了提升整体运营水平,分析总结保险出险原因,理赔过程合理性,得出出险规律,降低人们生命财产损失和企业赔付成本,需要针对用户的多种数据行为进行理赔过程的分析,保证用户在理赔的过程中不被欺诈。
[0003]现有的理赔分析技术多为基于理赔作业流程完全由人工操作完成,经过人工对每一个赔案进行审核及复核过程。实际应用中,完全由人工操作完成,只基于用户提交的理赔材料无法对用户的风险进行严格管控且理赔处理时效过长,因此,仅考虑用户得到单一数据,可能导致对用户风险无法获知且理赔时间过长,从而对进行反欺诈分析时的可行性较低。

技术实现思路

[0004]本专利技术提供一种基于数据融合匹配的反欺诈分析方法、装置及计算机可读存储介质,其主要目的在于解决进行反欺诈分析时的可行性较低的问题。
[0005]为实现上述目的,本专利技术提供的一种基于数据融合匹配的反欺诈分析方法,包括:
[0006]S1、获取历史用户的基本信息数据、信用数据及理赔数据,将所述基本信息数据、所述信用数据及所述理赔数据进行数据融合,得到历史融合数据;
[0007]S2、根据所述历史融合数据构建风险决策树,将目标用户对应的融合数据输入至所述风险决策树中,得到所述目标用户的风险评分值;
[0008]S3、利用预设的层次分析法确定所述融合数据的融合权值,通过预设的异化权重算法根据所述风险评分值和所述融合权值计算所述目标用户的理赔概率,其中所述通过预设的异化权重算法根据所述风险评分值和所述融合权值计算所述目标用户的理赔概率,包括:
[0009]S31、获取所述目标用购买的保险种类的应赔金额;
[0010]S32、利用如下的异化权重算法根据所述应赔金额、所述风险评分值和所述融合权重计算所述目标用户的理赔概率:
[0011][0012]其中,P为所述理赔概率,x
k
为第k个保险种类的应赔金额,r为保险种类数量,α为所述融合权重,τ为所述风险评分值;
[0013]S4、将所述理赔概率和所述融合数据中的理赔数据输入至预先构建的反欺诈方案
匹配模型中,得到所述目标用户对应的反欺诈方案;
[0014]S5、根据所述反欺诈方案中理赔补偿方式确定所述目标用户的理赔金额,根据所述理赔概率、所述理赔数据及所述理赔金额计算所述反欺诈方案的可行性。
[0015]可选地,所述将所述基本信息数据、所述信用数据及所述理赔数据进行数据融合,得到历史融合数据,包括:
[0016]根据预设的数据来源需求将所述基本信息数据、所述信用数据及所述理赔数据进行来源划分,得到多源数据;
[0017]根据预设的数据维度需求将所述基本信息数据、所述信用数据及所述理赔数据进行维度划分,得到多维数据;
[0018]将所述多源数据和所述多维数据进行数据融合,得到所述历史融合数据。
[0019]可选地,所述将所述多源数据和所述多维数据进行数据融合,得到所述历史融合数据,包括:
[0020]通过预设的词袋模型提取所述多源数据的第一数据特征向量,利用预设的文本向量提取模型提取所述多维数据的第二数据特征向量;
[0021]利用如下的加权相似度公式计算所述第一数据特征向量与所述第二数据特征向量的相似度:
[0022][0023]其中,S为所述相似度,δ
i
为第i个数据特征权重,K
i
为所述第一数据特征向量中第i个向量特征,H
i
为所述第二数据特征向量中第i个向量特征,n为数据向量数量;
[0024]根据所述相似度对所述多源数据和所述多维数据进行数据融合,得到所述历史融合数据。
[0025]可选地,所述根据所述历史融合数据构建风险决策树,包括:
[0026]提取所述历史融合数据中的特征数据集;
[0027]利用如下的信息熵公式计算所述特征数据集中每个特征数据的信息熵:
[0028][0029]其中,G为所述信息熵,p
j
为第j类特征数据所占的比例,log为对数函数,C为所述特征数据集中的特征数据样本总数量,C
j
为第j类特征数据中特征属性样本数量;
[0030]选取所述信息熵最大的特征数据作为根节点,在所述根节点上分裂左节点和右节点;
[0031]逐一从未被选取的特征数据集中选取所述信息熵最大的特征数据分配至所述左节点和所述右节点,得到基本决策树;
[0032]对所述基本决策树进行决策树增添处理,得到风险决策树。
[0033]可选地,所述将目标用户对应的融合数据输入至所述风险决策树中,得到所述目标用户的风险评分值,包括:
[0034]将所述融合数据的第一数据特征与所述风险决策树中的数据特征进行匹配,得到
风险等级;
[0035]根据所述风险等级确定所述目标用户的风险评分值。
[0036]可选地,所述将所述理赔概率和所述融合数据中的理赔数据输入至预先构建的反欺诈方案匹配模型中,得到所述目标用户对应的反欺诈方案,包括:
[0037]将所述理赔概率输入至所述反欺诈方案匹配模型中,得到反欺诈分类方案;
[0038]将所述理赔数据与所述反欺诈分类方案中理赔数据进行匹配,得到匹配值;
[0039]选取所述匹配值最大的反欺诈分类方案为所述目标用户对应的反欺诈方案。
[0040]可选地,所述根据所述理赔概率、所述理赔数据及所述理赔金额计算所述反欺诈方案的可行性,包括:
[0041]利用预设的熵值算法确定所述理赔数据的理赔权重;
[0042]根据所述理赔权重确定所述理赔金额的第一可行性值;
[0043]根据所述理赔概率确定所述理赔金额的第二可行性值;
[0044]根据所述第一可行性值和所述第二可行性值的均值确定所述反欺诈方案的可行性。
[0045]为了解决上述问题,本专利技术还提供一种基于数据融合匹配的反欺诈分析装置,所述装置包括:
[0046]数据融合模块,用于获取历史用户的基本信息数据、信用数据及理赔数据,将所述基本信息数据、所述信用数据及所述理赔数据进行数据融合,得到历史融合数据;
[0047]风险评分值确定模块,用于根据所述历史融合数据构建风险决策树,将目标用户对应的融合数据输入至所述风险决策树中,得到所述目标用户的风险评分值;
[0048]理赔概率计算模块,用于利用预设的层次分析法确定所述融合数据的融合权值,通过预设的异化权重算法根据所述风险评分值和所述融合权值计算所述目标用户的理赔概率;
[0049]反欺诈方案确定模块,用于将所述理赔概率和所述融合数据中的理赔本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据融合匹配的反欺诈分析方法,其特征在于,所述方法包括:S1、获取历史用户的基本信息数据、信用数据及理赔数据,将所述基本信息数据、所述信用数据及所述理赔数据进行数据融合,得到历史融合数据;S2、根据所述历史融合数据构建风险决策树,将目标用户对应的融合数据输入至所述风险决策树中,得到所述目标用户的风险评分值;S3、利用预设的层次分析法确定所述融合数据的融合权值,通过预设的异化权重算法根据所述风险评分值和所述融合权值计算所述目标用户的理赔概率,其中所述通过预设的异化权重算法根据所述风险评分值和所述融合权值计算所述目标用户的理赔概率,包括:S31、获取所述目标用购买的保险种类的应赔金额;S32、利用如下的异化权重算法根据所述应赔金额、所述风险评分值和所述融合权重计算所述目标用户的理赔概率:其中,P为所述理赔概率,x
k
为第k个保险种类的应赔金额,r为保险种类数量,α为所述融合权重,τ为所述风险评分值;S4、将所述理赔概率和所述融合数据中的理赔数据输入至预先构建的反欺诈方案反欺诈方案匹配模型中,得到所述目标用户对应的反欺诈方案;S5、根据所述反欺诈方案中理赔补偿方式确定所述目标用户的理赔金额,根据所述理赔概率、所述理赔数据及所述理赔金额计算所述反欺诈方案的可行性。2.如权利要求1所述的基于数据融合匹配的反欺诈分析方法,其特征在于,所述将所述基本信息数据、所述信用数据及所述理赔数据进行数据融合,得到历史融合数据,包括:根据预设的数据来源需求将所述基本信息数据、所述信用数据及所述理赔数据进行来源划分,得到多源数据;根据预设的数据维度需求将所述基本信息数据、所述信用数据及所述理赔数据进行维度划分,得到多维数据;将所述多源数据和所述多维数据进行数据融合,得到所述历史融合数据。3.如权利要求2所述的基于数据融合匹配的反欺诈分析方法,其特征在于,所述将所述多源数据和所述多维数据进行数据融合,得到所述历史融合数据,包括:通过预设的词袋模型提取所述多源数据的第一数据特征向量,利用预设的文本向量提取模型提取所述多维数据的第二数据特征向量;利用如下的加权相似度公式计算所述第一数据特征向量与所述第二数据特征向量的相似度:其中,S为所述相似度,δ
i
为第i个数据特征权重,K
i
为所述第一数据特征向量中第i个向量特征,H
i
为所述第二数据特征向量中第i个向量特征,n为数据向量数量;
根据所述相似度对所述多源数据和所述多维数据进行数据融合,得到所述历史融合数据。4.如权利要求1所述的基于数据融合匹配的反欺诈分析方法,其特征在于,所述根据所述历史融合数据构建风险决策树,包括:提取所述历史融合数据中的特征数据集;利用如下的信息熵公式计算所述特征数据集中每个特征数据的信息熵:其中,G为所述信息熵,p
j
为第j类特征数据所占的比例,log为对数函数,C为所述特征数据集中的特征数据样本总数量,C
j
为第j类特征...

【专利技术属性】
技术研发人员:陈炜常黄祥玉韦显迎
申请(专利权)人:民太安保险公估有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1