一种基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法技术

技术编号:39658825 阅读:9 留言:0更新日期:2023-12-09 11:27
本发明专利技术公开了一种基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法

【技术实现步骤摘要】
一种基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法


[0001]本专利技术属于人工智能
,具体涉及一种基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法


技术介绍

[0002]在健康保险领域,欺诈行为对于保险公司和整个保险行业都是一个严重的问题

欺诈行为可能导致巨大的经济损失,并对保险公司的声誉和客户信任产生负面影响

因此,开发一种高效准确的健康保险欺诈检测方法至关重要

[0003]目前,传统的健康保险欺诈检测方法主要基于规则引擎和统计模型,这些方法往往依赖于人工定义的规则和特征,限制了它们的适应性和准确性

近年来,图神经网络在图数据处理和分析方面取得了显著的进展
。GNN
能够对复杂的关系和结构进行建模,并从图中提取有用的特征信息

然而,在健康保险欺诈检测中,现有的
GNN
方法往往忽视了动态性和多模态数据的特点

[0004]因此,本专利技术提出了一种基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法,旨在克服传统方法和现有
GNN
方法的局限性

该方法将动态异构图模型引入健康保险欺诈检测中,能够捕捉到复杂的关系和结构,并利用多模态数据源的信息来提高欺诈检测的准确性

[0005]相比传统方法和现有
GNN
方法,本专利技术的方法具有以下优势:能够处理动态和异构的健康保险数据,充分挖掘数据中的关系和结构信息;利用记忆机制进行历史信息的存储和更新,提高欺诈检测的准确性;通过层次多模态融合,融合多源数据的信息,提供更全面的特征表示

因此,本专利技术的方法在健康保险欺诈检测领域具有广泛的应用前景和商业价值


技术实现思路

[0006]为克服现有技术不足,本专利技术提出一种基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法

实现了健康保险欺诈检测

本专利技术提出了一种名为
HIRDNet(Health Insurance Fraud Detection Network)
的深度学习模型,具体的步骤如下:
[0007]步骤
1、
建立异质图;
[0008]步骤
2、
构建健康保险欺诈检测网络
HIRDNet

[0009]步骤
3、
训练和测试健康保险欺诈检测网络
HIRDNet

[0010]所述步骤1具体包括以下步骤:
[0011]步骤
1.1
构建动态异质图

[0012]健康保险记录可以表示为其中是
t
时刻的快照图,
X∈R
P
×
k
是所有索赔人结点的上下文特征矩阵

在图在图中,是在
时间点
t
的结点集合
{v}。
ξ
是在时间点
t
的边的集合
{u,r,v}。
是结点标签
{claimer,department,hospital,health care,timestamp}
,是边种类的集合
{(claimer,department),(claimer,hospital),(claimer,health care),(claimer,timestamp)}
,简记为
{CDC,CHC,CMC,CTC}。
每个结点都已经被标记了是欺诈结点或者非欺诈结点

[0013]步骤
1.2
构建实体嵌入
Entity2vec。
[0014]我们使用基于
Skip

gram
的四个预训练编码器将离散的实体映射到连续的向量空间


item2vec
类似,我们在预训练过程中不考虑实体的顺序关系

我们获得了对应的
m
维向量和
[0015]所述步骤2具体包括以下步骤:
[0016]步骤
2.1
建立通用聚合器

[0017]为了聚合同一模态内的实体和不同模态的实体,本专利技术设计了一个简单且通用的聚合器作为
HIRDNet
的核心

第一步是通过自我注意力机制学习每个实体的上下文信息

具体来说,对于每个实体向量我们首先计算查询向量和关键字向量
[0018][0019][0020]其中
W
Q
∈R
a
×
m

W
K
∈R
a
×
m
是可学习的权重矩阵

[0021]然后我们获得自我注意力权重
[0022][0023]其中
f

softmax
函数,是缩放因子,因此上下文向量可以计算为:
[0024][0025]然后我们获得聚合注意权重该权重关注关键实体,例如可能存在欺诈的高价药物或异常就诊情况

[0026][0027]其中是可学习的权重矩阵

最后,对于每个实体向量最后,对于每个实体向量的全局表示为:
[0028][0029]网络中的内模态级别

跨模态级别和时间级别融合都是基于通用聚合器实现的

[0030]步骤
2.2
异质多模态融合模块

[0031]异质多模态融合模块模块是网络的核心部分,采用层次化的融合结构:内模态级别

跨模态级别和时间级别融合

该模块旨在对索赔人
p
的所有就诊中不同模态的实体进行全局融合

[0032]在内模态级别融合中,我们使用设计的通用聚合器
(UAG)
来融合医疗保健实体的表示向量:
[0033][0034]其中指的是索赔人
p
在时间
t
的就诊中医疗保健实体的表示向量,是医疗保健实体的医学语义嵌入

[0035]接下来,在跨模态级别融合中,我们使用潜在映射矩阵接下来,在跨模态级别融合中,我们使用潜在映射矩阵和将不同模态实体的表示向量投影到相同的特征空间

然后,我们使用通用聚合器来融合来自医疗

空间和时间模态的实体的表示向量:
[0036][0037]其中,和分别表示科室

医院和时间实体的表示向量,
||
表示连接操作,是索赔人...

【技术保护点】

【技术特征摘要】
1.
一种基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法,其特征在于包括如下步骤:步骤
1、
建立异质图;步骤
2、
构建健康保险欺诈检测网络
HIRDNet
;步骤
3、
训练和测试健康保险欺诈检测网络
HIRDNet。2.
根据权利要求1所述的基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法,其特征在于所述步骤1具体实现如下:健康保险记录可以表示为其中是
t
时刻的快照图,
X∈R
P
×
k
是所有索赔人结点的上下文特征矩阵

在图在图中,是在时间点
t
的结点集合
ξ
是在时间点
t
的边的集合
{u,r,v}。
是结点标签
{claimer,department,hospital,health care,timestamp}
,是边种类的集合
{(claimer,department),(claimer,hospital),(claimer,health care),(claimer,timestamp)}
,简记为
{CDC,CHC,CMC,CTC}。
每个结点都已经被标记了是欺诈结点或者非欺诈结点

我们使用基于
Skip

gram
的四个预训练编码器将离散的实体映射到连续的向量空间


item2vec
类似,我们在预训练过程中不考虑实体的顺序关系

我们获得了对应的
m
维向量和
3.
根据权利要求1所述的种基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法,其特征在于所述步骤2包括以下步骤:步骤
2.1
建立通用聚合器;步骤
2.2
建立异质多模态融合模块;步骤
2.3
建立时间间隔模块;步骤
2.4
建立图结构模块;步骤
2.5
建立
HIRDNet。4.
根据权利要求3所述的一种基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法,其特征在于建立通用聚合器的步骤如下:为了聚合同一模态内的实体和不同模态的实体,本发明设计了一个简单且通用的聚合器作为
HIRDNet
的核心

第一步是通过自我注意力机制学习每个实体的上下文信息

具体来说,对于每个实体向量我们首先计算查询向量和关键字向量量量其中
W
Q
∈R
a
×
m

W
K
∈R
a
×
m
是可学习的权重矩阵

然后我们获得自我注意力权重
其中
f

softmax
函数,是缩放因子,因此上下文向量可以计算为:然后我们获得聚合注意权重该权重关注关键实体,例如可能存在欺诈的高价药物或异常就诊情况

其中是可学习的权重矩阵

最后,对于每个实体向量最后,对于每个实体向量的全局表示为:网络中的内模态级别

跨模态级别和时间级别融合都是基于通用聚合器实现的
。5.
根据权利要求3所述的一种基于对比学习和解耦图神经的欺诈检测和信用评估方法,其特征在于建立异质多模态融合模块的步骤如下:异质多模态融合模块模块是网络的核心部分,采用层次化的融合结构:内模态级别

跨模态级别和时间级别融合

该模块旨在对索赔人
p
的所有就诊中不同模态的实体进行全局融合

在内模态级别融合中,我们使用设计的通用聚合器
(UAG)
来融合医疗保健实体的表示向量:其中指的是索赔人
p
在时间
t
的就诊中医疗保健实体的表示向量,是医疗保健实体的医学语义嵌入

接下来,在跨模态级别融合中,我们使用潜在映射矩阵接下来,在跨模态级别融合中,我们使用潜在映射矩阵和将不同模态实体的表示向量投影到相同的特征空间

然后,我们使用通用聚合器来融合来自医疗

空间和时间模态的实体的表示向量:其中,和分别表示科室

医院和时间实体的表示向量,
||
表示连接操作,是索赔人
p
在时间
t
的就诊的模态级别嵌入

最后,在时间级别融合中,对于索赔人
p
的所有就诊的全局语义表示向量我们使用一个标准的三层
LSTM
编码器结合通用聚合器来学习索赔人
p
的所有就诊的全局纵向表示向量的所有就诊的全局纵向表示向量的所有就诊的全局纵向表示向量其中,是的隐藏向量

特别地,为了学习每个就诊表示对索赔人
p
的重要性,我们使用上下文特征
χ
p
来计算通用聚合器的聚合注意权重其中其中
6.
根据权利要求3所述的一种基于记忆动态异构图和层次多模态融合的健康保险欺诈检测方法,其特征在于建立时间间隔模块的步骤如下:时间戳向量无法清楚地反映时间间隔信息,而时间间隔信息则反映了索赔人就诊的频率模式,有助于识别欺诈者

具体而言,本发明使用时间间隔编码器将时间间隔嵌入到连续的向量空间中,具体如下:其中和是可学习的参数矩阵,是索赔人
p

【专利技术属性】
技术研发人员:陈刚马治国
申请(专利权)人:杭州自旋科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1