一种数据处理方法、装置、设备以及可读存储介质制造方法及图纸

技术编号:37994498 阅读:18 留言:0更新日期:2023-06-30 10:08
本申请公开了一种数据处理方法、装置、设备以及可读存储介质,方法包括:基于检测对象集合中每个检测对象分别在业务中的业务属性特征,构建对象关系图;在图自编解码器中确定每个业务属性特征分别对应的聚合表示特征,以及对象关系图对应的重构关系图;将每个聚合表示特征进行特征聚类处理得到类簇分布结果,基于类簇分布结果、重构关系图以及对象关系图,对图自编解码器进行优化;在优化得到的优化图自编解码器中输出每个业务属性特征分别对应的优化聚合表示特征;将每个优化聚合表示特征进行特征聚类处理;基于特征聚类处理得到的优化类簇分布结果识别异常对象群体。采用本申请,可以在异常对象群体的检测业务中,减少检测成本,提升检测效率。提升检测效率。提升检测效率。

【技术实现步骤摘要】
一种数据处理方法、装置、设备以及可读存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、装置、设备以及可读存储介质。

技术介绍

[0002]目前,在不同领域(如金融领域、医保领域)中,由于领域中的监管体系不健全、约束机制不完善等原因,使得各个领域中异常行为频发。例如,在医保领域中,部分参保对象或组织机构在参加医疗保险、享受医疗保险待遇的过程中,存在弄虚作假、异常消费、虚假报销等异常行为。
[0003]为了减少各个领域中异常行为发生的频率,相关检查组织会花费大量的人力和时间去对海量对象进行过滤和排查,以查找在各个领域中发生了异常行为的异常对象。通常情况下,对于不同领域中的异常行为往往是由不同的对象组织参与的,即不同的成员会组成一个对象群体来执行异常行为,这将为检查组织在排查异常对象时带来很高的难度,检查组织需要检测出同一个异常行为所涉及到的每个成员,以最终检测出发生异常行为的对象群体。目前,对于发生异常行为的对象群体的检测,主要是基于某个已检测出的异常对象,来逐一排查其他对象是否与该异常对象存在关联,从而来逐一排查得本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:基于检测对象集合中,每个检测对象分别在业务中的业务属性特征,构建以所述每个检测对象为对象节点的对象关系图;调用图自编解码器,在所述图自编解码器中,基于所述对象关系图中对象节点之间的连接关系,确定所述每个业务属性特征分别对应的聚合表示特征,以及所述对象关系图对应的重构关系图;将每个聚合表示特征进行特征聚类处理,得到所述检测对象集合对应的类簇分布结果;基于所述类簇分布结果、所述重构关系图以及所述对象关系图,对所述图自编解码器进行优化,得到优化图自编解码器;在所述优化图自编解码器中,基于所述对象关系图中对象节点之间的连接关系,输出所述每个业务属性特征分别对应的优化聚合表示特征;将每个优化聚合表示特征进行特征聚类处理,得到所述检测对象集合对应的优化类簇分布结果;基于所述优化类簇分布结果识别所述检测对象集合中的异常对象群体。2.根据权利要求1所述的方法,其特征在于,所述检测对象集合包含检测对象S
i
,所述每个检测对象分别在业务中的业务属性特征,包含所述检测对象S
i
在所述业务中的业务属性特征T
i
;i为正整数;所述基于检测对象集合中,每个检测对象分别在业务中的业务属性特征,构建以所述每个检测对象为对象节点的对象关系图,包括:构建所述检测对象集合中,每个检测对象分别对应的对象节点,得到对象节点集合;基于所述业务属性特征T
i
,以及剩余检测对象在所述业务中的业务属性特征,在所述检测对象集合中确定所述检测对象S
i
对应的关联对象;所述剩余检测对象是指所述检测对象集合中,除所述检测对象S
i
以外的检测对象;将所述检测对象S
i
对应的对象节点,确定为目标对象节点,将所述检测对象S
i
对应的关联对象所对应的对象节点,确定为关联对象节点;在所述目标对象节点与所述关联对象节点之间构建连接边,得到所述目标对象节点对应的关联边;当确定出所述对象节点集合中,每个对象节点分别对应的关联边时,将包含所述对象节点集合以及所述每个对象节点分别对应的关联边的结构图,确定为所述对象关系图。3.根据权利要求2所述的方法,其特征在于,所述剩余检测对象的数量为M个;M为正整数;所述基于所述业务属性特征T
i
,以及剩余检测对象在所述业务中的业务属性特征,在所述检测对象集合中确定所述检测对象S
i
对应的关联对象,包括:将M个剩余检测对象中,每个剩余检测对象在所述业务中的业务属性特征,均确定为剩余业务属性特征;确定所述业务属性特征T
i
与每个剩余业务属性特征之间的特征相似度,得到M个特征相似度;将M个特征相似度中大于相似度阈值的特征相似度,确定为目标特征相似度,将所述目
标特征相似度对应的剩余业务属性特征确定为所述相似业务属性特征;将所述检测对象集合中的所述相似业务属性特征所对应的剩余检测对象,确定为所述检测对象S
i
对应的关联对象。4.根据权利要求3所述的方法,其特征在于,M个剩余业务属性特征中包含剩余业务属性特征T
j
,所述M个特征相似度包含所述剩余业务属性特征T
j
与所述业务属性特征T
i
之间的特征相似度,j为正整数;所述每个业务属性特征包含业务参与时刻;所述确定所述业务属性特征T
i
与每个剩余业务属性特征之间的特征相似度,得到M个特征相似度,包括:将所述业务属性特征T
i
所包含的业务参与时刻,确定为第一参与时刻,将所述剩余业务属性特征T
j
所包含的业务参与时刻,确定为第二参与时刻;确定所述第一参与时刻与所述第二参与时刻之间的间隔时长;获取时长映射表;所述时长映射表包含配置时间区间集合与配置相似度集合之间的映射关系;所述配置时间区间集合中的一个配置时长区间,与所述配置相似度集合中的一个配置相似度之间具有映射关系;将所述配置时长区间集合中,所述间隔时长所属的配置时长区间确定为目标时长区间,将所述配置相似度集合中,与所述目标时长区间之间具有映射关系的配置相似度,确定为所述剩余业务属性特征T
j
与所述业务属性特征T
i
之间的特征相似度。5.根据权利要求1所述的方法,其特征在于,所述图自编解码器包含图编码器与图解码器;所述在所述图自编解码器中,基于所述对象关系图中对象节点之间的连接关系,确定所述每个业务属性特征分别对应的聚合表示特征,以及所述对象关系图对应的重构关系图,包括:调用所述图自编解码器中的所述图编码器,在所述图编码器中,通过所述对象关系图中对象节点之间的连接关系,对所述每个业务属性特征分别进行编码处理,得到所述每个业务属性特征分别对应的聚合表示特征;调用所述图自编解码器中的所述图解码器,在所述图解码器中,基于所述每个业务属性特征分别对应的聚合表示特征,对所述对象关系图中对象节点之间的连接关系进行重构,得到所述重构关系图。6.根据权利要求5所述的方法,其特征在于,所述检测对象集合包含检测对象S
i
,所述每个检测对象分别在业务中的业务属性特征,包含所述检测对象S
i
在所述业务中的业务属性特征T
i
;i为正整数;所述在所述图编码器中,通过所述对象关系图中对象节点之间的连接关系,对所述每个业务属性特征分别进行编码处理,得到所述每个业务属性特征分别对应的聚合表示特征,包括:在所述图编码器中,将所述检测对象S
i
对应的对象节点确定为目标对象节点,将所述对象关系图中与所述目标对象节点之间存在连接关系的对象节点,确定为所述目标对象节点的邻接节点;将所述邻接节点对应的邻接业务属性特征,与所述业务属性特征T
i
进行编码融合处理,得到所述业务属性特征T
i
对应的聚合表示特征;所述邻接节点对应的邻接业务属性特征,
是指所述邻接节点对应的检测对象在业务中的业务属性特征。7.根据权利要求6所述的方法,其特征在于,所述将所述邻接节点对应的邻接业务属性特征,与所述业务属性特征T
i
进行编码融合处理,得到所述业务属性特征T
i
对应的聚合表示特征,包括:获取所述对象关系图对应的关系邻接矩阵;所述关系邻接矩阵用于表征所述对象关系图中对象节点之间的连接关系;将所述关系邻接矩阵进行归一化处理,得到所述关系邻接矩阵对应的归一化邻接矩阵;获取所述图编码器中的编码参数矩阵,通过所述图编码器的逻辑运算函数,将所述关系邻接矩阵、所述业务属性特征T
i
、所述邻接业务...

【专利技术属性】
技术研发人员:欧阳逸
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1