异常数据的识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39411437 阅读:33 留言:0更新日期:2023-11-19 16:03
本申请公开了一种异常数据的识别方法、装置、电子设备、计算机可读存储介质以及计算机程序产品。该方法包括:确定待识别消费数据的第一属性矩阵和第一结构矩阵;对第一属性矩阵和第一结构矩阵分别进行重构,得到第二属性矩阵以及第二结构矩阵;根据第一属性矩阵、第二属性矩阵、第一结构矩阵以及第二结构矩阵,确定每个节点的重构误差;根据每个节点的重构误差,确定异常数据。在本申请中,通过第一结构矩阵和第一属性矩阵,可以更准确的反映消费数据本身的属性信息以及节点之间的关联关系,使得根据第一属性矩阵、第二属性矩阵、第一结构矩阵以及第二结构矩阵,确定重构误差时,重构误差具有较高的准确率,进而提高了异常数据的识别准确性。别准确性。别准确性。

【技术实现步骤摘要】
异常数据的识别方法、装置、电子设备及存储介质


[0001]本申请涉及互联网信息处理
,更具体地,涉及一种异常数据的识别方法、装置、电子设备以及计算机可读存储介质。

技术介绍

[0002]随着人们消费行为的越加频繁,消费数据的数据量也在急速增长。在消费数据中可能存在着一些异常数据,例如欺诈消费数据和伪造消费数据等。当根据包括异常数据的消费数据对用户消费行为分析时,难以获得准确的消费行为分析结果。因此,需要对消费数据进行异常数据的分析。
[0003]目前,可以对神经网络模型进行训练,得到训练后的数据识别模型,然后通过识别模型对消费数据进行识别,以识别出异常的消费数据。但是,采用这种方式,难以准确的识别出异常数据。

技术实现思路

[0004]有鉴于此,本申请实施例提出了一种异常数据的识别方法、装置、电子设备以及计算机可读存储介质,能够准确的识别异常数据。
[0005]第一方面,本申请实施例提供了一种异常数据的识别方法,方法包括:获取待识别消费数据,所述待识别消费数据包括多个节点各自的数据;确定对应所述待识别消费数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种异常数据的识别方法,其特征在于,所述方法包括:获取待识别消费数据,所述待识别消费数据包括多个节点各自的数据;确定对应所述待识别消费数据的第一属性矩阵和第一结构矩阵,所述第一属性矩阵包括所述待识别消费数据中每个数据对应的特征值,所述第一结构矩阵包括表征任意两个所述节点之间的关联关系的特征值;对所述第一属性矩阵和所述第一结构矩阵分别进行重构,得到对应所述第一属性矩阵的第二属性矩阵以及对应所述第一结构矩阵的第二结构矩阵;根据所述第一属性矩阵、所述第二属性矩阵、所述第一结构矩阵以及所述第二结构矩阵,确定每个所述节点的重构误差;根据每个所述节点的重构误差,确定所述待识别消费数据中的异常数据。2.根据权利要求1所述的方法,其特征在于,通过消费数据识别模型对所述第一属性矩阵和所述第一结构矩阵分别进行重构,所述消费数据识别模型的训练方法包括:获取样本消费数据,所述样本消费数据包括多个样本节点各自对应的数据;确定对应所述样本消费数据的第三属性矩阵以及第三结构矩阵,所述第三属性矩阵包括所述样本消费数据中每个数据对应的特征值,所述第三结构矩阵包括表征任意两个所述样本节点之间的关联关系的特征值;通过初始模型中的编码器对所述第三属性矩阵和所述第三结构矩阵进行编码,得到编码后的特征隐藏表示;通过所述初始模型中的解码器对所述特征隐藏表示进行解码,得到对应所述第三属性矩阵的第四属性矩阵以及对应所述第三结构矩阵的第四结构矩阵;根据所述第三属性矩阵、所述第四属性矩阵、所述第三结构矩阵以及所述第四结构矩阵,对所述初始模型进行训练,得到所述消费数据识别模型。3.根据权利要求2所述的方法,其特征在于,所述确定对应所述样本消费数据的第三属性矩阵,包括:根据所述样本消费数据中数值属性的数据,构建数值属性矩阵;根据所述样本消费数据中类别属性的数据,构建类别属性矩阵;对所述数值属性矩阵和所述类别属性矩阵进行融合,得到所述第三属性矩阵。4.根据权利要求3所述的方法,其特征在于,所述根据所述样本消费数据中类别属性的数据,构建类别属性矩阵,包括:根据所述样本消费数据中类别属性的数据,得到类别矩阵;通过多层感知机制将所述类别矩阵映射为嵌入矩阵;对每条所述样本消费数据中类别属性的数据进行编码,得到目标向量;将所述目标向量与所述嵌入矩阵相乘,得到每条所述样本消费数据的类别向量;对各个所述样本消费数据各自对应的类别向量进行聚合操作,得到所述类别属性矩阵。5.根据权利要求2所述的方法,其特征在于,所述确定对应所述样本消费数据的第三结构矩阵,包括:在属于同一条样本消费数据的样本节点之间建立边,得到异质图;根据所述异质图,构建所述第三结构矩阵。
6.根据权利要求2所述的方法,其特征在于,所述通过初始模型中的编码器对所述第三属性矩阵和所述第三结构矩阵进行编码,得到编码后的特征隐藏表示,包括:根据所述第三结构矩阵,从所述多个样本节点中确定彼此具有关联关系的第一关联节点;从所述第三属性矩阵中获取所述第一关联节点对应的特征值;通过权重矩阵对各个所述第一关联节点的特征值进行拼接,得到拼接结果;根据所述拼接结果、所述权重矩阵以及所述第三属性矩阵,得到所述特征隐藏表示。7.根据权利要求6所述的方法,其特征在于,所述根据所述拼接结果、所述权重矩阵以及所述第三属性矩阵,得到所述特征隐藏表示,包括:通过目标映射函数对所述拼接结果进行处理,得到所述第一关联节点的权重关系;根据每个所述样本节点的度,构建转移矩阵;根据所述转移矩阵以及预置的相邻阶数,得到邻接矩阵;根据所述邻接矩阵以及所述权重关系,通过注意力机制计算注意力系数;通过所述注意力系数以及所述权重矩阵,对所述第三属性矩阵中各个特征值进行处理,得到所述特征隐藏表示。8.根...

【专利技术属性】
技术研发人员:程大伟马嘉成李晓雯叶志豪赵瑞辉多慧娟郑建光郑冶枫
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1