检测模型训练方法、异常检测方法及电子设备技术

技术编号:37227994 阅读:26 留言:0更新日期:2023-04-20 23:10
本申请实施例提供一种检测模型训练方法,包括:获取样本图结构对应的样本数据,其中,样本数据中包括各个节点的初始节点属性以及各个边的初始边属性。将初始节点属性输入至检测模型的编码单元中,以得到编码单元输出的第一特征向量,以及,将初始边属性输入至检测模型的编码单元中,以得到编码单元输出的第二特征向量。根据第一特征向量和第二特征向量重构样本图结构,并确定重构样本图结构所对应的重构误差。根据第一特征向量和第二特征向量确定样本图结构对应的语义信息,并根据语义信息确定样本图结构对应的语义误差。根据重构误差和语义误差,更新检测模型的模型参数。本申请的技术方案可以有效提升检测模型的异常检测效果。术方案可以有效提升检测模型的异常检测效果。术方案可以有效提升检测模型的异常检测效果。

【技术实现步骤摘要】
检测模型训练方法、异常检测方法及电子设备


[0001]本申请实施例涉及计算机技术,尤其涉及一种检测模型训练方法、异常检测方法及电子设备。

技术介绍

[0002]图(graph)是一种由节点和边构成的用于表示关系型数据的数据结构,针对图进行异常检测可以有效的发现异常对象。
[0003]目前现有技术中通常都是通过检测模型进行图异常检测,然而现有技术中在训练检测模型的时候,通常是训练检测模型基于节点信息进行节点的异常检测,或者训练检测模型基于边信息进行边的异常检测,也就是说仅仅利用部分图信息进行异常检测。
[0004]然而,仅仅依赖部分图信息进行异常检测,会导致异常检测的效果不佳。

技术实现思路

[0005]本申请实施例提供一种检测模型训练方法、异常检测方法及电子设备,以克服异常检测的效果不佳的问题。
[0006]第一方面,本申请实施例提供一种检测模型训练方法,包括:
[0007]获取样本图结构对应的样本数据,其中,所述样本数据中包括所述样本图结构中的各个节点的初始节点属性以及所述样本图结构中的各个边的初始边属性;
[0008]将所述初始节点属性输入至检测模型的编码单元中,以得到所述编码单元输出的第一特征向量,以及,将所述初始边属性输入至检测模型的编码单元中,以得到所述编码单元输出的第二特征向量;
[0009]根据所述第一特征向量和所述第二特征向量重构所述样本图结构,并确定重构所述样本图结构所对应的重构误差;
[0010]根据所述第一特征向量和所述第二特征向量确定所述样本图结构对应的语义信息,并根据所述语义信息确定所述样本图结构对应的语义误差;
[0011]根据所述重构误差和所述语义误差,更新所述检测模型的模型参数。
[0012]第二方面,本申请实施例提供一种异常检测方法,包括:
[0013]获取待检测的第一图结构的第一数据,其中,所述第一数据中包括所述第一图结构中的各个节点的初始节点属性以及所述第一图结构中的各个边的初始边属性;
[0014]将所述初始节点属性和所述初始边属性输入至检测模型中,以得到所述检测模型输出的所述第一图结构的目标误差,其中,所述检测模型为根据上述第一方面所述的方法训练得到的;
[0015]根据所述第一图结构的目标误差,确定所述第一图结构的检测结果,所述检测结果用于指示所述第一图结构是否存在异常。
[0016]第三方面,本申请实施例提供一种检测模型训练装置,包括:
[0017]获取模块,用于获取样本图结构对应的样本数据,其中,所述样本数据中包括所述
样本图结构中的各个节点的初始节点属性以及所述样本图结构中的各个边的初始边属性;
[0018]编码模块,用于将所述初始节点属性输入至检测模型的编码单元中,以得到所述编码单元输出的第一特征向量,以及,将所述初始边属性输入至检测模型的编码单元中,以得到所述编码单元输出的第二特征向量;
[0019]处理模块,用于根据所述第一特征向量和所述第二特征向量重构所述样本图结构,并确定重构所述样本图结构所对应的重构误差;
[0020]所述处理模块还用于,根据所述第一特征向量和所述第二特征向量确定所述样本图结构对应的语义信息,并根据所述语义信息确定所述样本图结构对应的语义误差;
[0021]更新模块,用于根据所述重构误差和所述语义误差,更新所述检测模型的模型参数。
[0022]在一种可能的设计中,所述处理模块具体用于:
[0023]根据所述样本图结构中的各个节点各自的第一特征向量和所述样本图结构中的各个边各自的第二特征向量进行融合处理,得到所述样本图结构对应的第三特征向量;
[0024]将所述第三特征向量输入至所述检测模型的解码单元中,所述解码单元用于根据所述第三特征向量重构所述样本图结构以得到重构图结构;
[0025]获取所述解码单元输出的重构图结构所对应的重构数据,所述重构数据中包括重构图结构中的各个节点的重构节点属性以及所述重构图结构所对应的重构邻接矩阵。
[0026]在一种可能的设计中,所述样本数据中还包括所述样本图结构所对应的初始邻接矩阵;
[0027]所述处理模块具体用于:
[0028]根据所述初始节点属性和所述重构节点属性,确定第一误差;
[0029]根据所述初始邻接矩阵和所述重构邻接矩阵,确定第二误差;
[0030]根据所述第一误差和所述第二误差,确定所述重构误差。
[0031]在一种可能的设计中,所述处理模块具体用于:
[0032]通过所述检测模型中的语义处理单元,拆分所述样本图结构,得到至少两个正样本子图结构;
[0033]根据所述第一特征向量和所述第二特征向量,确定各所述正样本子图结构各自对应的特征向量;
[0034]在预设节点集合中获取第一节点,并采用各所述第一节点分别替换各所述正样本子图结构中的各个节点,以得到负样本子图结构;
[0035]根据所述第二特征向量,确定各所述负样本子图结构各自对应的特征向量;
[0036]其中,所述样本图结构对应的语义信息包括各所述正样本子图结构各自对应的特征向量以及各所述负样本子图结构各自对应的特征向量。
[0037]在一种可能的设计中,所述处理模块具体用于:
[0038]针对任一个所述正样本子图结构,根据所述正样本子图结构中的各个节点各自的第一特征向量,以及所述正样本子图结构中的各个边各自的第二特征向量进行融合处理,得到所述正样本子图结构对应的特征向量。
[0039]在一种可能的设计中,所述处理模块具体用于:
[0040]针对任一个所述负样本子图结构,获取所述负样本子图结构中的各个第一节点各
自对应的第四特征向量;
[0041]根据所述负样本子图结构中的各个节点各自的第四特征向量,以及所述负样本子图结构中的各个边各自对应的第二特征向量进行融合处理,得到所述负样本子图结构对应的特征向量。
[0042]在一种可能的设计中,所述正样本子图结构中包括第一类别的正样本子图结构和第二类别的正样本子图结构;以及,所述负样本子图结构中包括第一类别的负样本子图结构和第二类别的负样本子图结构;
[0043]所述处理模块具体用于:
[0044]根据所述第一类别的正样本子图结构的特征向量和所述第二类别的正样本子图结构的特征向量,确定第三误差,所述第三误差与第一差异成正比,所述第一差异为所述第一类别的正样本子图结构的特征向量和所述第二类别的正样本子图结构的特征向量之间的差异;
[0045]根据所述第一类别的负样本子图结构的特征向量、所述第二类别的正样本子图结构的特征向量、所述第二类别的负样本子图结构的特征向量和所述第一类别的正样本子图结构的特征向量,确定第四误差,所述第四误差与第二差异和第三差异成反比,所述第二差异为所述第一类别的负样本子图结构的特征向量和所述第二类别的正样本子图结构的特征向量之间的差异,所述第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检测模型训练方法,其特征在于,包括:获取样本图结构对应的样本数据,其中,所述样本数据中包括所述样本图结构中的各个节点的初始节点属性以及所述样本图结构中的各个边的初始边属性;将所述初始节点属性输入至检测模型的编码单元中,以得到所述编码单元输出的第一特征向量,以及,将所述初始边属性输入至检测模型的编码单元中,以得到所述编码单元输出的第二特征向量;根据所述第一特征向量和所述第二特征向量重构所述样本图结构,并确定重构所述样本图结构所对应的重构误差;根据所述第一特征向量和所述第二特征向量确定所述样本图结构对应的语义信息,并根据所述语义信息确定所述样本图结构对应的语义误差;根据所述重构误差和所述语义误差,更新所述检测模型的模型参数。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征向量和所述第二特征向量重构所述样本图结构,包括:根据所述样本图结构中的各个节点各自的第一特征向量和所述样本图结构中的各个边各自的第二特征向量进行融合处理,得到所述样本图结构对应的第三特征向量;将所述第三特征向量输入至所述检测模型的解码单元中,所述解码单元用于根据所述第三特征向量重构所述样本图结构以得到重构图结构;获取所述解码单元输出的重构图结构所对应的重构数据,所述重构数据中包括重构图结构中的各个节点的重构节点属性以及所述重构图结构所对应的重构邻接矩阵。3.根据权利要求2所述的方法,其特征在于,所述样本数据中还包括所述样本图结构所对应的初始邻接矩阵;所述确定重构所述样本图结构所对应的重构误差,包括:根据所述初始节点属性和所述重构节点属性,确定第一误差;根据所述初始邻接矩阵和所述重构邻接矩阵,确定第二误差;根据所述第一误差和所述第二误差,确定所述重构误差。4.根据权利要求1

3任一项所述的方法,其特征在于,所述根据所述第一特征向量和所述第二特征向量确定所述样本图结构对应的语义信息,包括:通过所述检测模型中的语义处理单元,拆分所述样本图结构,得到至少两个正样本子图结构;根据所述第一特征向量和所述第二特征向量,确定各所述正样本子图结构各自对应的特征向量;在预设节点集合中获取第一节点,并采用各所述第一节点分别替换各所述正样本子图结构中的各个节点,以得到负样本子图结构;根据所述第二特征向量,确定各所述负样本子图结构各自对应的特征向量;其中,所述样本图结构对应的语义信息包括各所述正样本子图结构各自对应的特征向量以及各所述负样本子图结构各自对应的特征向量。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一特征向量和所述第二特征向量,确定各所述正样本子图结构各自对应的特征向量,包括:针对任一个所述正样本子图结构,根据所述正样本子图结构中的各个节点各自的第一
特征向量,以及所述正样本子图结构中的各个边各自的第二特征向量进行融合处理,得到所述正样本子图结构对应的特征向量。6.根据权利要求4所述的方法,其特征在于,所述根据所述第二特征向量,确定各所述负样本子图结构各自对应的特征向量,包括:针对任一个所述负样本子图结构,获取所述负样本子图结构中的各个第一节点各自对应的第四特征向量;根据所述负样本子图结构中的各个节点各自的第四特征向量,以及所述负样本子图结构中的各个边各自对应的第二特征向量进行融合处理,得到所述负样本子图结构对应的特征向量。7.根据权利要求4

6任一项所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:王国锐李元龙黄高攀
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1