模型参数的优化方法、时序数据的异常检测方法及装置制造方法及图纸

技术编号:35104406 阅读:61 留言:0更新日期:2022-10-01 17:13
本申请公开了一种模型参数优化方法,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。本申请包括:根据Ns个源域嵌入向量构建源域图神经网络;根对Ns个源域嵌入向量和源域检测网络的模型参数进行更新;根据源域样本数据和目标域样本数据生成属性相似度矩阵;根据属性相似度矩阵和更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量;根据Nt个目标域嵌入向量构建目标域图神经网络;对Nt个目标域嵌入向量和目标域检测网络的模型参数进行更新。本申请还提供了时序数据的异常检测方法及装置。本申请能够协同源域属性实现对目标域数据异常检测性能的提升。此外,在源域检测网络的基础上进行更新,能够进一步提升针对目标域的检测性能。的检测性能。的检测性能。

【技术实现步骤摘要】
模型参数的优化方法、时序数据的异常检测方法及装置


[0001]本申请涉及人工智能领域,尤其涉及一种模型参数的优化方法、时序数据的异常检测方法及装置。

技术介绍

[0002]多元时间序列(multivariate time series,MTS)分析是指对多变量时间序列的研究。许多问题不仅是观察单个过程,而且是同时观察多个过程。在多元时序数据中,异常值通常较少,如果需要得到较好的异常标注,通常需要对系统进行人为插入异常,这会导致标注成本较高。因此,无监督多元时序异常检测是一个极具现实与研究意义的问题。
[0003]目前,提出一种图偏差网络(graph deviation networks,GDN)用于实现多元时序的异常检测。GDN中引入图的概念,以多元时序数据构造图结构,各属性为节点,通过计算属性间嵌入向量的相似度产生连接关系。其构造未来时刻数值的预测任务,并将预测值与真实值的误差作为异常分以判别异常。
[0004]专利技术人发现现有方案中至少存在如下问题,多元时序异常检测系统通常会面临系统升级或跨平台部署的情况,也就是会出现从源域向目标域迁移的需求。然而,多元时序系统的升级过程通常会增加属性个数,这就导致了现有的方法无法直接使用源域训练好的模型直接应用于目标域,而需要在目标域上重新训练模型。针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种模型参数的优化方法、时序数据的异常检测方法及装置。本申请能够协同源域属性实现对目标域数据异常检测性能的提升。此外,在源域检测网络的基础上进行更新,能够进一步提升针对目标域的检测性能。
[0006]有鉴于此,本申请一方面提供一种模型参数的优化方法,包括:
[0007]获取源域样本数据以及目标域样本数据,其中,源域样本数据包括Ns个源域属性的时序数据,目标域样本数据包括Nt个目标域属性的时序数据,Ns与Nt均为大于1的整数;
[0008]根据Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,其中,源域嵌入向量与源域属性具有一一对应关系;
[0009]根据源域样本数据,对Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,其中,源域检测网络包括源域图神经网络;
[0010]根据源域样本数据以及目标域样本数据,生成属性相似度矩阵,其中,属性相似度矩阵用于描述每个源域属性与每个目标域属性之间的相似度;
[0011]根据属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,其中,目标域嵌入向量与目标域属性具有一一对应关系;
[0012]根据Nt个目标域嵌入向量,构建目标域图神经网络,其中,目标域图神经网络的模型参数采用源域图神经网络更新后的模型参数;
[0013]根据目标域样本数据,对Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,其中,目标域检测网络包括目标域图神经网络。
[0014]本申请另一方面提供一种模型参数的优化方法,包括:
[0015]获取待检测数据,其中,待检测数据包括Nt个目标域属性的时序数据,每个目标域属性的时序数据包括T个时刻的数据,Nt与T均为大于1的整数;
[0016]基于待检测数据,通过目标域检测网络获取目标时刻所对应的Nt个预测数据值,其中,目标域检测网络为采用上述权利要求1至13中任一项方法训练得到的;
[0017]获取目标时刻所对应的Nt个实际数据值;
[0018]根据Nt个实际数据值以及Nt个预测数据值,计算得到目标时刻所对应的异常分值;
[0019]若目标时刻所对应的异常分值大于或等于异常分值阈值,则确定目标时刻为数据异常时刻。
[0020]本申请另一方面提供一种参数优化装置,包括:
[0021]获取模块,用于获取源域样本数据以及目标域样本数据,其中,源域样本数据包括Ns个源域属性的时序数据,目标域样本数据包括Nt个目标域属性的时序数据,Ns与Nt均为大于1的整数;
[0022]构建模块,用于根据Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,其中,源域嵌入向量与源域属性具有一一对应关系;
[0023]训练模块,用于根据源域样本数据,对Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,其中,源域检测网络包括源域图神经网络;
[0024]生成模块,用于根据源域样本数据以及目标域样本数据,生成属性相似度矩阵,其中,属性相似度矩阵用于描述每个源域属性与每个目标域属性之间的相似度;
[0025]生成模块,还用于根据属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,其中,目标域嵌入向量与目标域属性具有一一对应关系;
[0026]构建模块,还用于根据Nt个目标域嵌入向量,构建目标域图神经网络,其中,目标域图神经网络的模型参数采用源域图神经网络更新后的模型参数;
[0027]训练模块,还用于根据目标域样本数据,对Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,其中,目标域检测网络包括目标域图神经网络。
[0028]在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
[0029]构建模块,具体用于针对每个源域属性,根据源域属性所对应的源域嵌入向量以及其余源域属性分别对应的源域嵌入向量,计算得到(Ns

1)个向量相似度,其中,其余源域属性为Ns个源域属性中除了源域属性之外剩余的(Ns

1)源域属性;
[0030]针对每个源域属性,从(Ns

1)个向量相似度中确定最大的Ks个向量相似度,其中,Ks为大于或等于1,且小于(Ns

1)的整数;
[0031]针对每个源域属性,根据最大的Ks个向量相似度,确定与源域属性具有连接关系的Ks个源域属性,其中,Ks个向量相似度中的向量相似度与Ks个源域属性中的源域属性具有一一对应关系;
[0032]根据每个源域属性以及与每个源域属性分别具有连接关系的Ks个源域属性,构建源域图结构,其中,源域图结构包括源域节点与源域连边,源域节点用于表征源域属性,源
域连边用于表征不同源域属性之间具有连接关系;
[0033]根据源域图结构以及Ns个源域嵌入向量,构建源域图神经网络。
[0034]在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
[0035]构建模块,具体用于针对每个目标域属性,根据目标域属性所对应的目标域嵌入向量以及其余目标域属性分别对应的目标域嵌入向量,计算得到(Nt

1)个向量相似度,其中,其余目标域属性为Nt个目标域属性中除了目标域属性之外剩余的(Nt

1)目标域属性;
[0036]针对每个目标域属性,从(Nt

1)个向量相似度中确定最大的Kt个向量相似度,其中,Kt为大于或等于1,且小于(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型参数的优化方法,其特征在于,包括:获取源域样本数据以及目标域样本数据,其中,所述源域样本数据包括Ns个源域属性的时序数据,所述目标域样本数据包括Nt个目标域属性的时序数据,所述Ns与所述Nt均为大于1的整数;根据所述Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,其中,所述源域嵌入向量与所述源域属性具有一一对应关系;根据所述源域样本数据,对所述Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,其中,所述源域检测网络包括所述源域图神经网络;根据所述源域样本数据以及所述目标域样本数据,生成属性相似度矩阵,其中,所述属性相似度矩阵用于描述每个源域属性与每个目标域属性之间的相似度;根据所述属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,其中,所述目标域嵌入向量与所述目标域属性具有一一对应关系;根据所述Nt个目标域嵌入向量,构建目标域图神经网络,其中,所述目标域图神经网络的模型参数采用所述源域图神经网络更新后的模型参数;根据所述目标域样本数据,对所述Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,其中,所述目标域检测网络包括所述目标域图神经网络。2.根据权利要求1所述的优化方法,其特征在于,所述根据所述Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,包括:针对所述每个源域属性,根据源域属性所对应的源域嵌入向量以及其余源域属性分别对应的源域嵌入向量,计算得到(Ns

1)个向量相似度,其中,所述其余源域属性为所述Ns个源域属性中除了所述源域属性之外剩余的(Ns

1)源域属性;针对所述每个源域属性,从所述(Ns

1)个向量相似度中确定最大的Ks个向量相似度,其中,所述Ks为大于或等于1,且小于所述(Ns

1)的整数;针对所述每个源域属性,根据所述最大的Ks个向量相似度,确定与所述源域属性具有连接关系的Ks个源域属性,其中,所述Ks个向量相似度中的向量相似度与所述Ks个源域属性中的源域属性具有一一对应关系;根据所述每个源域属性以及与所述每个源域属性分别具有连接关系的Ks个源域属性,构建源域图结构,其中,所述源域图结构包括源域节点与源域连边,所述源域节点用于表征源域属性,所述源域连边用于表征不同源域属性之间具有连接关系;根据所述源域图结构以及所述Ns个源域嵌入向量,构建所述源域图神经网络。3.根据权利要求1所述的优化方法,其特征在于,所述根据所述Nt个目标域嵌入向量,构建目标域图神经网络,包括:针对所述每个目标域属性,根据目标域属性所对应的目标域嵌入向量以及其余目标域属性分别对应的目标域嵌入向量,计算得到(Nt

1)个向量相似度,其中,所述其余目标域属性为所述Nt个目标域属性中除了所述目标域属性之外剩余的(Nt

1)目标域属性;针对所述每个目标域属性,从所述(Nt

1)个向量相似度中确定最大的Kt个向量相似度,其中,所述Kt为大于或等于1,且小于所述(Nt

1)的整数;针对所述每个目标域属性,根据所述最大的Kt个向量相似度,确定与所述目标域属性具有连接关系的Kt个目标域属性,其中,所述Kt个向量相似度中的向量相似度与所述Kt个
目标域属性中的目标域属性具有一一对应关系;根据所述每个目标域属性以及与所述每个目标域属性分别具有连接关系的Kt个目标域属性,构建目标域图结构,其中,所述目标域图结构包括目标域节点与目标域连边,所述目标域节点用于表征目标域属性,所述目标域连边用于表征不同目标域属性之间具有连接关系;根据所述目标域图结构以及所述Nt个目标域嵌入向量,构建所述目标域图神经网络。4.根据权利要求1所述的优化方法,其特征在于,所述根据所述源域样本数据,对所述Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,包括:基于所述源域样本数据,通过所述源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,其中,所述源域聚合特征向量与所述源域属性具有一一对应关系,所述源域图神经网络属于所述源域检测网络;基于所述Ns个源域聚合特征向量以及所述Ns个源域嵌入向量,通过所述源域检测网络所包括的第一全连接层获取所述第一时刻所对应的Ns个源域预测数据值,其中,所述源域预测数据值与所述源域属性具有一一对应关系;根据所述第一时刻所对应的所述Ns个源域预测数据值以及Ns个源域实际数据值,构建第一损失函数,其中,所述Ns个源域实际数据值来源于所述源域样本数据;基于所述第一损失函数,对所述Ns个源域嵌入向量进行更新;基于所述第一损失函数,对所述源域图神经网络的模型参数以及所述第一全连接层的模型参数进行更新。5.根据权利要求4所述的优化方法,其特征在于,所述基于所述源域样本数据,通过所述源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,包括:从所述源域样本数据中获取Ns个源域时序数据,其中,所述源域时序数据与所述源域属性具有一一对应关系,每个源域时序数据包括从第二时刻至第三时刻的时序数据,所述第二时刻为出现在所述第一时刻之前的一个时刻,所述第三时刻为所述第一时刻相邻的前一时刻;针对所述每个源域属性,根据所述源域图神经网络所对应的源域图结构,确定与所述源域属性具有连接关系的所述Ks个源域属性,其中,所述源域图神经网络属于所述源域检测网络,所述源域图结构包括源域节点与源域连边,所述源域节点用于表征源域属性,所述源域连边用于表征源域属性之间具有连接关系;针对所述每个源域属性,根据所述源域图神经网络的模型参数、源域属性所对应的源域时序数据以及Ks个源域属性中每个源域属性所对应的源域时序数据,获取所述第一时刻的源域聚合特征向量。6.根据权利要求4所述的优化方法,其特征在于,所述基于所述源域样本数据,通过所述源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,包括:从所述源域样本数据中获取Ns个源域时序数据,其中,所述源域时序数据与所述源域属性具有一一对应关系,每个源域时序数据包括从第二时刻至第三时刻的时序数据,所述第二时刻为出现在所述第一时刻之前的一个时刻,所述第三时刻为所述第一时刻相邻的前一时刻;针对所述每个源域属性,根据所述源域图神经网络所对应的源域图结构,确定与源域
属性具有连接关系的Ks个源域属性,其中,所述源域图神经网络属于所述源域检测网络,所述源域图结构包括源域节点与源域连边,所述源域节点用于表征源域属性,所述源域连边用于表征源域属性之间具有连接关系;针对所述每个源域属性,获取所述源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重;针对所述每个源域属性,根据所述源域图神经网络的模型参数、所述源域属性所对应的源域时序数据、所述源域属性所对应的聚合注意力权重、所述Ks个源域属性中每个源域属性所对应的源域时序数据以及所述Ks个源域属性中每个源域属性所对应的聚合注意力权重,获取所述第一时刻的源域聚合特征向量。7.根据权利要求6所述的优化方法,其特征在于,所述获取所述源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重,包括:根据所述源域图神经网络的模型参数、所述源域属性所对应的源域时序数据以及源域嵌入向量,获取所述源域属性所对应的时序拼接向量;根据所述源域图神经网络的模型参数、所述Ks个源域属性中每个源域属性所对应的源域时序数据以及源域嵌入向量,获取所述Ks个源域属性中每个源域属性所对应的时序拼接向量;根据所述源域属性所对应的时序拼接向量,获取所述源域属性所对应的源域中间向量;根据所述Ks个源域属性中每个源域属性所对应的时序拼接向量,获取所述Ks个源域属性中每个源域属性所对应的源域中间向量;根据所述源域属性所对应的源域中间向量以及所述Ks个源域属性中每个源域属性所对应的源域中间向量,获取所述源域属性所对应的聚合注意力权重以及所述Ks个源域属性中每个源域属性所对应的聚合注意力权重。8.根据权利要求1所述的优化方法,其特征在于,所述根据所述目标域样本数据,对所述Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,包括:基于所述目标域样本数据,通过所述目标域图神经网络获取第四时刻所对应的Nt个目标域聚合特征向量,其中,所述目标域聚合特征向量与所述目标域属性具有一一对应关系,所述目标域图神经网络属于所述目标域检测网络;基于所述Nt个目标域聚合特征向量以及所述Nt个目标域嵌入向量,通过所述目标域检测网络所包括的第二全连接层获取所述第四时刻所对应的Nt个目标域预测数据值,其中,所述目标域预测数据值与所述目标域属性具有一一对应关系;根据所述第四时刻所对应的所述Nt个目标域预测数据值以及Nt个目标域实际数据值,构建第二损失函数,其中,所述Nt个目标域实际数据值来源于所述目标域样本数据;基于所述第二损失函数,对所述Nt个目标域嵌入向量进行更新;基于所述第二损失函数,对所述目标域图神经网络的模型参数以及所述第二全连接层的模型参数进行更新。9.根据权利要求8所述的优化方法,其特征在于,所述基于所述目标域样本数据,通过所述目标域图神经网络获取第四时刻所对应的Nt个目标域聚合特征向量,包括:从所述目标域样本数据中获取Nt个目标域时序数据,其中,所述目标域时序数据与所
述目标域属性具有一一对应关系,每个目标域时序数据包括从第五时刻至第六时刻的时序数据,所述第五时刻为出现在所述第一时刻之前的一个时刻,所述第六时刻为所述第一时刻相邻的前一时刻;针对所述每个...

【专利技术属性】
技术研发人员:何轶凡卞亚涛周水庚
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1