图数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39241969 阅读:12 留言:0更新日期:2023-10-30 11:54
本申请实施例公开了一种图数据处理方法、装置、电子设备及存储介质,该图数据处理方法通过构建全零特征,当全零特征的特征维度的总和,与原始图数据的多种目标类别中其他类别的特征维度的总和相等时,将原始特征与全零特征融合得到目标特征,当全零特征的特征维度与多种目标类别的特征维度的总和相等时,通过将原始特征的特征元素写入至全零特征,同样得到目标特征,不同目标类别的图元素都能实现维度统一,最后将各个图元素的原始特征替换为对应的目标特征得到目标图数据,从而可靠、有效地将原始图数据转换为结构更加简单的目标图数据,降低了后续对原始图数据的处理难度,可广泛应用于图数据转换技术等技术领域。用于图数据转换技术等技术领域。用于图数据转换技术等技术领域。

【技术实现步骤摘要】
图数据处理方法、装置、电子设备及存储介质


[0001]本申请涉及图数据转换
,特别是涉及一种图数据处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能技术的发展,图神经网络作为一种新兴的机器学习技术,已经被广泛应用于许多领域。目前,实际应用中的图神经网路主要是异质图神经网络(Heterogeneous Graph Neural Network,HGN),常通过学习多个类别的节点或者边之间的复杂连接模式提高对异质图上结构和语义信息的理解,可以广泛用于推荐系统、社交网络挖掘、知识图谱表示学习等领域。
[0003]由于异质图含有多个类别的节点或者边,包含了更加丰富的信息,因此异质图的结构较为复杂,不同类别的节点或者边之间的关系不容易被捕捉到,从而提高了后续对异质图处理的难度。

技术实现思路

[0004]以下是对本申请详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0005]本申请实施例提供了一种图数据处理方法、装置、电子设备及存储介质,通过将原始图数据中各个图元素的原始特征替换为对应的目标特征,得到目标图数据,从而可靠、有效地将原始图数据转换为结构更加简单的目标图数据,降低了后续对原始图数据的处理难度。
[0006]一方面,本申请实施例提供了一种图数据处理方法,包括:
[0007]获取原始图数据中各个图元素的原始特征,其中,所述原始图数据包括多种目标类别的节点或者边,所述目标类别为节点的类别或者边的类别,所述图元素为多种所述目标类别中任意一种类别的节点或者边;
[0008]构建所述图元素对应的至少一个全零特征,其中,构建得到的所述全零特征的特征维度的总和,与多种所述目标类别中其他类别的特征维度的总和相等;
[0009]将所述原始特征与所述全零特征进行融合,得到目标特征,其中,所述目标特征的特征维度,与多种所述目标类别的特征维度的总和相等;
[0010]将各个所述图元素的所述原始特征替换为对应的所述目标特征,得到目标图数据。
[0011]另一方面,本申请实施例还提供了一种图数据处理装置,包括:
[0012]第一原始特征获取模块,用于获取原始图数据中各个图元素的原始特征,其中,所述原始图数据包括多种目标类别的节点或者边,所述目标类别为节点的类别或者边的类别,所述图元素为多种所述目标类别中任意一种类别的节点或者边;
[0013]第一全零特征构建模块,用于构建所述图元素对应的至少一个全零特征,其中,构
建得到的所述全零特征的特征维度的总和,与多种所述目标类别中其他类别的特征维度的总和相等;
[0014]第一目标特征生成模块,用于将所述原始特征与所述全零特征进行融合,得到目标特征,其中,所述目标特征的特征维度,与多种所述目标类别的特征维度的总和相等;
[0015]第一目标图数据生成模块,用于将各个所述图元素的所述原始特征替换为对应的所述目标特征,得到目标图数据。
[0016]进一步,上述第一目标特征生成模块具体用于:
[0017]计算所述原始特征与所述全零特征之间的笛卡尔积,得到目标特征;
[0018]或者,提取所述原始特征的各个第一特征元素以及所述全零特征的各个第二特征元素,根据所述第一特征元素构建第一元素集合,根据所述第二特征元素构建第二元素集合,根据所述第一元素集合和所述第二元素集合的并集得到目标元素集合,根据所述目标元素集合构建目标特征。
[0019]进一步,上述第一目标特征生成模块还用于:
[0020]当所述全零特征的数量为一个,且所述全零特征的特征维度,与多种所述目标类别中其他类别的特征维度的总和相等时,计算所述原始特征与所述全零特征之间的笛卡尔积,得到目标特征;
[0021]或者,当所述全零特征的数量为多个,且各个所述全零特征的特征维度,分别与多种所述目标类别中其他各种类别的特征维度相等时,确定所述原始特征与所有的所述全零特征之间的排列顺序,根据所述排列顺序计算所述原始特征与所有的所述全零特征之间的笛卡尔积,得到目标特征。
[0022]进一步,上述第一目标特征生成模块还用于:
[0023]获取所述原始图数据的类别列表,其中,所述类别列表用于存储各种所述目标类别;
[0024]将所述类别列表中的所述目标类别之间的排列顺序,作为所述原始特征与所有的所述全零特征之间的排列顺序。
[0025]进一步,上述第一全零特征构建模块具体用于:
[0026]当所述原始特征和所述全零特征均为列向量时,对所述原始特征进行转置,将转置后的原始特征作为所述图元素当前的原始特征;
[0027]对所述全零特征进行转置,将转置后的所述全零特征作为所述原始特征当前对应的全零特征。
[0028]进一步,上述第一全零特征构建模块还用于:
[0029]获取多个参考图元素的第一特征,分别对所述第一特征进行特征元素置零,得到所述图元素对应的多个全零特征,其中,各个所述参考图元素分别为所述目标类别中其他各种类别任意一个图元素;
[0030]或者,根据多种所述目标类别中其他各种类别的特征维度,分别构建所述图元素对应的多个全零特征;
[0031]或者,获取多个参考图元素的第一特征,计算多个所述第一特征的笛卡尔积,得到第二特征,对所述第二特征进行特征元素置零,得到所述图元素对应的一个全零特征,其中,各个所述参考图元素分别为所述目标类别中其他各种类别的任意一个图元素;
[0032]或者,根据多种所述目标类别中其他各种类别的特征维度的总和,构建所述图元素对应的一个全零特征。
[0033]进一步,上述第一目标图数据生成模块具体用于:
[0034]将各个所述图元素的所述目标特征进行拼接,得到拼接特征矩阵;
[0035]获取所述目标图数据的目标邻接矩阵;
[0036]基于预先训练好的同质图神经网络模型,对所述拼接特征矩阵和所述目标邻接矩阵进行处理,得到目标处理结果。
[0037]进一步,所述目标处理结果为所述图元素的目标分类结果,上述第一目标图数据生成模块还用于:
[0038]基于所述目标邻接矩阵对所述拼接特征矩阵进行多次的卷积处理,得到嵌入特征,其中,前一次卷积处理的输出经过激活处理后作为下一次卷积处理的输入;
[0039]对所述嵌入特征进行全连接处理,得到全连接特征;
[0040]对所述全连接特征进行归一化处理,得到所述目标分类结果。
[0041]进一步,上述图数据处理装置还设置有训练模块,上述训练模块具体用于:
[0042]获取样本图数据,提取所述样本图数据的样本特征矩阵和样本邻接矩阵,其中,所述样本图数据携带有样本图数据中的图元素对应的类别标签;
[0043]基于所述同质图神经网络模型对所述拼接特征矩阵和所述邻接矩阵进行处理,得到样本分类结果;
[0044]根据所述样本分类结果和所述类别标签确定分类损失,根据所述分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图数据处理方法,其特征在于,包括:获取原始图数据中各个图元素的原始特征,其中,所述原始图数据包括多种目标类别的节点或者边,所述目标类别为节点的类别或者边的类别,所述图元素为多种所述目标类别中任意一种类别的节点或者边;构建所述图元素对应的至少一个全零特征,其中,构建得到的所述全零特征的特征维度的总和,与多种所述目标类别中其他类别的特征维度的总和相等;将所述原始特征与所述全零特征进行融合,得到目标特征,其中,所述目标特征的特征维度,与多种所述目标类别的特征维度的总和相等;将各个所述图元素的所述原始特征替换为对应的所述目标特征,得到目标图数据。2.根据权利要求1所述的图数据处理方法,其特征在于,所述将所述原始特征与所述全零特征进行融合,得到目标特征,包括计算所述原始特征与所述全零特征之间的笛卡尔积,得到目标特征;或者,提取所述原始特征的各个第一特征元素以及所述全零特征的各个第二特征元素,根据所述第一特征元素构建第一元素集合,根据所述第二特征元素构建第二元素集合,根据所述第一元素集合和所述第二元素集合的并集得到目标元素集合,根据所述目标元素集合构建目标特征。3.根据权利要求2所述的图数据处理方法,其特征在于,所述计算所述原始特征与所述全零特征之间的笛卡尔积,得到目标特征,包括:当所述全零特征的数量为一个,且所述全零特征的特征维度,与多种所述目标类别中其他类别的特征维度的总和相等时,计算所述原始特征与所述全零特征之间的笛卡尔积,得到目标特征;或者,当所述全零特征的数量为多个,且各个所述全零特征的特征维度,分别与多种所述目标类别中其他各种类别的特征维度相等时,确定所述原始特征与所有的所述全零特征之间的排列顺序,根据所述排列顺序计算所述原始特征与所有的所述全零特征之间的笛卡尔积,得到目标特征。4.根据权利要求3所述的图数据处理方法,其特征在于,所述确定所述原始特征与所有的所述全零特征之间的排列顺序,包括:获取所述原始图数据的类别列表,其中,所述类别列表用于存储各种所述目标类别;将所述类别列表中的所述目标类别之间的排列顺序,作为所述原始特征与所有的所述全零特征之间的排列顺序。5.根据权利要求2所述的图数据处理方法,其特征在于,所述计算所述原始特征与所述全零特征之间的笛卡尔积,得到目标特征之前,所述图数据处理方法还包括:当所述原始特征和所述全零特征均为列向量时,对所述原始特征进行转置,将转置后的原始特征作为所述图元素当前的原始特征;对所述全零特征进行转置,将转置后的所述全零特征作为所述原始特征当前对应的全零特征。6.根据权利要求1所述的图数据处理方法,其特征在于,所述构建所述图元素对应的至少一个全零特征,包括:获取多个参考图元素的第一特征,分别对所述第一特征进行特征元素置零,得到所述
图元素对应的多个全零特征,其中,各个所述参考图元素分别为所述目标类别中其他各种类别任意一个图元素;或者,根据多种所述目标类别中其他各种类别的特征维度,分别构建所述图元素对应的多个全零特征;或者,获取多个参考图元素的第一特征,计算多个所述第一特征的笛卡尔积,得到第二特征,对所述第二特征进行特征元素置零,得到所述图元素对应的一个全零特征,其中,各个所述参考图元素分别为所述目标类别中其他各种类别的任意一个图元素;或者,根据多种所述目标类别中其他各种类别的特征维度的总和,构建所述图元素对应的一个全零特征。7.根据权利要求1至6任意一项所述的图数据处理方法,其特征在于,所述图数据处理方法还包括:将各个所述图元素的所述目标特征进行拼接,得到拼接特征矩阵;获取所述目标图数据的目标邻接矩阵;基于预先训练好的同质图神经网络模型,对所述拼接特征矩阵和所述目标邻接矩阵进行处理,得到目标处理结果。8.根据权利要求7所述的图数据处理方法,其特征在于,所述目标处理结果为所述图元素的目标分类结果,所述对所述拼接特征矩阵和所述目标邻接矩阵进行处理,得到目标处理结果,包括:基于所述目标邻接矩阵对所述拼接特征矩阵进行多次的卷积处理,得到嵌入特征,其中,前一次卷积处理的输出经过激活处理后作为下一次卷积处理的输入;对所述嵌入特征进行全连接处理,得到全连接特征;对所述全连接特征进行归一化处理,得到所述目标分类结果...

【专利技术属性】
技术研发人员:黄自豪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1