对象聚类模型的获取方法、对象聚类方法及装置制造方法及图纸

技术编号:33121113 阅读:14 留言:0更新日期:2022-04-17 00:20
本申请提供了一种对象聚类模型的获取方法、对象聚类方法及装置,涉及图数据处理技术领域,该方法包括:对于每个样本图数据包括的每个样本节点,以每个样本节点的原始特征向量和每个样本节点的邻居节点集合为对象聚类模型的输入,输出每个样本图数据的更新隐藏特征表示,根据每个样本图数据的更新隐藏特征表示、c个待学习聚类中心的均值向量、c个真实聚类中心的均值向量和每个样本图数据的图类别标签,计算共识损失函数,反向传播调整对象聚类模型的模型参数,以得到优化共识损失函数,根据与优化共识损失函数对应的对象聚类模型的目标模型参数,得到对象聚类模型。通过该方法得到的对象聚类模型可提高对象聚类的准确性。性。性。

【技术实现步骤摘要】
对象聚类模型的获取方法、对象聚类方法及装置


[0001]本申请实施例涉及图数据处理
,尤其涉及一种对象聚类模型的获取方法、对象聚类方法及装置。

技术介绍

[0002]聚类是按照某种特定标准将一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的相似性尽可能小。节点聚类任务在图学习领域已有较长时间的研究,并在社区检测、点云图像分割和社交网络用户画像等任务上具有广泛的应用。
[0003]目前的节点聚类方法中,一般是先计算节点之间的特征相似性或结构相似性,根据节点之间的特征相似性或结构相似性确定出各个聚类簇的聚类中心,针对每个聚类簇的聚类中心,将与聚类中心的相似性在预设范围内的节点归为该聚类中心对应的聚类簇,从而完成节点聚类。
[0004]然而,对于与多个聚类中心的相似性均在预设范围内的节点,上述方法难以区分出不同聚类簇的节点,因此聚类的准确性较低。

技术实现思路

[0005]本申请提供一种对象聚类模型的获取方法、对象聚类方法及装置,以提高对象聚类的准确性。
...

【技术保护点】

【技术特征摘要】
1.一种对象聚类模型的获取方法,其特征在于,包括:获取样本数据,所述样本数据包括K个样本图数据、所述每个样本图数据的图类别标签和所述K个样本图数据的c个真实聚类中心的均值向量,所述K、所述c均为正整数;对于所述每个样本图数据包括的每个样本节点,以所述每个样本节点的原始特征向量和所述每个样本节点的邻居节点集合为对象聚类模型的输入,输出所述每个样本图数据的更新隐藏特征表示;根据所述每个样本图数据的更新隐藏特征表示、c个待学习聚类中心的均值向量、所述c个真实聚类中心的均值向量和所述每个样本图数据的图类别标签,计算共识损失函数;反向传播调整所述对象聚类模型的模型参数,以得到优化共识损失函数,所述优化共识损失函数用于使所述每个样本图数据的更新隐藏特征表示与所述每个样本图数据的图类别标签对应的聚类中心的均值向量之间的相似度在预设范围内;根据与所述优化共识损失函数对应的所述对象聚类模型的目标模型参数,得到所述对象聚类模型。2.根据权利要求1所述的方法,其特征在于,所述对象聚类模型包括图神经网络模型、高斯混合层模型、图注意力池化层模型和层次图卷积神经网络模型。3.根据权利要求2所述的方法,其特征在于,所述以所述每个样本节点的原始特征向量和所述每个样本节点的邻居节点集合为所述对象聚类模型的输入,输出所述每个样本图数据的更新隐藏特征表示,包括:以所述每个样本节点的原始特征向量和所述每个样本节点的邻居节点集合为所述图神经网络模型的输入,输出所述每个样本节点的隐藏层向量表示;以所述每个样本节点的隐藏层向量表示和所述每个样本节点的所述待学习聚类中心的均值向量为所述高斯混合层模型的输入,输出所述每个样本节点的高斯混合隐藏向量表示,所述待学习聚类中心的均值向量为c个待学习聚类中心的均值向量中的一个;以所述每个样本图数据的高斯混合隐藏表示为所述图注意力池化层模型的输入,输出所述每个样本图数据的隐藏特征向量表示,所述每个样本图数据的高斯混合隐藏表示根据所述每个样本图数据包括的多个样本节点的高斯混合隐藏向量表示拼接得到;以所述K个样本图数据的隐藏特征表示为所述层次图卷积神经网络模型的输入,输出所述K个样本图数据的更新隐藏特征表示,所述K个样本图数据的隐藏特征表示根据所述K个样本图数据中所述每个样本图数据的隐藏特征向量拼接得到;根据所述K个样本图数据的更新隐藏特征表示得到所述每个样本图数据的更新隐藏特征表示。4.根据权利要求3所述的方法,其特征在于,所述图注意力池化层模型用于:根据所述每个样本图数据的高斯混合隐藏表示、第一层感知机的权重矩阵和第二层感知机的权重矩阵,确定所述每个样本图数据所包括的每个节点的节点注意力分数;以所述每个样本图数据所包括的每个样本节点的节点注意力分数作为权重将所述每个样本图数据的高斯混合隐藏表示加权求和,得到所述每个样本图数据的隐藏特征向量表示。5.根据权利要求4所述的方法,其特征在于,所述根据所述每个样本图数据的高斯混合隐藏表示、第一层感知机的权重矩阵和第二层感知机的权重矩阵,确定所述每个样本图数
据所包括的每个节点的节点注意力分数,包括:将所述第一层感知机的权重矩阵和所述每个样本图数据的高斯混合隐藏表示的转秩的积的正切反函数与所述第二层感知机的权重矩阵的积,确定为所述每个样本图数据所包括的每个样本节点的节点注意力分数。6.根据权利要求3所述的方法,其特征在于,所述层次图卷积神经网络模型用于:根据所述层次图卷积神经网络模型的层次l、层次图注意力系数矩阵α
hier
和目标参数β对所述K个样本图数据的隐藏特征表示进行更新,得到所述K个样本图数据的更新隐藏特征表示,所述l大于或等于2,所述层次图注意力系数矩阵α
hier
由注意力权重系数构成。7.根据权利要求6所述的方法,其特征在于,所述根据所述层次图卷积神经网络模型的层次l、层次图注意力系数矩阵α
hier
和目标参数β对所述K个样本图数据的隐藏特征表示进行更新,得到所述K个样本图数据的更新隐藏特征表示,包括:根据所述β对第一结果和第二结果进行加权求和,得到所述K个样本图数据的更新隐藏特征表示;其中,所述第一结果为所述α
hier
和第l

1层的所述K个样本图数据的更新隐藏特征表示的积,所述第二结果为所述K个样本图数据的隐藏特征表示。8.根据权利要求1所述的方法,其特征在于,所述根据所述每个样本图数据的更新隐藏特征表示、c个待学习聚类中心的均值向量、所述c个真实聚类中心的均值向量和所述每个样本图数据的图类别标签,计算共识损失函数,包括:根据所述K个样本图数据的更新隐藏特征表示、所述c个待学习聚类中心的均值向量和所述c个真实聚类中心的均值向量,确定所述K个样本图数据的更新隐藏特征表示与所述c个待学习聚类中心的均值向量之间的距离矩阵;归一化所述距离矩阵得到相似性矩阵;计算所述相似性矩阵和所述每个样本图数据的图类别标签之间的交叉熵,得到所述共识损失函数。9.根据权利要求8所述的方法,其特征在于,所述根据所述K个样本图数据的更新隐藏特征表示、所述c个待学习聚类中心的均值向量和所述c个真实聚类中心的均值向量,确定所述K个样本图数据的更新隐藏特征表示与所述c个待学习聚类中心的均值向量之间的距离矩阵,包括:对于每个...

【专利技术属性】
技术研发人员:卞天徐挺洋荣钰赵沛霖
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1