【技术实现步骤摘要】
本公开涉及信息或数据挖掘领域,具体涉及一种图结构不平衡数据处理方法、装置、设备及介质。
技术介绍
1、图神经网络(graph neural network,gnn)作为一种图数据分析方法,近年来在节点分类、图分类等任务中取得了显著的成果。节点分类任务作为gnn的核心应用之一,其主要目标是根据节点的特征信息以及节点间的拓扑结构,预测每个节点所属的类别。然而,在许多实际应用中,图数据往往存在类不平衡的问题,即某些类别的节点数量远少于其他类别的节点,尤其是在长尾分布的数据中,少数类节点往往占据很小的比例,导致多数类节点主导了模型的训练过程,从而影响少数类节点的识别与分类。
技术实现思路
1、(一)要解决的技术问题
2、鉴于上述问题,本公开提供了一种图结构不平衡数据处理方法、装置、设备及介质,以至少部分解决由于样本数据无法准确反映实际数据的分布导致模型泛化能力下降、过拟合,以及分类的准确性和可靠性较低等技术问题。
3、(二)技术方案
4、本公开一方面提供了一种图
...【技术保护点】
1.一种图结构不平衡数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一数据集中的少数类节点,采用谱聚类算法生成虚拟中心节点包括:
3.根据权利要求1所述的方法,其特征在于,所述将所述虚拟中心节点与所述少数类节点进行混合,生成合成节点包括:
4.根据权利要求1所述的方法,其特征在于,所述采用信息传播机制,对所述合成节点进行特征传播,提取高阶节点信息包括:
5.根据权利要求1所述的方法,其特征在于,所述采用距离感知调节机制,调整不同类别间的决策边界包括:
6.根据权利要求
...【技术特征摘要】
1.一种图结构不平衡数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一数据集中的少数类节点,采用谱聚类算法生成虚拟中心节点包括:
3.根据权利要求1所述的方法,其特征在于,所述将所述虚拟中心节点与所述少数类节点进行混合,生成合成节点包括:
4.根据权利要求1所述的方法,其特征在于,所述采用信息传播机制,对所述合成节点进行特征传播,提取高阶节点信息包括:
5.根据权利要求1所述的方法,其特征在于,所述采用距离感知调节机制,调整不同类别间的决策边界包括:
6.根据权利要求5所述的方法,其特征在于,所述...
【专利技术属性】
技术研发人员:马玉鹏,任熠霄,周喜,王轶,韩云飞,胡伦,王保全,
申请(专利权)人:中国科学院新疆理化技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。