一种基于自适应合成样本的不平衡节点分类方法技术

技术编号:42045640 阅读:25 留言:0更新日期:2024-07-16 23:28
本发明专利技术公开了一种基于自适应合成样本的不平衡节点分类方法,包括如下步骤:1)将数据集分为训练集和测试集,对训练集中的部分节点标注标签;2)引入邻接矩阵和扩散矩阵来获得两个视图A,S<supgt;PPR</supgt;;3)通过GraphSage块分别获取A,S<supgt;PPR</supgt;两个视图的嵌入表示Z<supgt;A</supgt;,Z<supgt;PPR</supgt;,连接Z<supgt;A</supgt;,Z<supgt;PPR</supgt;这两个视图得到混合图嵌入Z;4)将过采样方法扩展到多类不平衡问题上来合成少数类样本,然后将得到的新节点z<subgt;j</subgt;加入训练集得到最终嵌入;5)用内积编码器,生成新节点和原始节点之间的链接,得到重构的邻接矩阵;6)将最终嵌入和重构的邻接矩阵作为新的输入,重新训练节点分类器,最小化训练集的预测标签概率分布与真实标签之间的损失,并在测试集上检测分类效果。

【技术实现步骤摘要】

本专利技术涉及图神经网络分类,具体是一种基于自适应合成样本的不平衡节点分类方法


技术介绍

1、图表示学习在分类任务中起着至关重要的作用,这主要归功于图神经网络(graphneural networks,简称gnn)在获取图表示方面的突出能力。现有的gnn节点分类架构可以实现更优越的性能。然而,现有的大部分工作都是基于图中不同类之间节点分布近似平衡的假设。然而,这种平衡的数据集在现实中往往难以获得。例如,90-95%的在线社交网络用户由多数集群(良性帐户)组成,且只有一小部分的用户是少数集群(虚假账户)。面对节点分类中的类不平衡问题,算法在表示学习过程中可能表现出对多数类的偏向,这潜在地掩盖了少数类,因此将gnn应用于图上的不平衡节点分类是一个挑战。

2、事实上,类不平衡问题已经有了一定的发展,基本的数据级方法包括过采样方法和欠采样方法。欠采样方法通过减少多数类的样本数量来与少数类保持一致来解决这个问题。然而,这种方法不可避免地会导致信息的丢失。相反,过采样方法通过生成少量的样本来平衡样本数量,这样比较稳定。然而,由于图结构中独特的非欧几里得和本文档来自技高网...

【技术保护点】

1.一种基于自适应合成样本的不平衡节点分类方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于自适应合成样本的不平衡节点分类方法,其特征在于,所述步骤2)的具体过程为:

3.根据权利要求1所述的基于自适应合成样本的不平衡节点分类方法,其特征在于,所述步骤3)的具体过程为:

4.根据权利要求1所述的基于自适应合成样本的不平衡节点分类方法,其特征在于,所述步骤4)的具体过程为:

5.根据权利要求1所述的基于自适应合成样本的不平衡节点分类方法,其特征在于,所述步骤5)的具体过程为:

6.根据权利要求1所述的基于自适应合成样本...

【技术特征摘要】

1.一种基于自适应合成样本的不平衡节点分类方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于自适应合成样本的不平衡节点分类方法,其特征在于,所述步骤2)的具体过程为:

3.根据权利要求1所述的基于自适应合成样本的不平衡节点分类方法,其特征在于,所述步骤3)的具体过程为:

4.根据...

【专利技术属性】
技术研发人员:陈婉馨陆广泉文国秋张文振
申请(专利权)人:广西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1