当前位置: 首页 > 专利查询>淮阴工学院专利>正文

基于伪标签去偏的引文网络中论文领域分类方法、装置及介质制造方法及图纸

技术编号:41354485 阅读:16 留言:0更新日期:2024-05-20 10:06
本发明专利技术公开了一种基于伪标签去偏的引文网络中论文领域分类方法、装置及介质,所述方法为于图神经网络的编码器获取引文网络中每个视图的节点表示;基于半监督节点分类器为引文网络中未标注研究领域类别的数据分配的伪标签来选择负样本,建立对比学习任务;引入伪标签去偏法,处理引文网络数据集中论文研究领域类别分布的不均匀性问题;构建包括标签节点的分类损失、采样节点的对比损失以及自适应边界损失组合损失函数,对图神经网络进行优化,使其学到更具有判别性和泛化性的节点表示,实现对引文网络中的论文研究领域进行分类。本发明专利技术可以更好的应用于大量未标注标签的引文网络中,对引文网络中论文的研究领域的分类更准确高效。

【技术实现步骤摘要】

本专利技术属于复杂网络中节点分类领域,特别涉及一种基于伪标签去偏的引文网络中论文领域分类方法、装置及介质


技术介绍

1、在对引文网络中论文研究领域分类问题上,lauscher等第一次提出将cnn应用于定性的引文分析领域,分别从引文的情感和引用目的两个方面进行分类。在模型结构方面,提出由词嵌入(word embedding)技术结合cnn分类模型以及svm分类模型结合进行引文分类性能对比实验。在模型设计中,词嵌入技术使用domain-specific word embeddings,即在训练词向量时使用与待分类引文文献领域背景相同或者相似的语料库,并与通用语料库中计算的词向量进行交叉对比,验证了domain-specific word embeddings技术的有效性。但在包含大量没有标签的信息的引文网络中,对论文的研究领域识别是比较困难的一件事,很多应用在引文网络中的分类方法往往会受初始数据集中类别分布不均匀影响,将别的稀缺标签的论文识别成分布大的类别,这样就造成对论文类别进行分类的误差,需要通过图对比学习减少这种误差。

2、在节点级的对比学本文档来自技高网...

【技术保护点】

1.一种基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(1)实现过程如下:

3.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(2)实现过程如下:

4.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(3)实现过程如下:

5.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(4)实现过程如下:

6.根据权利要...

【技术特征摘要】

1.一种基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(1)实现过程如下:

3.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(2)实现过程如下:

4.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(3)实现过程如下:

5.根据权利要求1所述的...

【专利技术属性】
技术研发人员:李哲陈伯伦杭专正侯延东刘晓娈
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1