【技术实现步骤摘要】
本专利技术属于复杂网络中节点分类领域,特别涉及一种基于伪标签去偏的引文网络中论文领域分类方法、装置及介质。
技术介绍
1、在对引文网络中论文研究领域分类问题上,lauscher等第一次提出将cnn应用于定性的引文分析领域,分别从引文的情感和引用目的两个方面进行分类。在模型结构方面,提出由词嵌入(word embedding)技术结合cnn分类模型以及svm分类模型结合进行引文分类性能对比实验。在模型设计中,词嵌入技术使用domain-specific word embeddings,即在训练词向量时使用与待分类引文文献领域背景相同或者相似的语料库,并与通用语料库中计算的词向量进行交叉对比,验证了domain-specific word embeddings技术的有效性。但在包含大量没有标签的信息的引文网络中,对论文的研究领域识别是比较困难的一件事,很多应用在引文网络中的分类方法往往会受初始数据集中类别分布不均匀影响,将别的稀缺标签的论文识别成分布大的类别,这样就造成对论文类别进行分类的误差,需要通过图对比学习减少这种误差。
...
【技术保护点】
1.一种基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(1)实现过程如下:
3.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(2)实现过程如下:
4.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(3)实现过程如下:
5.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(4)实现过程如下:
...【技术特征摘要】
1.一种基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(1)实现过程如下:
3.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(2)实现过程如下:
4.根据权利要求1所述的基于伪标签去偏的引文网络中论文领域分类方法,其特征在于,所述步骤(3)实现过程如下:
5.根据权利要求1所述的...
【专利技术属性】
技术研发人员:李哲,陈伯伦,杭专正,侯延东,刘晓娈,
申请(专利权)人:淮阴工学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。