【技术实现步骤摘要】
一种文献分类方法、一种图神经网络训练方法及相关组件
[0001]本专利技术涉及数据处理
,特别是涉及一种文献分类方法、一种图神经网络训练方法及相关组件。
技术介绍
[0002]在海量的文献数据库中,文献分类是实现精准文献检索、文献推荐和文献计量分析的关键前提和重要基础。文献分类技术还可以应用到问答系统、情感分析、信息检索等领域,以便辅助人们做出决策。
[0003]在自然语言处理技术不断发展的过程中,提出了各种监督式文献分类方法。例如,早期研究主要关注特征工程,从文献的题目、摘要、关键字以及正文中等提取特征,借助朴素贝叶斯、最近邻算法、支持向量机等传统机器学习算法构建文献分类器。尽管监督式文本分类研究取得不少进展,但是分类准确率仍然不高。
[0004]综上所述,如何有效地进行文献分类,提高分类的准确率,是目前本领域技术人员急需解决的技术问题。
技术实现思路
[0005]本专利技术的目的是提供一种文献分类方法、一种图神经网络训练方法及相关组件,以有效地进行文献分类,提高分类的准确率。 >[0006]为解决本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种图神经网络训练方法,其特征在于,包括:获取n篇文献作为一组训练样本,并将文献类别作为标签;对所述训练样本进行特征提取,得到特征提取结果;基于n篇文献之间的引用关系,确定出用于反映所述训练样本中的n篇文献之间的引用关系的第一信息;根据所述特征提取结果,确定出用于反映所述训练样本中的n篇文献之间的相似度的第二信息;将所述特征提取结果,所述第一信息以及所述第二信息输入至预设的图神经网络,得到所述图神经网络所输出的针对所述训练样本中的n篇文献的类别预测结果;基于所述类别预测结果更新所述图神经网络的参数,并返回执行所述获取n篇文献作为一组训练样本的操作,直到所述图神经网络训练完成;其中,n为不小于2的正整数。2.根据权利要求1所述的图神经网络训练方法,其特征在于,对所述训练样本进行特征提取,得到特征提取结果,包括:以深度学习的方式,对所述训练样本中的n篇文献的文献标题和/或文献摘要和/或文献关键字和/或文献正文进行特征提取,得到文献特征矩阵X,作为得到的特征提取结果。3.根据权利要求1所述的图神经网络训练方法,其特征在于,所述确定出用于反映所述训练样本中的n篇文献之间的引用关系的第一信息,包括:针对n篇文献中的每1篇文献,将剩余的n
‑
1篇文献中与所述文献之间存在引用关系的文献,作为所述文献的第一类邻居;根据各篇文献各自的第一类邻居,确定出用于反映所述训练样本中的n篇文献之间的引用关系的第一邻接矩阵E
T
,作为确定出的第一信息;其中,所述第一邻接矩阵E
T
为n行n列的矩阵,t
ij
表示所述第一邻接矩阵E
T
中的第i行第j列的数据,i和j均为正整数,1≤i,j≤n;当第j篇文献为第i篇文献的第一类邻居时,t
ij
=1;当第j篇文献不为第i篇文献的第一类邻居时,t
ij
=0。4.根据权利要求1所述的图神经网络训练方法,其特征在于,根据所述特征提取结果,确定出用于反映所述训练样本中的n篇文献之间的相似度的第二信息,包括:针对n篇文献中的每1篇文献,根据所述特征提取结果,计算出所述文献与剩余的n
‑
1篇文献之间各自的相似度,并将相似度最高的K篇文献作为所述文献的第二类邻居;根据各篇文献各自的第二类邻居,确定出用于反映所述训练样本中的n篇文献之间的相似度的第二邻接矩阵E
F
,作为确定出的第二信息;其中,所述第二邻接矩阵E
F
为n行n列的矩阵,e
ij
表示所述第二邻接矩阵E
F
中的第i行第j列的数据,i和j均为正整数,1≤i,j≤n;当第j篇文献为第i篇文献的第二类邻居时,和/或当第i篇文献为第j篇文献的第二类邻居时,e
ij
=1;当第j篇文献不为第i篇文献的第二类邻居,并且第i篇文献不为第j篇文献的第二类邻居时,e
ij
=0。5.根据权利要求4所述的图神经网络训练方法,其特征在于,针对n篇文献中的每1篇文献,根据所述特征提取结果,计算出所述文献与剩余的n
‑
1篇文献之间各自的相似度,包括:针对n篇文献中的每1篇文献,根据所述特征提取结果,按照
的计算方式,或者按照的计算方式,计算出所述文献与剩余的n
‑
1篇文献之间各自的相似度;其中,s
ij
表示的是n篇文献中的第i篇文献与第j篇文献之间的相似度,x
ik
表示的是第i篇文献的d个特征中的第k特征,x
jk
表示的是第j篇文献的d个特征中的第k特征,k为正整数且1≤k≤d,d为预先设定的特征总数量,p为设定参数。6.根据权利要求1所述的图神经网络训练方法,其特征在于,将所述特征提取结果,所述第一信息以及所述第二信息输入至预设的图神经网络,得到所述图神经网络所输出的针对所述训练样本中的n篇文献的类别预测结果,包括:将所述第一信息和所述特征提取结果输入至用于进行文献类别预测的第一图神经网络模块中;将所述第二信息和所述特征提取结果输入至用于进行文献类别预测的第二图神经网络模块中;根据所述第一图神经网络模块输出的第一类别预测结果,以及所述第二图神经网络模块输出的第二类别预测结果,确定出针对所述训练样本中的n篇文献的类别预测结果;其中,预设的所述图神经网络为双通道的图神经网络,包括所述第一图神经网络模块和所述第二图神经网络模块。7.根据权利要求6所述的图神经网络训练方法,其特征在于,所述第一图神经网络模块包括:用于接收所述第一信息和所述特征提取结果的输入层;用于进行顶点特征提取的L层图卷积层;L为不小于2的正整数;用于输出第一类别预测结果的输出层;其中,L层图卷积层中的每一层图卷积层均包括特征变换单元和图卷积单元,所述特征变换单元表示为,所述图卷积单元表示为 H
l+1
=σ(Ug
θ
U
T
Q
l
);H
l+1
表示的是L层图卷积层中的第l层图卷积层的输出数据,H
l
表示的是L层图卷积层中的第l层图卷积层的输入数据,l为正整数且1≤l≤L,Q
l
表示的是第l层图卷积层的特征变换单元的输出数据,表示的是第l层图卷积层的待学习的特征变换矩阵的转置矩阵,U表示的是对拉普
拉斯矩阵进行特征分解得到的特征向量所组成的矩阵,,D为n行n列的对角矩阵并且主对角线上的n个元素分别表示n篇文献各自的第一类邻居的数量,g
θ
表示的是待学习的谱域图卷积核,且g
θ
为n行n列的对角矩阵,σ表示的是激活函数,E
T
表示的是用于反映所述训练样本中的n篇文献之间的引用关系的第一邻接矩阵。8.根据权利要求7所述的图神经网络训练方法,其特征在于,针对任一图卷积单元,通过重参数化的方式,进行所述图卷积单元的输出的近似计算。9.根据权利要求8所述的图神经网络训练方法,其特征在于,针对任一图卷积单元,通过重参数化的方式,所述图卷积单元的输出的近似计算结果表示为:;其中,M表示的是多项式阶数,m为正整数且0≤m≤M,a0至a
M
为设定系数,I表示的是单位矩阵。10.根据权利要求7所述的图神经网络训练方法,其特征在于,所述第一图神经网络模块中的所述输出层表示为:;Z
T
表示的是所述输出层的输出,softmax表示的是设定的softmax函数,H
L+1
表示的是L层图卷积层中的第L层图卷积层的输出数据。11.根据权利要求6所述的图神经网络训练方法,其特征在于,根据所述第一图神经网...
【专利技术属性】
技术研发人员:胡克坤,曹其春,董刚,杨宏斌,
申请(专利权)人:浪潮电子信息产业股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。