一种基于图卷积神经网络的文本分类方法、系统技术方案

技术编号:24331258 阅读:172 留言:0更新日期:2020-05-29 19:40
本发明专利技术通过图神经网络建模的方法,设计一种基于图卷积神经网络的文本分类方法、系统,其方法主要包括三个步骤:输入文本,相似性图的构建;深度学习模型的构建;由相似性图和深度学习模型构成文本分类方法总体模型,进行文本分类。通过上述方法,我们基于文本相似性图、图卷积网络和图注意力网络,提出了一种高效的文本分类方法,即只需要输入源文本,即能够自动对文本进行分类,并在模型的基础上结合硬件构成系统。

A text classification method and system based on graph convolution neural network

【技术实现步骤摘要】
一种基于图卷积神经网络的文本分类方法、系统
本专利技术涉及神经网络领域,尤其涉及一种基于图卷积神经网络的文本分类方法。
技术介绍
近来,已经有大量的研究集中在图结构的数据上,图是可以在很多方面使用的数据结构。图卷积网络(GCN)为我们提供了一种非常有效的方法来分析图结构数据。它是使用邻域信息的非常强大的模型,这种特殊卷积在研究中得到了广泛的应用。到目前为止,它已经在多个方面做了很多工作。最近的工作主要集中在以下四个方面:使用图形方法的社区检测、恶意软件检测、视频或图片中的对象或显着性检测,以及互联网安全。还有几个其他方面,例如计算机视觉和对社交网络的研究。在本次研究中,我们主要将这一模型应用于文本的分类。在本专利技术中,我们将简化图卷积网络和图注意力网络复合,在降低图卷积神经网络的计算消耗的同时利用图注意力网络提高分类的准确率,并且我们还基于图节点之间的相似性引入了一种新方法来构建图。然后,我们将该图导入网络中来完成文本分类。
技术实现思路
现有的文本分类算法的主要问题的文本表示是高维度高稀疏的,特征表达能力较弱,此本文档来自技高网...

【技术保护点】
1.一种基于图卷积神经网络的文本分类方法,其特征在于:包括:/n步骤一:输入文本,相似性图的构建。在一个含有多个文本的数据集中,每个文本都有一个包含基本特征关键词的多维元组。基于该文本数据集,构造邻接矩阵,将每个文本定义为一个节点,两个节点之间的边的存在性由这两个节点之间的相似性决定,如果相似度大于某一特定阈值,则在这些节点之间将生成一条边,以此对图中的节点类别进行预判并构建相似性图;/n步骤二:深度学习模型的构建,使用一种简化图卷积神经网络与一种图注意力神经网络,并结合Softmax函数实现;/n步骤三:由相似性图和深度学习模型构成文本分类方法总体模型,输出分类后的文本,其中所述文本分类方法...

【技术特征摘要】
1.一种基于图卷积神经网络的文本分类方法,其特征在于:包括:
步骤一:输入文本,相似性图的构建。在一个含有多个文本的数据集中,每个文本都有一个包含基本特征关键词的多维元组。基于该文本数据集,构造邻接矩阵,将每个文本定义为一个节点,两个节点之间的边的存在性由这两个节点之间的相似性决定,如果相似度大于某一特定阈值,则在这些节点之间将生成一条边,以此对图中的节点类别进行预判并构建相似性图;
步骤二:深度学习模型的构建,使用一种简化图卷积神经网络与一种图注意力神经网络,并结合Softmax函数实现;
步骤三:由相似性图和深度学习模型构成文本分类方法总体模型,输出分类后的文本,其中所述文本分类方法总体模型通过使用所述简化图卷积神经网络和所述图注意力网络并结合Softmax函数计算实现。


2.根据权利要求1所述的一种基于图卷积神经网络的文本分类方法,其特征在于:所述相似性图的构建步骤中,两个节点之间的相似性计算方式为:





3.根据权利要求2所述的一种基于图卷积神经网络的文本分类方法,其特征在于:所述两个节点之间的相似性计算方式中:
γ...

【专利技术属性】
技术研发人员:李建欣邵明来周佰聪孙佩源邰振赢
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1