基于轻量化图卷积网络的层次文本分类方法及系统技术方案

技术编号:42458200 阅读:45 留言:0更新日期:2024-08-21 12:47
本发明专利技术公开了基于轻量化图卷积网络的层次文本分类方法及系统,获取待分类的新闻正文文本数据,和新闻正文文本数据对应的带有层次结构的标签;将获取的数据,输入到训练后的文本分类网络中,输出文本分类结果;训练后的文本分类网络,采用第一BERT编码器对待分类的新闻正文文本数据进行编码处理,得到正文文本特征表示;采用轻量化图卷积网络对带有层次结构的标签进行特征提取,得到标签文本表示;采用注意力机制层对正文文本表示和标签文本表示进行处理,得到标签感知正样本;采用第二BERT编码器,对标签感知正样本进行处理,得到标签感知正样本表示;采用分类器,对正文文本特征表示和标签感知正样本表示进行分类,得到文本分类结果。

【技术实现步骤摘要】

本专利技术涉及机器学习和自然语言处理,特别是涉及基于轻量化图卷积网络的层次文本分类方法及系统


技术介绍

1、在自然语言处理(nlp)领域,文本分类是一项基本任务,它涉及将文本文档分配给一个或多个预定义的类别,对信息检索、内容组织、情感分析等多种应用至关重要。随着数字化信息的快速增长,尤其是在互联网和企业数据库中,高效且准确的文本分类技术需求日益增加。

2、层次文本分类是文本分类的一个特殊形式,它处理带有层次结构的标签。例如在新闻分类中,文章可以被分类为“体育”,进一步细分为“篮球”或“足球”。这种分类形式比传统的扁平分类更为复杂,因为它要求模型识别和理解标签之间的层级关系。

3、近年来,尽管深度学习技术已被广泛应用于文本分类任务中,并在许多场景下取得了显著成果,但层次文本分类方面仍面临多重挑战:

4、1.高计算成本:现有的深度学习模型,特别是基于图的神经网络,通常参数众多,需要大量的计算资源,这在处理大规模数据集时尤为明显。

5、2.模型复杂性:层次文本分类的复杂性要求模型能够捕捉并利用标签之间的层级关系,本文档来自技高网...

【技术保护点】

1.基于轻量化图卷积网络的层次文本分类方法,其特征是,包括:

2.如权利要求1所述的基于轻量化图卷积网络的层次文本分类方法,其特征是,将获取的数据,输入到训练后的文本分类网络中,输出文本分类结果,其中,训练后的文本分类网络,包括:

3.如权利要求1所述的基于轻量化图卷积网络的层次文本分类方法,其特征是,所述轻量化图卷积网络,网络结构包括:

4.如权利要求1所述的基于轻量化图卷积网络的层次文本分类方法,其特征是,采用轻量化图卷积网络,对带有层次结构的标签进行特征提取,得到标签文本表示,包括:

5.如权利要求1所述的基于轻量化图卷积网络的层次文...

【技术特征摘要】

1.基于轻量化图卷积网络的层次文本分类方法,其特征是,包括:

2.如权利要求1所述的基于轻量化图卷积网络的层次文本分类方法,其特征是,将获取的数据,输入到训练后的文本分类网络中,输出文本分类结果,其中,训练后的文本分类网络,包括:

3.如权利要求1所述的基于轻量化图卷积网络的层次文本分类方法,其特征是,所述轻量化图卷积网络,网络结构包括:

4.如权利要求1所述的基于轻量化图卷积网络的层次文本分类方法,其特征是,采用轻量化图卷积网络,对带有层次结构的标签进行特征提取,得到标签文本表示,包括:

5.如权利要求1所述的基于轻量化图卷积网络的层次文本分类方法,其特征是,采用轻量化图卷积网络,对带有层次结构的标签进行特征提取,得到标签文本表示,包括:跳跃链接机制...

【专利技术属性】
技术研发人员:吴晓明刘腾刘祥志侯冬冬满佳政董云峰
申请(专利权)人:山东省计算中心国家超级计算济南中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1