文本分类模型的训练方法、文本分类方法及相关设备技术

技术编号：34326187 阅读：18 留言：0更新日期：2022-07-31 01:11

本申请公开了一种文本分类模型的训练方法、文本分类方法及相关设备。所述训练方法包括：通过预训练分类网络基于第一关系图的特征信息对预测文档样本进行文本分类处理，得到第一分类参考信息，第一关系图包括训练文档样本对应的文档节点、预测文档样本对应的文档节点、各文档样本包含的词语对应的词节点以及节点之间的连接边；通过图神经网络基于第一关系图的特征信息及结构信息确定第一关系图的语义指导信息并基于语义指导信息、特征信息、结构信息以及训练文档样本对应的类别标签，对预测文档样本进行文本分类处理，得到第二分类参考信息；基于第一分类参考信息、第二分类参考信息及预测文档样本对应的类别标签，优化图神经网络的网络参数。经网络的网络参数。经网络的网络参数。

Training method, text classification method and related equipment of text classification model

全部详细技术资料下载

【技术实现步骤摘要】
文本分类模型的训练方法、文本分类方法及相关设备

[0001]本申请涉及计算机
，尤其涉及一种文本分类模型的训练、文本分类方法及相关设备。

技术介绍

[0002]文本分类任务是自然语言处理(Natural Language Processing，NLP)领域中的一个基本任务，能够广泛应用于电子商务、金融等相关业务中。
[0003]目前传统的文本分类任务都是基于采用基于卷积神经网络 (ConvolutionalNeural Network，CNN)和循环神经网络(Recurrent NeuralNetwork，RNN)等架构的文本分类模型，利用语料集对文本分类模型进行训练以使其具备执行分类任务的能力。但是，这类文本分类模型的性能欠佳，因而在训练过程中收敛速度较慢，并且训练得到的文本分类模型无法快速准确地进行文本分类。
[0004]因此，当前亟需一种能够提高文本分类模型的收敛速度和识别准确率的方案。

技术实现思路

[0005]本申请实施例提供一种文本分类模型的训练、文本分类方法及相关设备，用于提高文本分类模型的收敛速度和识别准确率。
[0006]为了实现上述目的，本申请实施例采用下述技术方案：
[0007]第一方面，本申请实施例提供一种文本分类模型的训练方法，包括：
[0008]基于文档样本集，获取第一关系图的结构信息和特征信息；所述文档样本集包括训练文档样本和预测文档样本，所述第一关系图包括多个节点和节点之间的连接边，所述多个节点包括训练文档样本对应的文档节点...

【技术保护点】

【技术特征摘要】
1.一种文本分类模型的训练方法，其特征在于，包括：基于文档样本集获取第一关系图的结构信息和特征信息；所述文档样本集包括训练文档样本和预测文档样本，所述第一关系图包括多个节点和节点之间的连接边，所述多个节点包括所述训练文档样本对应的文档节点、所述预测文档样本对应的文档节点和所述文档样本集包含的词语对应的词节点；通过文本分类模型中的预训练分类网络基于所述特征信息对所述预测文档样本进行文本分类处理，得到所述预测文档样本的第一分类参考信息；通过所述文本分类模型中的图神经网络基于所述特征信息和所述结构信息确定所述第一关系图的语义指导信息；通过所述图神经网络基于所述语义指导信息、所述特征信息、所述结构信息以及所述训练文档样本对应的类别标签，对所述预测文档样本进行文本分类处理，得到所述预测文档样本的第二分类参考信息；基于所述第一分类参考信息、所述第二分类参考信息本及所述预测文档样本对应的类别标签，优化所述图神经网络的网络参数。2.根据权利要求1所述的方法，其特征在于，所述文本分类模型中的图神经网络包括节点评分层，所述语义指导信息包括所述第一关系图中各个节点的重要性分值；所述通过所述文本分类模型中的图神经网络基于所述特征信息和所述结构信息确定所述第一关系图的语义指导信息，包括：利用所述节点评分层基于自注意力机制，通过所述结构信息和所述特征信息，确定所述第一关系图中各节点的注意力分值；从所述第一关系图中选取注意力分值满足预设分值条件的节点，并对选出的节点的注意力分值进行非线性变换处理，得到选出的节点的重要性分值；将所述第一关系图中未选取的节点的重要性分值设置为预设分值。3.根据权利要求2所述的方法，其特征在于，所述文本分类模型中的图神经网络还包括第一卷积层和第二卷积层，所述第一卷积层与所述第二卷积层相连接；所述通过所述文本分类模型中的图神经网络基于所述语义指导信息、所述特征信息、所述结构信息以及所述训练文档样本对应的类别标签，对所述预测文档样本进行文本分类处理，得到所述预测文档样本的第二分类参考信息，包括：利用所述第一卷积层基于所述训练文档样本对应的类别标签，对所述结构信息和所述特征信息进行卷积处理，得到第一卷积结果；将所述第一卷积结果与所述语义指导信息进行融合处理，得到融合卷积结果；将所述融合卷积结果输入至所述第二卷积层进行卷积处理得到第二分类参考信息。4.根据权利要求1所述的方法，其特征在于，所述基于所述第一分类参考信息、第二分类参考信息及所述预测文档样本对应的类别标签，优化所述图神经网络的网络参数，包括：获取所述预训练分类网络对应的第一权重，以及所述图神经网络对应的第二权重；将所述第一分类参考信息与所述第一权重进行相乘运算，以及将所述第二分类参考信息与所述第二权重进行相乘运算，并将相乘运算的结果进行融合处理；根据融合处理的结果确定所述预测文档样本的预测类别；基于所述预测文档样本的预测类别、所述预测文档样本对应的类别标签以及所述图神
经网络对应的预设损失函数，确定预测损失；基于所述预测损失，优化所述图神经网络的网络参数。5.根据权利要求1所述的方法，其特征在于，所述第一关系图中节点之间的连接边包括第一类连接边和第二类连接边，在基于文档样本集获取第一关系图的结构信息和特征信息之前，所述方法还包括：基于所述文档样本集中的训练文档样本和预测文档样本创建第一关系图；所述基于所述文档样本集中的训练文档样本和预测文档样本创建第一关系图，包括：基于所述文档样本集包含的词语，确定所述文档样本集对应的词语集；所述文档样本集包含的词语包括所述训练文档样本中词语和所述预测文档样本中词语；针对所述词语集中的各词语，创建所述各词语对应的词节点，并在满足第一创建边条件的不同词节点之间创建第一类连接边；针对所述文档样本集中的文档样本，创建所述训练文档对应的文档节点，以及创建所述预测文档对应的文档节点，并在满足第二创建边条件的文档节点与所述词节点之间创建第二类连接边。6.根据权利要求5所述的方法，其特征在于，所述第一关系图中各个连接边对应的边权重包括第一类连接边的边权重和的第二类连接边的边权重，获取第一关系图的结构信息，包括：基于所述词语集中任意的第一词语和第二词语各自在所述文档样本集中出现的概率以及所述第一词语和所述第二词语在同一文档样本中出现的...

【专利技术属性】
技术研发人员：赵宏宇，蒋宁，王洪斌，吴海英，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人