一种文本分类方法及装置、存储介质、计算机设备制造方法及图纸

技术编号：38240462 阅读：13 留言：0更新日期：2023-07-25 18:03

本申请公开了一种文本分类方法及装置、存储介质、计算机设备，该方法包括：获取待分类文本对应的分词集合，所述分词集合由所述待分类文本中的分词组成；将所述分词集合输入至文本分类模型中，并通过所述文本分类模型输出所述待分类文本在各个预设类别下对应的目标概率，所述文本分类模型包括至少一组随机失活层以及失活池化层，所述随机失活层中包括多个随机节点集合，每个所述随机节点集合基于目标层的预设节点以及随机失活机制得到，所述失活池化层接收每个所述随机节点集合的输出并进行平均池化处理，所述目标层为目标嵌入层、目标卷积层、目标池化层以及目标全连接层中的一种；基于所述目标概率，确定所述待分类文本对应的文本类别。文本类别。文本类别。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本分类方法及装置、存储介质、计算机设备

[0001]本申请涉及自然语言处理
，尤其是涉及到一种文本分类方法及装置、存储介质、计算机设备。

技术介绍

[0002]随着神经网络模型的快速发展，越来越多的深度学习技术被运用到自然语言处理领域中。其中，文本分类任务是自然语言处理领域的热门任务之一，通过神经网络模型可以将海量的文本归纳总结到不同的类别中，不仅可以方便用户的查阅，而且可以有效的缩减人工分类成本，提高办公效率。
[0003]当前dropout机制被广泛运用于各种神经网络模型中，具体可应用于神经网络模型的全连接层、池化层、编码层等中。通过运用dropout机制可以直接有效的降低模型的过拟合能力，增强模型的鲁棒性。此外，通过随机的dropout掉神经网络中的神经元，使得同一个样本以不同的形式输入到神经网络模型的下游网络中，间接的增加了训练样本，加快了模型的收敛性。但在实际运用中发现，不同的dropout几率对模型的影响较大，在同一个神经网络模型的训练过程中，如果dropout过小，模型依然容易发生过拟合，如果dropout过大，则容易导致神经网络模型难以收敛，模型准确率较差。

技术实现思路

[0004]有鉴于此，本申请提供了一种文本分类方法及装置、存储介质、计算机设备，可以将dropout机制多次使用在同一层神经网络中，在dropout几率较小的情况下，多次随机drop掉同一层神经网络的不同神经元，而在下层网络中，又利用平均池化机制将其结合到一起，能够进一步有效的提高模型的泛化能力，...

【技术保护点】

【技术特征摘要】
1.一种文本分类方法，其特征在于，包括：获取待分类文本对应的分词集合，所述分词集合由所述待分类文本中的分词组成；将所述分词集合输入至文本分类模型中，并通过所述文本分类模型输出所述待分类文本在各个预设类别下对应的目标概率，所述文本分类模型包括至少一组随机失活层以及失活池化层，所述随机失活层中包括多个随机节点集合，每个所述随机节点集合基于目标层的预设节点以及随机失活机制得到，所述失活池化层接收每个所述随机节点集合的输出并进行平均池化处理，所述目标层为目标嵌入层、目标卷积层、目标池化层以及目标全连接层中的一种；基于所述目标概率，确定所述待分类文本对应的文本类别。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：将所述随机失活层的上一层的输出作为第一输出，当所述随机失活层接收到所述第一输出时，基于随机失活机制从对应目标层的预设节点中确定每个所述随机节点集合中包括的目标节点，将所述第一输出分别输入至所述随机失活层的不同随机节点集合中，并基于所述随机节点集合中的所述目标节点对所述第一输出进行处理，得到每个随机节点集合对应的第二输出；分别将每个所述第二输出输入至所述失活池化层中，得到平均池化处理结果。3.根据权利要求2所述的方法，其特征在于，所述随机失活机制中包括每个所述随机失活层对应的目标层的节点保留概率，所述节点保留概率用于从所述目标层的预设节点中随机确定目标节点，以基于所述目标节点组成所述随机节点集合。4.根据权利要求1所述的方法，其特征在于，所述将所述分词集合输入至文本分类模型中之前，所述方法还包括：获取训练样本文本集合，所述训练样本文本集合中包括多个训练样本文本，每个所述训练样本文本对应有第一分类标签；确定每个所述训练样本文本对应的训练样本分词集合，将所述训练样本分词集合输入至预设分类模型中，并通过所述预设分类模型输出每个所述训练样本文本在各个预设类别下对应的第一预测概率，所述预设分类模型包括至少一组预设失活层以及预设池化层，所述预设失活层中包括多个随机节点集合，每个所述随机节点集合基于初始层的预设节点以及随机失活机制得到，所述预设池化层接收每个所述随机节点集合的输出并进行平均池化处理，所述初始层为初始嵌入层、初始卷积层、初始池化层以及初始全连接层中的一种；基于每个所述训练样本文本对应的所述第一预测概率以及所述第一分类标签，通过预设损失函数计算所述预设分类模型的模型损失值，并基于所述模型损失值调整所述预设分类模型的模型参数，直至模型损失值小于或者等于预设损失阈值时结束，得到所述文本分类模型。5.根据权利要求4所述的方法，其特征在于，所述得到...

【专利技术属性】
技术研发人员：陈浩，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人