一种文本分类方法、系统、电子设备及存储介质技术方案

技术编号：34177010 阅读：50 留言：0更新日期：2022-07-17 12:10

本申请公开了一种文本分类方法，获取内容文本和多个类别选项，将所述内容文本和每一所述类别选项进行组合得到多个输入样本；将所有所述输入样本划分为多个样本组，分批次将所述样本组输入自回归预训练语言模型进行模型训练；将待分类文本输入训练后的自回归预训练语言模型，得到所述待分类文本的文本类别。本申请能够降低文本分类过程对显存空间的占用。本申请还公开了一种文本分类系统、一种存储介质及一种电子设备，具有以上有益效果。具有以上有益效果。具有以上有益效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本分类方法、系统、电子设备及存储介质

[0001]本申请涉及文本处理领域，特别涉及一种文本分类方法、系统、电子设备及存储介质。

技术介绍

[0002]在文本分类场景中，需要使用具有高准确率的自回归预训练语言模型。本领域中通常使用大量的语料使自回归预训练语言模型进行自监督学习，然后再根据不同的下游任务对自回归预训练语言模型的模型参数进行更新，使自回归预训练语言模型能够在各个下游任务中取得更好的识别效果。
[0003]在使用语言模型进行下游任务的调优的过程中，通常采用的方法是在已有自回归预训练语言模型的基础上将最后的嵌入层用线性层替换。若使用上述方案更新的自回归预训练语言模型，在处理的分类数目较大的时，每次输入到模型的样本数量与分类数成线性关系，将会导致显存空间无法满足产生的中间结果的存储需求，进而出现显存空间不足的问题。
[0004]因此，如何降低文本分类过程对显存空间的占用是本领域技术人员目前需要解决的技术问题。

技术实现思路

[0005]本申请的目的是提供一种文本分类方法、一种文本分类系统、一种电子设备及一种电子设备，能够降低文本分类过程对显存空间的占用。
[0006]为解决上述技术问题，本申请提供一种文本分类方法，该文本分类方法包括：
[0007]获取内容文本和多个类别选项，将所述内容文本和每一所述类别选项进行组合得到多个输入样本；
[0008]将所有所述输入样本划分为多个样本组，分批次将所述样本组输入自回归预训练语言模型进行模型训练；
[00...

【技术保护点】

【技术特征摘要】
1.一种文本分类方法，其特征在于，包括：获取内容文本和多个类别选项，将所述内容文本和每一所述类别选项进行组合得到多个输入样本；将所有所述输入样本划分为多个样本组，分批次将所述样本组输入自回归预训练语言模型进行模型训练；将待分类文本输入训练后的自回归预训练语言模型，得到所述待分类文本的文本类别。2.根据权利要求1所述文本分类方法，其特征在于，将所有所述输入样本划分为多个样本组，包括：根据显存容量确定预设样本数量；其中，所述显存容量与所述预设样本数量正相关；按照所述预设样本数量将所有所述输入样本划分为多个所述样本组；其中，每一所述样本组中包含的所述输入样本的数量小于或等于所述预设样本数量。3.根据权利要求1所述文本分类方法，其特征在于，所述分批次将所述样本组输入自回归预训练语言模型进行模型训练，包括：确定当前批次对应的目标样本组；将所述目标样本组输入所述自回归预训练语言模型进行前向传播计算和反向传播计算，以便更新所述自回归预训练语言模型的参数。4.根据权利要求3所述文本分类方法，其特征在于，将所述目标样本组输入所述自回归预训练语言模型进行前向传播计算和反向传播计算，包括：将所述目标样本组输入所述自回归预训练语言模型进行前向传播计算，并在Transformer层保存前向传播计算得到的中间结果；对所有所述中间结果进行聚合操作的到的概率信息；其中，所述概率信息包括所述内容文本的文本类别为每一所述类别选项的概率；根据所述概率信息和所述内容文本的标签计算损失函数值；利用所述损失函数值进行...

【专利技术属性】
技术研发人员：赵旭东，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人