文本分类模型的训练方法、文本分类方法及其装置制造方法及图纸

技术编号：37434763 阅读：5 留言：0更新日期：2023-05-06 09:06

本申请公开了文本分类模型的训练方法、文本分类方法及其装置，涉及人工智能领域，尤其涉及自然语言处理NLP及深度学习技术等。具体实现方案为：获取第一样本文本和第一样本文本的类别标签；基于类别标签获取第一样本文本中的关键词；确定类别标签对应的掩码概率，并根据类别标签对应的掩码概率、关键词和第一样本文本，获取第二样本文本；根据第二样本文本和类别标签训练初始的文本分类模型，得到训练好的文本分类模型。本申请可以提升注意力机制的泛化能力，使得模型能够更加深入的去挖掘文本的语义信息，进而可以提升模型的效果。进而可以提升模型的效果。进而可以提升模型的效果。

全部详细技术资料下载

【技术实现步骤摘要】
文本分类模型的训练方法、文本分类方法及其装置

[0001]本申请涉及人工智能领域，尤其涉及自然语言处理NLP及深度学习技术等，特别的涉及一种文本分类模型的训练方法、文本分类方法及其装置。

技术介绍

[0002]文本分类是自然语言处理(Natural Language Processing，NLP)中的最基础的一个任务，很多场景中都涉及到，例如对话机器人、搜索推荐、情绪识别、情感分类、内容理解、企业风控、质量检测等方向。相关技术中，基于深度学习的文本分类研究，逐渐取代传统机器学习方法成为文本分类领域的主流研究方向，所使用的深度学习模型包括卷积神经网络、循环神经网络、注意力机制等。这些深度学习模型用于文本分类领域都取得了较好的实验效果。然而，基于深度注意力机制的方法在很大程度上会过于的关注某些关键词，造成分类结果错误。

技术实现思路

[0003]本申请提供了一种文本分类模型的训练方法、文本分类方法、装置、电子设备以及存储介质。
[0004]根据本申请的第一方面，提供了一种文本分类模型的训练方法，包括：
[0005]获取第一样本文本和所述第一样本文本的类别标签；
[0006]基于所述类别标签获取所述第一样本文本中的关键词；
[0007]确定所述类别标签对应的掩码概率，并根据所述类别标签对应的掩码概率、所述关键词和所述第一样本文本，获取第二样本文本；
[0008]根据所述第二样本文本和所述类别标签训练初始的文本分类模型，得到训练好的文本分类模型。
[0009]根...

【技术保护点】

【技术特征摘要】
1.一种文本分类模型的训练方法，包括：获取第一样本文本和所述第一样本文本的类别标签；基于所述类别标签获取所述第一样本文本中的关键词；确定所述类别标签对应的掩码概率，并根据所述类别标签对应的掩码概率、所述关键词和所述第一样本文本，获取第二样本文本；根据所述第二样本文本和所述类别标签训练初始的文本分类模型，得到训练好的文本分类模型。2.如权利要求1所述的方法，其中，所述基于所述类别标签获取所述第一样本文本中的关键词，包括：对所述第一样本文本进行分词处理，并对所述分词处理的结果进行停用词处理，得到所述第一样本文本的分词结果；对所述类别标签下所述第一样本文本的分词结果中的词进行词频统计，得到所述类别标签下每个词对应的词频；确定所述类别标签对应的词频阈值；将所述第一样本文本的分词结果之中所述词频大于或等于所述词频阈值的词，确定为所述第一样本文本中的关键词。3.如权利要求1所述的方法，其中，所述根据所述类别标签对应的掩码概率、所述关键词和所述第一样本文本，获取第二样本文本，包括：按照所述类别标签对应的掩码概率，对所述第一样本文本中的所述关键词进行掩码处理；将经过掩码处理后的第一样本文本，确定为所述第二样本文本。4.如权利要求3所述的方法，其中，所述按照所述类别标签对应的掩码概率，对所述第一样本文本中的所述关键词进行掩码处理，包括：以所述类别标签对应的掩码概率，将所述第一样本文本中的所述关键词替换为MASK。5.如权利要求1所述的方法，其中，所述根据所述第二样本文本和所述类别标签训练初始的文本分类模型，得到训练好的文本分类模型，包括：将所述第二样本文本输入至初始的文本分类模型；其中，所述初始的文本分类模型为基于Transformer模型构建的；获取所述文本分类模型输出的分类预测结果；根据所述预测结果和所述类别标签，获取模型损失值；根据所述模型损失值对所述文本分类模型进行训练，得到训练好的文本分类模型。6.一种文本分类方法，包括：获取待处理文本；将所述待处理文本输入至预设的文本分类模型，获得所述待处理文本的分类预测结果；其中，所述文本分类模型为采用如权利要求1至5中任一项所述的训练方法训练得到的模型。7.一种文本分类模型的训练装置，包括：第一获取模块，用于获取第一样本文本和所述第一样本文本的类别标签；
第二获取模块，用于基于所述类别标签获取所述第一样本文本中的关键词；确定模块，用于确定所述类别标签对应的掩码概率；第三获取模块，用于根据所述类别标签对应的掩码概率、所...

【专利技术属性】
技术研发人员：谭伟，李迪，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人