模型训练方法、文本分类方法、装置、设备、介质及产品制造方法及图纸

技术编号：41459937 阅读：24 留言：0更新日期：2024-05-28 20:45

本申请实施例提供了一种模型训练方法、文本分类方法、装置、设备、介质及产品。其中，模型训练方法包括：获取训练文本及训练层次标签列表；对所述训练文本进行处理，得到训练文本嵌入表示；将所述训练文本嵌入表示输入神经网络模型，输出预测层次标签序列；根据所述预测层次标签序列和训练层次标签序列计算目标损失函数，所述训练层次标签序列是根据所述训练层次标签列表生成的；基于所述目标损失函数对所述神经网络模型的参数进行调整，得到文本分类模型。本申请实施例根据层次标签列表生成层次标签序列用于模型的训练，不需要针对不同层次的标签分别训练模型，节省了模型训练和推理的时间和成本，提高了分类的标签层次结构的正确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请实施例涉及自然语言处理领域，尤其涉及一种模型训练方法、文本分类方法、装置、设备、介质及产品。

技术介绍

1、文本主题分类是自然语言处理的一项基本任务，其目的在于为给定的文本分配一个或多个主题标签。在互联网高度发展的今天，网上汇聚了海量的文本信息，通过对文本进行主题分类，可以有效地提高文本分析和筛选的效率，帮助用户快速找到具有特定主题内容的文本，因此在实际场景的应用中具有十分重要的意义。

2、如图1(a)所示，一般的平行式文本主题分类通常将主题标签视作是相互独立的。与平行式文本主题分类不同，如图1(b)所示，层次化文本主题分类的特点在于主题标签符合一定的层次组织结构，这种层次结构为文本信息按不同粒度的划分提供了可能性，进一步提高了文本筛选效率。在面对层次化文本主题分类任务时，现有的方法主要有两类：一类是平行式多标签分类方法，该方法仍沿用平行式文本主题分类的思路，为每个类别单独学习一个分类器；另一类是基于层次化训练的方法，为标签层次的每一层级都训练一个分类器，子层级分类器使用父层级分类器的参数进行初始化。然而，上述两类方法...

【技术保护点】

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的模型训练方法，其特征在于，所述训练层次标签列表包含了多个层次的标签，所述训练层次标签序列是按照下述方式生成的：

3.根据权利要求1或2所述的模型训练方法，其特征在于，所述目标损失函数为预测层次标签序列和训练层次标签序列之间的加权损失，其中的权重参数随序列位置的增加而减小。

4.根据权利要求3所述的模型训练方法，其特征在于，所述对训练文本进行处理，得到训练文本嵌入表示，包括：

5.根据权利要求4所述的模型训练方法，其特征在于，所述神经网络模型包括基于相对位置感知注意力机制的编码...

【技术特征摘要】

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的模型训练方法，其特征在于，所述训练层次标签列表包含了多个层次的标签，所述训练层次标签序列是按照下述方式生成的：

4.根据权利要求3所述的模型训练方法，其特征在于，所述对训练文本进行处理，得到训练文本嵌入表示，包括：

5.根据权利要求4所述的模型训练方法，其特征在于，所述神经网络模型包括基于相对位置感知注意力机制的编码器和解码器。

6.根据权利要求5所述的模型训练方法，其特征在于，所述将所述训...

【专利技术属性】
技术研发人员：刘劲，
申请(专利权)人：广州市百果园信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人