【技术实现步骤摘要】
本申请涉及自然语言处理处理领域,特别涉及一种文本分类模型的训练方法、文本分类方法及相关设备。
技术介绍
1、文本分类任务是自然语言处理领域中常见而重要的一类任务,其已广泛应用于意图识别、情感分类等领域。目前,结合预训练模型,文本分类等任务已取得较好的效果。但是,在训练一个新的文本分类模型时需要的时间较长,特别是在类别较多且类别数量不断扩充的业务场景中,需要不断添加新类别的数据,从而将旧类别的数据与新类别的数据相结合,重新训练模型。旧类别的数据与新类别的数据合并后的数据集较为庞大,会导致模型的训练效率低下。
技术实现思路
1、本申请提供了一种文本分类模型的训练方法、文本分类方法及相关设备,用于提升文本分类模型的训练效率。
2、第一方面,本申请提供了一种文本分类模型的训练方法,包括:
3、获取新增分类任务的新增训练样本,并生成所述新增训练样本的样本输入向量,所述样本输入向量包括样本子向量以及辅助子向量,所述辅助子向量中包含所述新增分类任务的任务标识分量;
4
...【技术保护点】
1.一种文本分类模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述预训练分类模型支持的最大输入向量维数为第一维数,所述样本子向量的向量维数为第二维数;其中,所述第一维数大于所述第二维数,所述辅助子向量的向量维数根据所述第一维数与所述第二维数之间的差值确定。
3.根据权利要求2所述的方法,其特征在于,所述辅助子向量的向量维数大于预设任务阈值;并且,所述辅助子向量中对应于所述新增分类任务的任务标识分量通过以下方式确定:
4.根据权利要求3所述的方法,其特征在于,所述样本子向量通过以下方式生成:
【技术特征摘要】
1.一种文本分类模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述预训练分类模型支持的最大输入向量维数为第一维数,所述样本子向量的向量维数为第二维数;其中,所述第一维数大于所述第二维数,所述辅助子向量的向量维数根据所述第一维数与所述第二维数之间的差值确定。
3.根据权利要求2所述的方法,其特征在于,所述辅助子向量的向量维数大于预设任务阈值;并且,所述辅助子向量中对应于所述新增分类任务的任务标识分量通过以下方式确定:
4.根据权利要求3所述的方法,其特征在于,所述样本子向量通过以下方式生成:
5.根据权利要求1所述的方法,其特征在于,所述从预训练分类模型所包含的多个模型参数列中,选择与所述任务标识分量相对应的目标参数列包括:
...
【专利技术属性】
技术研发人员:陈文俊,蒋宁,陆全,夏粉,肖冰,李宽,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。