【技术实现步骤摘要】
一种训练分类模型、对文本分类的方法及装置
[0001]本申请涉及计算机领域,特别涉及一种训练分类模型、对文本分类的方法及装置。
技术介绍
[0002]当前,网络上出现了越来越多的服务平台,服务平台可以为对用户提供服务,例如,购物平台为广大购物者提供购物服务,游戏平台为广大玩家提供游戏服务以及聊天平台为广大聊天者提供聊天服务等,为了更好地对为用户提供服务以提高服务平台的竞争力,可以搜集用户的偏好分类,以根据用户的偏好分类针对性地为用户提供服务,以实现在为用户提供服务的情况下尽可能地满足用户的核心需求,以增加用户对服务平台的粘性。
技术实现思路
[0003]本申请示出了一种训练分类模型、对文本分类的方法及装置。
[0004]第一方面,示出了一种训练分类模型的方法,包括:获取预训练的语言模型;获取原始训练文本以及原始训练文本的原始分类标签,原始训练文本中至少具有原始输入文本以及模板文本,模板文本中包括提示文本以及分类标签填写位;原始训练文本的原始分类标签是至少根据原始输入文本的分类标签得到的;根据原始训练文本以及原始分类标签获取掩码训练文本以及掩码训练文本的掩码分类标签;掩码训练文本中至少具有掩码输入文本以及模板文本,掩码输入文本是在原始训练文本中对原始输入文本中的至少一个字符掩码后得到的,掩码分类标签是至少根据原始分类标签得到的和/或至少根据原始输入文本中的被掩码的至少一个字符得到的;根据原始训练文本以及原始分类标签获取一致性训练文本以及一致性训练文本的一致性分类标签;一致性训练文本中至少具有模板 ...
【技术保护点】
【技术特征摘要】
1.一种训练分类模型的方法,其特征在于,所述方法包括:获取预训练的语言模型;获取原始训练文本以及原始训练文本的原始分类标签,原始训练文本中至少具有原始输入文本以及模板文本,模板文本中包括提示文本以及分类标签填写位;原始训练文本的原始分类标签是至少根据原始输入文本的分类标签得到的;根据原始训练文本以及原始分类标签获取掩码训练文本以及掩码训练文本的掩码分类标签;掩码训练文本中至少具有掩码输入文本以及模板文本,掩码输入文本是在原始训练文本中对原始输入文本中的至少一个字符掩码后得到的,掩码分类标签是至少根据原始分类标签得到的和/或至少根据原始输入文本中的被掩码的至少一个字符得到的;根据原始训练文本以及原始分类标签获取一致性训练文本以及一致性训练文本的一致性分类标签;一致性训练文本中至少具有模板文本以及与原始输入文本语义相关的一致性输入文本;一致性输入文本中的字符与原始输入文本中的字符不全相同,一致性分类标签是至少根据原始分类标签得到的;至少使用原始训练文本、原始分类标签、掩码训练文本、掩码分类标签、一致性训练文本以及一致性分类标签,对预训练的语言模型进行针对分类标签填写位的分类预测任务的优化学习,得到分类模型。2.根据权利要求1所述的方法,其特征在于,所述至少使用原始训练文本、原始分类标签、掩码训练文本、掩码分类标签、一致性训练文本以及一致性分类标签,对预训练的语言模型进行针对分类标签填写位的分类预测任务的优化学习,得到分类模型,包括:至少使用原始训练文本、原始分类标签、掩码训练文本、掩码分类标签、一致性训练文本以及一致性分类标签,对预训练的语言模型进行针对分类标签填写位的分类预测任务的至少一轮优化学习,得到分类模型;其中的任意一轮优化学习包括:根据原始训练文本、原始分类标签、一致性训练文本以及一致性分类标签获取语言模型的KL散度损失值;根据原始训练文本以及原始分类标签获取语言模型的原始交叉熵损失值;根据掩码训练文本以及掩码分类标签获取语言模型的掩码交叉熵损失值;至少根据KL散度损失值、原始交叉熵损失值以及掩码交叉熵损失值,对语言模型进行针对分类标签填写位的分类预测任务的优化学习。3.根据权利要求2所述的方法,其特征在于,所述掩码训练文本包括第一掩码训练文本以及第二掩码训练文本;第一掩码训练文本中至少具有第一掩码输入文本以及模板文本,第一掩码输入文本是在原始训练文本中对原始输入文本中的至少一个字符掩码后得到的,第一掩码训练文本的第一掩码分类标签是至少根据原始分类标签得到的;第二掩码训练文本中至少具有第二掩码输入文本以及模板文本,第二掩码输入文本是在原始训练文本中对原始输入文本中的至少一个字符掩码后得到的,第二掩码训练文本的第二掩码分类标签是至少根据原始输入文本中的被掩码的至少一个字符得到的;所述根据掩码训练文本以及掩码分类标签获取语言模型的掩码交叉熵损失值,包括:根据第一掩码训练文本以及第一掩码分类标签获取语言模型的第一掩码交叉熵损失值;以及,根据第二掩码训练文本以及第二掩码分类标签获取语言模型的第二掩码交叉熵
损失值。4.根据权利要求3所述的方法,其特征在于,所述至少根据KL散度损失值、原始交叉熵损失值以及掩码交叉熵损失值,对语言模型进行针对分类标签填写位的分类预测任务的优化学习,包括:至少根据KL散度损失值、原始交叉熵损失值、第一掩码交叉熵损失值以及第二掩码交叉熵损失值获取综合损失值;至少根据所述综合损失值,对预训练的语言模型进行针对分类标签填写位的分类预测任务的优化学习。5.根据权利要求4所述的方法,其特征在于,所述至少根据KL散度损失值、原始交叉熵损失值、第一掩码交叉熵损失值以及第二掩码交叉熵损失值获取综合损失值,包括:至少对KL散度损失值、原始交叉熵损失值、第一掩码交叉熵损失值以及第二掩码交叉熵损失值加权求和,得到所述综合损失值。6.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据原始训练文本以及原始分类标签获取干扰训练文本以及干扰训练文本的干扰分类标签;干扰训练文本中至少具有干扰文本、原始输入文本以及模板文本;干扰分类标签是至少根据原始分类标签得到的;相应地,所述至少使用原始训练文本、原始分类标签、掩码训练文本、掩码分类标签、一致性训练文本以及一致性分类标签,对预训练的语言模型进行针对分类标签填写位的分类预测任务的优化学习,得到分类模型,包括:使用原始训练文本、原始分类标签、掩码训练文本、掩码分类标签、一致性训练文本、一致性分类标签、干扰训练文本以及干扰分类标签,对预训练的语言模型进行针对分类标签填写位的分类预测任务的优化学习,得到分类模型;以及,在...
【专利技术属性】
技术研发人员:赵磊,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。