【技术实现步骤摘要】
本申请涉及智能对话技术域领,具体涉及一种对话模型的训练方法、装置、设备及可读存储介质。
技术介绍
1、智能对话技术已经应用于汽车领域,让驾驶者可以通过语音与车辆进行交互,提升了驾驶的便捷性和安全性,而智能对话技术依赖于对话模型,对话模型通常是大模型,大模型的训练精度影响智能对话技术的成熟度,训练精度或鲁棒性高的对话大模型将会给用户带来良好的对话交互体验。
2、目前,通常采用对话样本数据对对话大模型进行训练,通过对话大模型对对话样本数据中进行预测,得到预测结果,根据预测结果和对话样本数据对应的标签之前的差异对对话大模型进行训练,从而提高模型的对话能力。但是,此种训练方式仅仅关注相同话题的对话,在利用此类训练好的模型进行实际对话预测时,当一个话题中间加入了其他话题,然后又返回来问之前话题的内容,对话大模型就无法捕捉与当前问题相关的上文信息,从而无法给出最正确的回答,降低了对话大模型的鲁棒性和抗干扰能力。相关技术中,存在利用干扰对话样本数据对对话大模型进行训练的方法,但是加入的干扰对话样本会使得训练数据增多,对话大模型训练过程中的
...【技术保护点】
1.一种对话模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述第一对话样本包括输入对话数据和对应的真实输出对话数据,所述干扰对话样本中包括干扰输入对话数据和对应的干扰输出对话数据;
3.根据权利要求2所述的方法,其特征在于,所述初始对话模型包括编码器、自注意力机制层和解码器;
4.根据权利要求2所述的方法,其特征在于,所述输入对话数据包括多个,每个输入对话数据对应一个真实输出对话数据和一个预测输出对话数据;
5.根据权利要求1所述的方法,其特征在于,所述获取对话模型的第一训练数据集,包括:
6.根...
【技术特征摘要】
1.一种对话模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述第一对话样本包括输入对话数据和对应的真实输出对话数据,所述干扰对话样本中包括干扰输入对话数据和对应的干扰输出对话数据;
3.根据权利要求2所述的方法,其特征在于,所述初始对话模型包括编码器、自注意力机制层和解码器;
4.根据权利要求2所述的方法,其特征在于,所述输入对话数据包括多个,每个输入对话数据对应一个真实输出对话数据和一个预测输出对话数据;
5.根据权利要求1所述的方法,其特征在于,所述获取对话模型的第一训练数据集,包括:
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
...【专利技术属性】
技术研发人员:邓鹏,吴熙,谭瑞,罗川,
申请(专利权)人:重庆长安科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。