模型训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号:33990848 阅读:38 留言:0更新日期:2022-07-02 09:39
本发明专利技术实施例提供一种模型训练方法、装置、电子设备和存储介质,该方法包括:获取并滤除第一问答集合中的冗余语句,以得到第二问答集合。第二问答集合中的任一问答对由在语义上关联的目标问题语句和目标应答语句构成,即是正样本。还可以将第二问答集合中的目标问题语句和非目标应答语句构成第三问答集合,即是负样本。最终,根据第二问答集合和第三问答集合训练语言模型。上述方案中,通过冗余语句滤除,保证第二问答集合中的问答语句在语义上对应,第三问答集合中的问答语句在语义上不对应,使得正负样本的划分更加准确。使用准确划分的正负样本进行训练可以使语言模型学习到问题语句与应答语句之间的语义联系,保证模型训练效果。果。果。

【技术实现步骤摘要】
模型训练方法、装置、电子设备和存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种模型训练方法、装置、电子设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展,各种智能机器人越来越多地进入人们的生活,比如服务机器人、自移动售货机器人等商用机器人。为了方便用户的使用,智能机器人通常都支持多种人机交互方式,比如基于触摸操作的人机交互方式以及基于语音的交互方式等等。
[0003]在实际应用中,智能机器人在接收到用户输入的对话内容后,通常会先确定出对话内容的语义,再根据语义得到与对话内容对应的应答内容,从而实现人机交互。

技术实现思路

[0004]本专利技术实施例提供一种模型训练方法、装置、电子设备和存储介质,用以保证人机对话的流畅性。
[0005]本专利技术实施例提供一种模型训练方法,包括:
[0006]获取第一问答集合;
[0007]滤除所述第一问答集合中的冗余语句,以得到第二问答集合,所述第二问答集合中的任一问答对包含目标问题语句和目标应答语句;
[0008]根据所述第本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取第一问答集合;滤除所述第一问答集合中的冗余语句,以得到第二问答集合,所述第二问答集合中的任一问答对包含目标问题语句和目标应答语句;根据所述第二问答集合中的目标问题语句和非目标应答语句,确定第三问答集合;根据所述第二问答集合和所述第三问答集合,训练语言模型。2.根据权利要求1所述的方法,其特征在于,所述第一问答集合中的任一问答集合包含目标问题语句和目标应答语句;所述滤除所述第一问答集合中的冗余语句,以得到第二问答集合之前,所述方法还包括:根据所述第一问答集合中的目标问题语句和非目标应答语句,确定第四问答集合;根据所述第一问答集合和所述第四问答集合进行模型训练,以得到第一语言模型;所述根据所述第二问答集合和所述第三问答集合,训练语言模型,包括:根据所述第二问答集合和所述第三问答集合训练所述第一语言模型,以得到第二语言模型。3.根据权利要求2所述的方法,其特征在于,所述滤除所述第一问答集合中的冗余语句,以得到第二问答集合,包括:根据所述第一问答集合中问题语句之间的第一相似度,滤除所述第一问答集合中冗余的问题语句;根据所述第一问答集合中应答语句之间的第二相似度,滤除所述第一问答集合中冗余的应答语句;根据所述第一问答集合中剩余语句的问答关系标识,集合所述剩余语句进行滤除处理,以得到第二问答集合。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:将所述第一问答集合输入所述第一语言模型,以由所述第一语言模型将所述第一问答集合中的问题语句和应答语句分别转化为句向量;根据所述问题语句各自对应的句向量,确定所述第一相似度;根据所述应答语句各自对应的句向量,确定所述第二相似度。5.根据权利要求4所述的方法,其特征在于,所述由所述第一语言模型将所述第一问答集合中的问题语句和应答语句分别转化为句向量,包括:由所述第一语言模型中的第一转换网络对所述问题语句进行向量转换;由所述第一语言模型中的第二转换网络对所述应答语句进行向量转换。6.根据权利要求4或5所述的方法,其特征在于,所述根据所述第一问答集合中剩余语句的问答关系标识,对所述剩余语句进行滤除处理,包括:根据所述问答关系标识,在所述剩余语句中确定具有预设问答关系的目标问答对;将所述目标问答对输入所述第一语言模型,以由所述第一语言模型中的分类网络对所述目标问答对具有的预设问答关系是否成立进行分类;根据所述分类网络输出的分类结果的置信度,滤除预设问答关系不成立的目标问答对。
7...

【专利技术属性】
技术研发人员:秦昌博谢韬高倩邵长东
申请(专利权)人:科沃斯商用机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1