【技术实现步骤摘要】
构建对话模型的方法、装置、设备及存储介质
[0001]本公开涉及对话模型
,尤其涉及一种构建对话模型的方法
、
装置及电子设备
。
技术介绍
[0002]现有的对话模型的实现方法主要分为检索式和生成式,其中,基于检索的对话模型:对于用户提出的问题,在对应问答库中进行检索,使用检索到的答案进行回复,回复一般比较精准和具体,且不具有个性色彩;而基于生成的对话模型:使用机器学习的算法模型根据用户的问题端到端进行回复语句的生成,回复相对检索式更加灵活,但是一般也不具有个性色彩
。
[0003]随着人们生活水平的提高,对于对话功能的使用体验要求也越来越高,越来越多的人开始追求个性化的对话体验,例如,一些用户想要体验影视剧中某个角色的聊天风格,但是,在一部电视剧中,某个角色能构成对话的数量还是非常有限的,一般在
2000
条左右,使用这个数量级的语料来训练语言模型会导致过拟合的问题
。
技术实现思路
[0004]鉴于此,本公开提供一种构建对话模型的方法
、
装置及电子设备
。
[0005]根据本公开实施例的第一方面,提供一种构建对话模型的方法,所述方法包括:
[0006]获取中文闲聊语料数据集;
[0007]基于所述中文闲聊语料数据集对第一预训练模型进行训练,以确定初始对话模型;
[0008]获取训练样本集;其中,所述训练样本集包括原始对话集合样本和扩充对话集合样本,所述原始对话集合样本包 ...
【技术保护点】
【技术特征摘要】
1.
一种构建对话模型的方法,其特征在于,所述方法包括:获取中文闲聊语料数据集;基于所述中文闲聊语料数据集对第一预训练模型进行训练,以确定初始对话模型;获取训练样本集;其中,所述训练样本集包括原始对话集合样本和扩充对话集合样本,所述原始对话集合样本包括目标角色对应的多个原始对话样本,所述扩充对话集合样本包括所述目标角色对应的多个扩充对话样本;基于所述训练样本集,对所述初始对话模型进行训练,以确定所述目标角色对应的目标对话模型
。2.
根据权利要求1所述的方法,其特征在于,所述扩充对话集合样本包括模型扩充对话集合样本和
/
或预设扩充对话集合样本
。3.
根据权利要求2所述的方法,其特征在于,所述模型扩充对话集合样本通过以下方式确定:获取所述目标角色对应的台词数据样本;根据所述台词数据样本,确定所述目标角色对应的回答集合样本;其中,所述回答集合样本包括所述目标角色对应的多个回答样本;基于所述中文闲聊语料数据集,确定问题数据集;基于设定对话匹配模型,对所述回答集合样本和所述问题数据集进行处理,以确定所述回答集合样本对应的所述模型扩充对话集合样本
。4.
根据权利要求3所述的方法,其特征在于,所述设定对话匹配模型通过一下方式构建:基于所述中文闲聊语料数据集,对第二预训练模型进行训练,以确定所述设定对话匹配模型
。5.
根据权利要求3所述的方法,其特征在于,所述基于设定对话匹配模型,对所述回答集合样本和所述问题数据集进行处理,以确定所述回答集合样本对应的所述模型扩充对话集合样本,包括:根据所述回答集合样本中的回答样本以及所述问题数据集中的问题语句,构建多个扩充对话;将所述扩充对话输入所述设定对话匹配模型,以确定所述扩充对话对应的置信度;将同一所述回答样本对应的所述扩充对话中,所述置信度符合要求的所述扩充对话,确定为所述回答样本对应的扩充对话样本;根据多...
【专利技术属性】
技术研发人员:钱泽,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。