构建对话模型的方法技术

技术编号:39652381 阅读:6 留言:0更新日期:2023-12-09 11:20
本公开提供一种构建对话模型的方法

【技术实现步骤摘要】
构建对话模型的方法、装置、设备及存储介质


[0001]本公开涉及对话模型
,尤其涉及一种构建对话模型的方法

装置及电子设备


技术介绍

[0002]现有的对话模型的实现方法主要分为检索式和生成式,其中,基于检索的对话模型:对于用户提出的问题,在对应问答库中进行检索,使用检索到的答案进行回复,回复一般比较精准和具体,且不具有个性色彩;而基于生成的对话模型:使用机器学习的算法模型根据用户的问题端到端进行回复语句的生成,回复相对检索式更加灵活,但是一般也不具有个性色彩

[0003]随着人们生活水平的提高,对于对话功能的使用体验要求也越来越高,越来越多的人开始追求个性化的对话体验,例如,一些用户想要体验影视剧中某个角色的聊天风格,但是,在一部电视剧中,某个角色能构成对话的数量还是非常有限的,一般在
2000
条左右,使用这个数量级的语料来训练语言模型会导致过拟合的问题


技术实现思路

[0004]鉴于此,本公开提供一种构建对话模型的方法

装置及电子设备

[0005]根据本公开实施例的第一方面,提供一种构建对话模型的方法,所述方法包括:
[0006]获取中文闲聊语料数据集;
[0007]基于所述中文闲聊语料数据集对第一预训练模型进行训练,以确定初始对话模型;
[0008]获取训练样本集;其中,所述训练样本集包括原始对话集合样本和扩充对话集合样本,所述原始对话集合样本包括目标角色对应的多个原始对话样本,所述扩充对话集合样本包括所述目标角色对应的多个扩充对话样本;
[0009]基于所述训练样本集,对所述初始对话模型进行训练,以确定所述目标角色对应的目标对话模型

[0010]可选地,所述扩充对话集合样本包括模型扩充对话集合样本和
/
或预设扩充对话集合样本

[0011]可选地,所述模型扩充对话集合样本通过以下方式确定:
[0012]获取所述目标角色对应的台词数据样本;
[0013]根据所述台词数据样本,确定所述目标角色对应的回答集合样本;其中,所述回答集合样本包括所述目标角色对应的多个回答样本;
[0014]基于所述中文闲聊语料数据集,确定问题数据集;
[0015]基于设定对话匹配模型,对所述回答集合样本和所述问题数据集进行处理,以确定所述回答集合样本对应的所述模型扩充对话集合样本

[0016]可选地,所述设定对话匹配模型通过一下方式构建:
[0017]基于所述中文闲聊语料数据集,对第二预训练模型进行训练,以确定所述设定对话匹配模型

[0018]可选地,所述基于设定对话匹配模型,对所述回答集合样本和所述问题数据集进行处理,以确定所述回答集合样本对应的所述模型扩充对话集合样本,包括:
[0019]根据所述回答集合样本中的回答样本以及所述问题数据集中的问题语句,构建多个扩充对话;
[0020]将所述扩充对话输入所述设定对话匹配模型,以确定所述扩充对话对应的置信度;
[0021]将同一所述回答样本对应的所述扩充对话中,所述置信度符合要求的所述扩充对话,确定为所述回答样本对应的扩充对话样本;
[0022]根据多个所述回答样本对应的所述扩充对话样本,确定所述模型扩充对话集合样本

[0023]可选地,所述将同一所述回答样本对应的所述扩充对话中,所述置信度符合要求的所述扩充对话,确定为所述回答样本对应的扩充对话样本,包括:
[0024]将同一所述回答样本对应的所述扩充对话中,所述置信度排行位于前
N
位的所述扩充对话,确定为所述回答样本对应的所述扩充对话样本

[0025]可选地,所述原始对话集合样本通过以下方式确定:
[0026]获取台词数据样本;
[0027]根据所述台词数据样本,确定目标人物对应的回答集合样本;其中,所述回答集合样本包括所述目标人物对应的多个回答样本;
[0028]根据对话匹配规则和所述回答集合样本,从所述台词数据样本中确定所述回答集合样本对应的所述原始对话集合样本

[0029]根据本公开实施例的第二方面,提供一种构建对话模型的装置,所述装置包括:
[0030]获取模块,用于获取中文闲聊语料数据集;
[0031]确定模块,用于基于所述中文闲聊语料数据集对第一预训练模型进行训练,以确定初始对话模型;
[0032]所述获取模块,还用于获取训练样本集;其中,所述训练样本集包括原始对话集合样本和扩充对话集合样本,所述原始对话集合样本包括目标角色对应的多个原始对话样本,所述扩充对话集合样本包括所述目标角色对应的多个扩充对话样本;
[0033]所述确定模块,还用于基于所述训练样本集,对所述初始对话模型进行训练,以确定所述目标角色对应的目标对话模型

[0034]根据本公开实施例的第三方面,提供一种电子设备,所述电子设备包括:
[0035]处理器,以及用于存储所述处理器可执行指令的存储器;
[0036]其中,所述处理器被配置为执行如第一方面所述的方法

[0037]根据本公开实施例的第四方面,提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如第一方面所述的方法

[0038]本公开的实施例提供的技术方案可以包括以下有益效果:本申请中,可先基于中文闲聊预料数据集对同一语言模型进行训练,以得到具有对话能力的初始对话模型,然后
可基于目标角色对应的多个原始问答对样本以及多个扩充问答对样本,得到数据足够丰富的训练样本集,并基于上述语料丰富的训练样本集对初始对话模型进行训练,从而得到与目标角色对应的目标对话模型,从而使得目标对话模型可以实现带有目标角色风格的回答,以便于用户基于目标对话模型实现与目标角色的对话体验,以提升满足用户的个性化求

[0039]例如,用户在观看完电视剧集后,可以进入聊天窗口,选择该剧中的角色,该角色对应的对话模型便可用该角色风格化的语言回答用户的提问,让用户体验和角色互动对话的乐趣,提升用户粘性

[0040]再例如,用户在虚拟助手的聊天对话中可以选择热门剧集的角色,小助手就会基于上述角色对应的对话模型,用相应的风格化语言回复用户,以提升使用体验

[0041]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开

附图说明
[0042]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理

[0043]图1是根据一示例性实施例示出的构建对话模型的方法的流程图
。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种构建对话模型的方法,其特征在于,所述方法包括:获取中文闲聊语料数据集;基于所述中文闲聊语料数据集对第一预训练模型进行训练,以确定初始对话模型;获取训练样本集;其中,所述训练样本集包括原始对话集合样本和扩充对话集合样本,所述原始对话集合样本包括目标角色对应的多个原始对话样本,所述扩充对话集合样本包括所述目标角色对应的多个扩充对话样本;基于所述训练样本集,对所述初始对话模型进行训练,以确定所述目标角色对应的目标对话模型
。2.
根据权利要求1所述的方法,其特征在于,所述扩充对话集合样本包括模型扩充对话集合样本和
/
或预设扩充对话集合样本
。3.
根据权利要求2所述的方法,其特征在于,所述模型扩充对话集合样本通过以下方式确定:获取所述目标角色对应的台词数据样本;根据所述台词数据样本,确定所述目标角色对应的回答集合样本;其中,所述回答集合样本包括所述目标角色对应的多个回答样本;基于所述中文闲聊语料数据集,确定问题数据集;基于设定对话匹配模型,对所述回答集合样本和所述问题数据集进行处理,以确定所述回答集合样本对应的所述模型扩充对话集合样本
。4.
根据权利要求3所述的方法,其特征在于,所述设定对话匹配模型通过一下方式构建:基于所述中文闲聊语料数据集,对第二预训练模型进行训练,以确定所述设定对话匹配模型
。5.
根据权利要求3所述的方法,其特征在于,所述基于设定对话匹配模型,对所述回答集合样本和所述问题数据集进行处理,以确定所述回答集合样本对应的所述模型扩充对话集合样本,包括:根据所述回答集合样本中的回答样本以及所述问题数据集中的问题语句,构建多个扩充对话;将所述扩充对话输入所述设定对话匹配模型,以确定所述扩充对话对应的置信度;将同一所述回答样本对应的所述扩充对话中,所述置信度符合要求的所述扩充对话,确定为所述回答样本对应的扩充对话样本;根据多...

【专利技术属性】
技术研发人员:钱泽
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1