System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,特别是涉及一种问答系统应答预测模型训练方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
1、在问答系统的研发中,最关键的是使问答系统具备更加强大和可靠的应答答能力,因此,对问答系统中的应答预测模型进行训练,显得极其重要。
2、传统技术中,在对问答系统中的应答预测模型进行训练时,通过模拟出一个虚拟用户,让虚拟用户单独与应答预测模型进行交互;但是,这种训练方式比较单一,存在局限性,导致应答预测准确率较低。
技术实现思路
1、基于此,有必要根据上述技术问题,提供一种能够提高应答预测准确率的问答系统应答预测模型训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种问答系统应答预测模型训练方法,包括:
3、获取针对问答系统的待训练的应答预测模型的训练数据集;所述训练数据集包括系统角色扮演者对应的第一语料数据集和非系统角色扮演者对应的第二语料数据集;所述系统角色扮演者和所述非系统角色扮演者通过对所述问答系统的客服人员划分得到;
4、根据预设问答环境,分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度;
5、根据所述第一语料数据集、所述第二语料数据集和所述差异度,对所述待训练的应答预测模型进行训练,得到训练完成的应答预测模型。
6、在其中一个实施例中,所述根据所述第一语料数据集、所述第二语料数据集和所述差异度,对所述待训练的应答预
7、从所述第二语料数据集中,筛选出对应的差异度满足预设差异度阈值的语料数据,作为目标语料数据;
8、根据所述第一语料数据集和所述目标语料数据,对所述待训练的应答预测模型进行迭代训练,得到所述训练完成的应答预测模型。
9、在其中一个实施例中,所述根据所述第一语料数据集、所述第二语料数据集和所述差异度,对所述待训练的应答预测模型进行训练,得到训练完成的应答预测模型,还包括:
10、获取预设应答种类数目、所述第一语料数据集和所述第二语料数据集中问答话语的真实应答,以及所述第一语料数据集和所述第二语料数据集中的语料数据总数目;
11、将所述第一语料数据集和所述第二语料数据集中语料数据中的问答话语,输入所述待训练的应答预测模型,得到所述第一语料数据集和所述第二语料数据集中问答话语的预测应答;
12、根据所述语料数据总数目、所述预设应答种类数目、所述预测应答、所述真实应答以及所述差异度,得到所述待训练的应答预测模型的模型损失值;
13、根据所述模型损失值,对所述待训练的应答预测模型进行迭代训练,得到所述训练完成的应答预测模型。
14、在其中一个实施例中,所述分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度,包括:
15、获取所述系统角色扮演者对所述第一语料数据集中各个语料数据中的问答话语所作出的第一应答集;
16、获取所述非系统角色扮演者对所述第二语料数据集中各个语料数据中的问答话语所作出的第二应答集;
17、将所述第一应答集与所述第二应答集进行比对,得到第一比对结果,根据所述第一比对结果,分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度。
18、在其中一个实施例中,所述分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度,还包括:
19、获取所述系统角色扮演者对所述第一语料数据集中各个语料数据中的问答话语和用户意图所作出的第三应答集;
20、获取所述非系统角色扮演者对所述第二语料数据集中各个语料数据中的问答话语和用户意图所作出的第四应答集;
21、将所述第三应答集与所述第四应答集进行比对,得到第二比对结果,根据所述第二比对结果,分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度。
22、在其中一个实施例中,所述获取针对问答系统的待训练的应答预测模型的训练数据集,包括:
23、获取所述系统角色扮演者在所述问答系统中针对第一问答语句和第一用户意图所作出的第一应答,以及获取所述非系统角色扮演者在所述问答系统中针对第二问答语句和第二用户意图所作出的第二应答;
24、根据所述第一问答语句、所述第一用户意图和所述第一应答,构建第一语料数据,以及根据所述第二问答语句、所述第二用户意图和所述第二应答,构建第二语料数据;
25、根据所述第一语料数据,构建第一语料数据集,以及根据所述第二语料数据,构建第二语料数据集。
26、第二方面,本申请还提供了一种问答系统应答预测模型训练装置,包括:
27、数据获取模块,获取针对问答系统的待训练的应答预测模型的训练数据集;所述训练数据集包括系统角色扮演者对应的第一语料数据集和非系统角色扮演者对应的第二语料数据集;所述系统角色扮演者和所述非系统角色扮演者通过对所述问答系统的客服人员划分得到;
28、差异确定模块,根据预设问答环境,分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度;
29、模型训练模块,根据所述第一语料数据集、所述第二语料数据集和所述差异度,对所述待训练的应答预测模型进行训练,得到训练完成的应答预测模型。
30、第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
31、获取针对问答系统的待训练的应答预测模型的训练数据集;所述训练数据集包括系统角色扮演者对应的第一语料数据集和非系统角色扮演者对应的第二语料数据集;所述系统角色扮演者和所述非系统角色扮演者通过对所述问答系统的客服人员划分得到;
32、根据预设问答环境,分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度;
33、根据所述第一语料数据集、所述第二语料数据集和所述差异度,对所述待训练的应答预测模型进行训练,得到训练完成的应答预测模型。
34、第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
35、获取针对问答系统的待训练的应答预测模型的训练数据集;所述训练数据集包括系统角色扮演者对应的第一语料数据集和非系统角色扮演者对应的第二语料数据集;所述系统角色扮演者和所述非系统角色扮演者通过对所述问答系统的客服人员划分得到;
36、根据预设问答环境,分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度;
37、根据所述第一语料数据集、所述第二语料数据集和所述差异度,对所述待训练的应答预测模型进行训练,得到训练完成的应答预测模型。
38、第五方面本文档来自技高网...
【技术保护点】
1.一种问答系统应答预测模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一语料数据集、所述第二语料数据集和所述差异度,对所述待训练的应答预测模型进行训练,得到训练完成的应答预测模型,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一语料数据集、所述第二语料数据集和所述差异度,对所述待训练的应答预测模型进行训练,得到训练完成的应答预测模型,还包括:
4.根据权利要求1所述的方法,其特征在于,所述分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度,包括:
5.根据权利要求1所述的方法,其特征在于,所述分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度,还包括:
6.根据权利要求1至5任一项所述的方法,其特征在于,所述获取针对问答系统的待训练的应答预测模型的训练数据集,包括:
7.一种问答系统应答预测模型训练装置,其特征在于,所述装置包括:
8.一种计算机设备,包括存储器和处理器,所述存储器存储
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种问答系统应答预测模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一语料数据集、所述第二语料数据集和所述差异度,对所述待训练的应答预测模型进行训练,得到训练完成的应答预测模型,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一语料数据集、所述第二语料数据集和所述差异度,对所述待训练的应答预测模型进行训练,得到训练完成的应答预测模型,还包括:
4.根据权利要求1所述的方法,其特征在于,所述分别确定所述第二语料数据集中各个语料数据与所述第一语料数据集之间的差异度,包括:
5.根据权利要求1所述的方法,其特征在于,所述分别确定所述第二语料数据集中各个语料数据与所述第一语...
【专利技术属性】
技术研发人员:陈金孝,
申请(专利权)人:广州科拓科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。