一种问答响应及小样本文本匹配模型的训练方法和装置制造方法及图纸

技术编号:28752684 阅读:13 留言:0更新日期:2021-06-09 10:17
本申请提供一种问答响应及小样本文本匹配模型的训练方法和装置,方法包括:获取咨询用户输入的咨询问题;将所述咨询问题输入意图识别模型;在无法通过意图识别模型确定所述咨询问题对应的答案的情况下,将所述咨询问题输入小样本文本匹配模型;经所述小样本文本匹配模型对所述咨询问题进行特征提取,并根据提取的特征确定所述咨询问题对应的答案;将由所述小样本文本匹配模型确定的答案提供至所述咨询用户。通过本申请的技术方案,可以在保证所回复的答案信息的准确性的基础上,提高对咨询问题的处理效率。问题的处理效率。问题的处理效率。

【技术实现步骤摘要】
一种问答响应及小样本文本匹配模型的训练方法和装置


[0001]本申请涉及网络
,具体涉及一种问答响应及小样本文本匹配模型的训练方法和装置。

技术介绍

[0002]对话系统(也称会话代理)包括具有用于访问、处理、管理以及传递信息的人机接口的代理,通过模拟人类的计算机系统实现与人的交谈。随着电子技术的发展,会话系统已逐步深入社会生活的方方面面,为人们的生活提供便利。
[0003]相关技术中,对于未能匹配到答案的问题则需要将问题导出并由标注团队进行标注处理,进而基于标注处理后的问题及其答案对预配置语言库和检索方法进行更新,然而,由人工进行标注处理的过程不仅效率低下,而且成本较高,制约着对话系统优化升级的进一步发展。

技术实现思路

[0004]有鉴于此,本申请提供一种问答响应及小样本文本匹配模型的训练方法、装置和设备,以解决相关技术中的问题。
[0005]为实现上述目的,本申请提供技术方案如下:
[0006]根据本申请的第一方面,提出了一种问答响应方法,所述方法包括:
[0007]获取咨询用户输入的咨询问题;
[0008]将所述咨询问题输入意图识别模型,以由意图识别模型匹配所述咨询问题对应的答案;
[0009]在无法通过意图识别模型确定所述咨询问题对应的答案的情况下,将所述咨询问题输入小样本文本匹配模型,其中,所述小样本文本匹配模型预先采用包括有答案标注信息的问题信息集训练完成,所述答案标注信息是由特定人员根据问题信息而确定的;
[0010]经所述小样本文本匹配模型对所述咨询问题进行特征提取,并根据提取的特征确定所述咨询问题对应的答案;
[0011]将由所述小样本文本匹配模型确定的答案提供至所述咨询用户。
[0012]可选的,所述无法通过意图识别模型确定所述咨询问题对应的答案,包括:
[0013]通过所述意图识别模型确定所述咨询问题对应的类别中答案的有效期已逾期;或者,
[0014]基于所述意图识别模型无法确定所述咨询问题对应的类别。
[0015]可选的,所述意图识别模型包括采用注意力机制的深度神经网络,所述通过意图识别模型确定所述咨询问题对应的答案,包括:
[0016]将所述咨询问题输入采用注意力机制的深度神经网络,以将基于注意力向量的权重概率分布而确定的加权处理结果作为所述深度神经网络输出的特征,以根据所述特征匹配所述咨询问题对应的答案。
[0017]可选的,还包括:
[0018]在无法通过所述小样本文本匹配模型确定所述咨询问题对应的答案的情况下,将所述咨询问题发送至特定人员,以由接收到所述咨询问题的特定人员进行回复;
[0019]基于所述特定人员确定的答案和所述咨询问题组成的问题信息对通过在线学习训练所述小样本文本匹配模型。
[0020]可选的,所述将所述咨询问题发送至特定人员,包括:
[0021]在消息队列中缓存所述咨询问题;
[0022]在预设的用户群体中确定与所述咨询问题的哈希散列值对应的特定用户,以向所述特定用户发送所述咨询问题。
[0023]可选的,还包括:
[0024]确定预设时长内由全部特定人员解答的答案和所述答案对应的咨询问题;
[0025]基于所述全部特定人员解答的答案和所述答案对应的咨询问题所组成的问题信息对通过离线学习训练所述小样本文本匹配模型。
[0026]可选的,还包括:
[0027]在确定所述咨询问题未被回复的情况下,确定预设的用户群体中除所述特定人员之外的其他人员对所述咨询问题进行解答。
[0028]可选的,所述经所述小样本文本匹配模型对所述咨询问题进行特征提取,并根据提取的特征确定所述咨询问题对应的答案,包括:
[0029]根据所述咨询问题被提取的特征确定所述问题信息集中与所述特征的相似度满足预设的相似度阈值的多个问题信息;
[0030]将与所述多个问题信息中的各个问题信息上所标注的答案标注信息有关的推送信息发送至特定人员,以由接收到所述推送信息的特定人员在所述各个问题信息上所标注的答案标注信息中选择所述咨询问题对应的答案。
[0031]可选的,还包括:
[0032]在特定人员拒绝在接收到的推送信息中选定所述咨询问题对应的答案的情况下,将所述特定人员输入的答案确定为所述咨询问题对应的答案。
[0033]可选的,所述问题信息集中的问题信息为长尾问题。
[0034]根据本申请的第二方面,一种用于问答响应的小样本文本匹配模型的训练方法,所述方法包括:
[0035]确定作为训练样本的问题信息集,所述问题信息集中包含多个问题信息对,每个问题信息对包括两个问题信息,且每个问题信息上被预先标注的答案标注信息是根据特定人员基于所述问题信息而确定的;
[0036]将所述问题信息对中的第一问题信息和第二问题信息分别输入小样本文本匹配模型中的第一神经网络和第二神经网络;
[0037]根据所述小样本文本匹配模型提取的特征向量确定所述第一问题信息和所述第二问题信息之间的第一相似度;
[0038]基于所述第一相似度与两个问题信息的答案标注信息之间的第二相似度之间的差异调整所述小样本匹配模型的模型参数。
[0039]可选的,所述训练样本包括正样本和负样本;
[0040]作为正样本的两个问题信息具有相同的答案标注信息;
[0041]作为负样本的两个问题信息具有不同的答案标注信息。
[0042]可选的,在所述确定作为训练样本的问题信息集之前,还包括:
[0043]将特定人员确定的答案和所述答案对应的咨询问题更新至用于训练小样本文本匹配模型的训练样本中;
[0044]实时基于更新后的训练样本触发对所述小样本文本匹配模型的在线学习训练。
[0045]可选的,在所述确定作为训练样本的问题信息集之前,还包括:
[0046]基于预设时长内由全部特定人员解答的答案和所述答案对应的咨询问题更新用于训练小样本匹配模型的训练样本;
[0047]基于更新后的训练样本触发对所述小样本文本匹配模型的离线学习训练。
[0048]可选的,所述基于所述第一相似度与两个问题信息的答案标注信息之间的第二相似度之间的差异调整所述小样本匹配模型的模型参数,包括:
[0049]在所述两个问题信息的答案标注信息一致的情况下,调整所述问题信息对应的中间特征向量与所述小样本文本匹配模型中的权重向量之间的向量夹角余弦值,以提高两个问题信息之间的相似程度;
[0050]在所述两个问题信息的答案标注信息不一致的情况下,调整所述问题信息对应的中间特征向量与所述小样本文本匹配模型中的权重向量之间的向量夹角余弦值,以减弱两个问题信息之间的相似程度。
[0051]可选的,还包括:
[0052]确定所述小样本匹配模型对应的损失函数;
[0053]基于所述损失函数、所述第一相似度和所述两个问题信息的答本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答响应方法,其特征在于,所述方法包括:获取咨询用户输入的咨询问题;将所述咨询问题输入意图识别模型,以由意图识别模型匹配所述咨询问题对应的答案;在无法通过意图识别模型确定所述咨询问题对应的答案的情况下,将所述咨询问题输入小样本文本匹配模型,其中,所述小样本文本匹配模型预先采用包括有答案标注信息的问题信息集训练完成,所述答案标注信息是由特定人员根据问题信息而确定的;经所述小样本文本匹配模型对所述咨询问题进行特征提取,并根据提取的特征确定所述咨询问题对应的答案;将由所述小样本文本匹配模型确定的答案提供至所述咨询用户。2.根据权利要求1所述方法,其特征在于,所述无法通过意图识别模型确定所述咨询问题对应的答案,包括:通过所述意图识别模型确定所述咨询问题对应的类别中答案的有效期已逾期;或者,基于所述意图识别模型无法确定所述咨询问题对应的类别。3.根据权利要求1所述方法,其特征在于,所述意图识别模型包括采用注意力机制的深度神经网络,所述通过意图识别模型确定所述咨询问题对应的答案,包括:将所述咨询问题输入采用注意力机制的深度神经网络,以将基于注意力向量的权重概率分布而确定的加权处理结果作为所述深度神经网络输出的特征,以根据所述特征匹配所述咨询问题对应的答案。4.根据权利要求1所述方法,其特征在于,还包括:在无法通过所述小样本文本匹配模型确定所述咨询问题对应的答案的情况下,将所述咨询问题发送至特定人员,以由接收到所述咨询问题的特定人员进行回复;基于所述特定人员确定的答案和所述咨询问题组成的问题信息对通过在线学习训练所述小样本文本匹配模型。5.根据权利要求4所述方法,其特征在于,所述将所述咨询问题发送至特定人员,包括:在消息队列中缓存所述咨询问题;在预设的用户群体中确定与所述咨询问题的哈希散列值对应的特定用户,以向所述特定用户发送所述咨询问题。6.根据权利要求4所述方法,其特征在于,还包括:确定预设时长内由全部特定人员解答的答案和所述答案对应的咨询问题;基于所述全部特定人员解答的答案和所述答案对应的咨询问题所组成的问题信息对通过离线学习训练所述小样本文本匹配模型。7.根据权利要求4所述方法,其特征在于,还包括:在确定所述咨询问题未被回复的情况下,确定预设的用户群体中除所述特定人员之外的其他人员对所述咨询问题进行解答。8.根据权利要求1所述方法,其特征在于,所述经所述小样本文本匹配模型对所述咨询问题进行特征提取,并根据提取的特征确定所述咨询问题对应的答案,包括:根据所述咨询问题被提取的特征确定所述问题信息集中与所述特征的相似度满足预设的相似度阈值的多个问题信息;
将与所述多个问题信息中的各个问题信息上所标注的答案标注信息有关的推送信息发送至特定人员,以由接收到所述推送信息的特定人员在所述各个问题信息上所标注的答案标注信息中选择所述咨询问题对应的答案。9.根据权利要求8所述方法,其特征在于,还包括:在特定人员拒绝在接收到的推送信息中选定所述咨询问题对应的答案的情况下,将所述特定人员输入的答案确定为所述咨询问题对应的答案。10.根据权利要求1所述方法,其特征在于,所述问题信息集中的问题信息为长尾问题。11.一种用于问答响应的小样本文本匹配模型的训练方法,其特征在于,所述训练方法包括:确定作为训练样本的问题信息集,所述问题信息集中包含多个问题信息对,每个问题信息对包括两个问题信息,且每个问题信息上被预先标注的答案标注信息是根据特定人员基于所述问题信息而确定的;将所述问题信息对中的第一问题信息和第二问题信息分别输入小样本文本匹配模型中的第一神经网络和第二神经网络;根据所述小样本文本匹配模型提取的特征向量确定所述第一问题信息和所述第二问题信息之间的第...

【专利技术属性】
技术研发人员:钱乾田瑞雄崔杰赵中华
申请(专利权)人:上海大岂网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1