基于多个模型结果对多轮对话的分类方法和装置制造方法及图纸

技术编号:24574622 阅读:25 留言:0更新日期:2020-06-21 00:12
本说明书实施例提供一种基于多个模型结果对多轮对话的分类方法和装置,方法包括:针对目标用户与机器人客服的多轮对话,提取各单轮用户文本;将各单轮用户文本和对应的第一组预测结果输入第一融合模型,得到多轮对话对应的第一融合结果,第一组预测结果通过若干分类模型和若干匹配模型得到,第一组预测结果和第一融合结果属于第一候选标签集合;获取对第二组预测结果进行融合处理得到的第二融合结果,第二组预测结果通过若干匹配模型得到;第二组预测结果和第二融合结果属于第二候选标签集合;根据第一融合结果和第二融合结果,综合确定多轮对话对应的目标分类。能够保证基于多个模型结果对多轮对话的分类效果。

Classification method and device of multi round dialogue based on multi model results

【技术实现步骤摘要】
基于多个模型结果对多轮对话的分类方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及基于多个模型结果对多轮对话的分类方法和装置。
技术介绍
当前,在神经网络模型的应用中常常会涉及对多轮对话的分类问题。由于一个模型很难全面保证整体效果,所以通常会基于多个模型结果对多轮对话进行分类。现有技术中,在基于多个模型结果对多轮对话进行分类时,通常依靠规则对多个模型结果进行融合,需要不断调试规则,效果很难保证。因此,希望能有改进的方案,能够保证基于多个模型结果对多轮对话的分类效果。
技术实现思路
本说明书一个或多个实施例描述了一种基于多个模型结果对多轮对话的分类方法和装置,能够保证基于多个模型结果对多轮对话的分类效果。第一方面,提供了一种基于多个模型结果对多轮对话的分类方法,方法包括:针对目标用户与机器人客服的多轮对话,提取所述多轮对话中各轮对话的单轮用户文本;将各轮对话的单轮用户文本和对应的第一组预测结果输入第一融合模型,由所述第一融合模型进行融合处理,得到所述多轮对话对应的第一融合结果,所述第一组预测结果通过将所述单轮用户文本输入第一组模型而得到,所述第一组模型包括若干分类模型和若干匹配模型,所述第一组预测结果和所述第一融合结果属于第一候选标签集合中的标签指示的分类;将所述多轮对话对应的第二组预测结果输入第二融合模型,由所述第二融合模型进行融合处理,得到所述多轮对话对应的第二融合结果,所述第二组预测结果通过将所述多轮对话输入第二组模型而得到,所述第二组模型包括所述若干匹配模型;所述第二组预测结果和所述第二融合结果属于第二候选标签集合中标签指示的分类;根据所述第一融合结果和所述第二融合结果,综合确定所述多轮对话对应的目标分类,所述目标分类属于所述第一候选标签集合或所述第二候选标签集合。在一种可能的实施方式中,所述方法还包括:将所述目标用户的预设历史行为的行为特征输入所述第一融合模型;和/或,将用于指示所述目标用户的行为轨迹的序列数据输入所述第一融合模型;和/或,将用于指示所述目标用户的服务轨迹的序列数据输入所述第一融合模型。在一种可能的实施方式中,所述方法还包括:将所述第一融合模型的各输入作为状态,将所述目标分类作为动作,至少根据所述目标分类确定该状态动作对对应的奖励;根据所述奖励,基于强化学习的方法更新所述第一融合模型。进一步地,所述至少根据所述目标分类确定该状态动作对对应的奖励,包括:若所述目标分类属于所述第二候选标签集合且不属于所述第一候选标签集合,则确定该状态动作对对应的奖励为0。进一步地,所述至少根据所述目标分类确定该状态动作对对应的奖励,包括:若所述目标分类属于所述第一候选标签集合,则根据所述目标用户对所述目标分类的反馈,确定该状态动作对对应的奖励。进一步地,所述根据所述目标用户对所述目标分类的反馈,确定该状态动作对对应的奖励,包括:若所述目标用户对所述目标分类的反馈为正反馈,则确定该状态动作对对应的奖励为第一奖励分数;若所述目标用户对所述目标分类的反馈为负反馈,则确定该状态动作对对应的奖励为第二奖励分数;所述第一奖励分数大于0,所述第二奖励分数小于0。在一种可能的实施方式中,所述第二候选标签集合与所述第一候选标签集合存在交集。在一种可能的实施方式中,所述标签指示的分类包括:所述多轮对话对应的标准问句,或,所述多轮对话对应的人工客服技能组。第二方面,提供了一种基于多个模型结果对多轮对话的分类装置,装置包括:提取单元,用于针对目标用户与机器人客服的多轮对话,提取所述多轮对话中各轮对话的单轮用户文本;第一融合单元,用于将所述提取单元提取的各轮对话的单轮用户文本和对应的第一组预测结果输入第一融合模型,由所述第一融合模型进行融合处理,得到所述多轮对话对应的第一融合结果,所述第一组预测结果通过将所述单轮用户文本输入第一组模型而得到,所述第一组模型包括若干分类模型和若干匹配模型,所述第一组预测结果和所述第一融合结果属于第一候选标签集合中的标签指示的分类;第二融合单元,用于将所述多轮对话对应的第二组预测结果输入第二融合模型,由所述第二融合模型进行融合处理,得到所述多轮对话对应的第二融合结果,所述第二组预测结果通过将所述多轮对话输入第二组模型而得到,所述第二组模型包括所述若干匹配模型;所述第二组预测结果和所述第二融合结果属于第二候选标签集合中标签指示的分类;综合确定单元,用于根据所述第一融合单元得到的第一融合结果和所述第二融合单元得到的第二融合结果,综合确定所述多轮对话对应的目标分类,所述目标分类属于所述第一候选标签集合或所述第二候选标签集合。第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。通过本说明书实施例提供的方法和装置,首先针对目标用户与机器人客服的多轮对话,提取所述多轮对话中各轮对话的单轮用户文本;然后将各轮对话的单轮用户文本和对应的第一组预测结果,通过第一融合模型进行融合处理,所述第一组预测结果为第一组模型的预测结果,第一融合模型可以学习各轮对话之间的关系,并且融合第一组模型的预测结果;以及将所述多轮对话对应的第二组预测结果输入第二融合模型,由所述第二融合模型进行融合处理,所述第二组预测结果为第二组模型的预测结果;最后根据所述第一融合结果和所述第二融合结果,综合确定所述多轮对话对应的目标分类。由上可见,本说明书实施例,不是通过规则融合多个模型的结果,而是通过模型学习各轮对话之间的关系,并且融合第一组模型的预测结果,能够保证基于多个模型结果对多轮对话的分类效果。此外,还考虑到匹配模型返回的可以是随时更换的标签,而分类模型无法实时更新标签,在标签不一致的情况下,通过第一融合模型和第二融合模型分别实现对旧标签和新标签的融合处理,从而实现对分类模型和匹配模型的结果进行融合。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本说明书披露的一个实施例的实施场景示意图;图2示出根据一个实施例的针对用户问句的处理方法流程图;图3示出根据一个实施例的基于多个模型结果对多轮对话的分类方法流程图;图4为本说明书实施例提供的一种第一融合模型的示意图;图5示出根据一个实施例的融合框架示意图;图6示出根据一个实施例的基于多个模型结果对多轮对话的分类装置的示意性框图。具体实施方式下面结合附图,对本本文档来自技高网...

【技术保护点】
1.一种基于多个模型结果对多轮对话的分类方法,所述方法包括:/n针对目标用户与机器人客服的多轮对话,提取所述多轮对话中各轮对话的单轮用户文本;/n将各轮对话的单轮用户文本和对应的第一组预测结果输入第一融合模型,由所述第一融合模型进行融合处理,得到所述多轮对话对应的第一融合结果,所述第一组预测结果通过将所述单轮用户文本输入第一组模型而得到,所述第一组模型包括若干分类模型和若干匹配模型,所述第一组预测结果和所述第一融合结果属于第一候选标签集合中的标签指示的分类;/n将所述多轮对话对应的第二组预测结果输入第二融合模型,由所述第二融合模型进行融合处理,得到所述多轮对话对应的第二融合结果,所述第二组预测结果通过将所述多轮对话输入第二组模型而得到,所述第二组模型包括所述若干匹配模型;所述第二组预测结果和所述第二融合结果属于第二候选标签集合中标签指示的分类;/n根据所述第一融合结果和所述第二融合结果,综合确定所述多轮对话对应的目标分类,所述目标分类属于所述第一候选标签集合或所述第二候选标签集合。/n

【技术特征摘要】
1.一种基于多个模型结果对多轮对话的分类方法,所述方法包括:
针对目标用户与机器人客服的多轮对话,提取所述多轮对话中各轮对话的单轮用户文本;
将各轮对话的单轮用户文本和对应的第一组预测结果输入第一融合模型,由所述第一融合模型进行融合处理,得到所述多轮对话对应的第一融合结果,所述第一组预测结果通过将所述单轮用户文本输入第一组模型而得到,所述第一组模型包括若干分类模型和若干匹配模型,所述第一组预测结果和所述第一融合结果属于第一候选标签集合中的标签指示的分类;
将所述多轮对话对应的第二组预测结果输入第二融合模型,由所述第二融合模型进行融合处理,得到所述多轮对话对应的第二融合结果,所述第二组预测结果通过将所述多轮对话输入第二组模型而得到,所述第二组模型包括所述若干匹配模型;所述第二组预测结果和所述第二融合结果属于第二候选标签集合中标签指示的分类;
根据所述第一融合结果和所述第二融合结果,综合确定所述多轮对话对应的目标分类,所述目标分类属于所述第一候选标签集合或所述第二候选标签集合。


2.如权利要求1所述的方法,其中,所述方法还包括:
将所述目标用户的预设历史行为的行为特征输入所述第一融合模型;和/或,
将用于指示所述目标用户的行为轨迹的序列数据输入所述第一融合模型;和/或,
将用于指示所述目标用户的服务轨迹的序列数据输入所述第一融合模型。


3.如权利要求1所述的方法,其中,所述方法还包括:
将所述第一融合模型的各输入作为状态,将所述目标分类作为动作,至少根据所述目标分类确定该状态动作对对应的奖励;
根据所述奖励,基于强化学习的方法更新所述第一融合模型。


4.如权利要求3所述的方法,其中,所述至少根据所述目标分类确定该状态动作对对应的奖励,包括:
若所述目标分类属于所述第二候选标签集合且不属于所述第一候选标签集合,则确定该状态动作对对应的奖励为0。


5.如权利要求3所述的方法,其中,所述至少根据所述目标分类确定该状态动作对对应的奖励,包括:
若所述目标分类属于所述第一候选标签集合,则根据所述目标用户对所述目标分类的反馈,确定该状态动作对对应的奖励。


6.如权利要求5所述的方法,其中,所述根据所述目标用户对所述目标分类的反馈,确定该状态动作对对应的奖励,包括:
若所述目标用户对所述目标分类的反馈为正反馈,则确定该状态动作对对应的奖励为第一奖励分数;
若所述目标用户对所述目标分类的反馈为负反馈,则确定该状态动作对对应的奖励为第二奖励分数;所述第一奖励分数大于0,所述第二奖励分数小于0。


7.如权利要求1所述的方法,其中,所述第二候选标签集合与所述第一候选标签集合存在交集。


8.如权利要求1所述的方法,其中,所述标签指示的分类包括:
所述多轮对话对应的标准问句,或,所述多轮对话对应的人工客服技能组。


9.一种基于多个模型结果对多轮对话的分类装置,所述装置包括:
提取单元,用于针对目标用户与机器人客服的多轮对话,提取所述多轮对话中各轮对话的单轮用户文本;
第一融合单元,用于将所述提取单元提取...

【专利技术属性】
技术研发人员:王雅芳孔心宇
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1