【技术实现步骤摘要】
基于多个模型结果对多轮对话的分类方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及基于多个模型结果对多轮对话的分类方法和装置。
技术介绍
当前,在神经网络模型的应用中常常会涉及对多轮对话的分类问题。由于一个模型很难全面保证整体效果,所以通常会基于多个模型结果对多轮对话进行分类。现有技术中,在基于多个模型结果对多轮对话进行分类时,通常依靠规则对多个模型结果进行融合,需要不断调试规则,效果很难保证。因此,希望能有改进的方案,能够保证基于多个模型结果对多轮对话的分类效果。
技术实现思路
本说明书一个或多个实施例描述了一种基于多个模型结果对多轮对话的分类方法和装置,能够保证基于多个模型结果对多轮对话的分类效果。第一方面,提供了一种基于多个模型结果对多轮对话的分类方法,方法包括:针对目标用户与机器人客服的多轮对话,提取所述多轮对话中各轮对话的单轮用户文本;将各轮对话的单轮用户文本和对应的第一组预测结果输入第一融合模型,由所述第一融合模型进行融合处理,得到所述多轮对话对应的第一融合结果,所述第一组预测结果通过将所述单轮用户文本输入第一组模型而得到,所述第一组模型包括若干分类模型和若干匹配模型,所述第一组预测结果和所述第一融合结果属于第一候选标签集合中的标签指示的分类;将所述多轮对话对应的第二组预测结果输入第二融合模型,由所述第二融合模型进行融合处理,得到所述多轮对话对应的第二融合结果,所述第二组预测结果通过将所述多轮对话输入第二组模型而得到,所 ...
【技术保护点】
1.一种基于多个模型结果对多轮对话的分类方法,所述方法包括:/n针对目标用户与机器人客服的多轮对话,提取所述多轮对话中各轮对话的单轮用户文本;/n将各轮对话的单轮用户文本和对应的第一组预测结果输入第一融合模型,由所述第一融合模型进行融合处理,得到所述多轮对话对应的第一融合结果,所述第一组预测结果通过将所述单轮用户文本输入第一组模型而得到,所述第一组模型包括若干分类模型和若干匹配模型,所述第一组预测结果和所述第一融合结果属于第一候选标签集合中的标签指示的分类;/n将所述多轮对话对应的第二组预测结果输入第二融合模型,由所述第二融合模型进行融合处理,得到所述多轮对话对应的第二融合结果,所述第二组预测结果通过将所述多轮对话输入第二组模型而得到,所述第二组模型包括所述若干匹配模型;所述第二组预测结果和所述第二融合结果属于第二候选标签集合中标签指示的分类;/n根据所述第一融合结果和所述第二融合结果,综合确定所述多轮对话对应的目标分类,所述目标分类属于所述第一候选标签集合或所述第二候选标签集合。/n
【技术特征摘要】
1.一种基于多个模型结果对多轮对话的分类方法,所述方法包括:
针对目标用户与机器人客服的多轮对话,提取所述多轮对话中各轮对话的单轮用户文本;
将各轮对话的单轮用户文本和对应的第一组预测结果输入第一融合模型,由所述第一融合模型进行融合处理,得到所述多轮对话对应的第一融合结果,所述第一组预测结果通过将所述单轮用户文本输入第一组模型而得到,所述第一组模型包括若干分类模型和若干匹配模型,所述第一组预测结果和所述第一融合结果属于第一候选标签集合中的标签指示的分类;
将所述多轮对话对应的第二组预测结果输入第二融合模型,由所述第二融合模型进行融合处理,得到所述多轮对话对应的第二融合结果,所述第二组预测结果通过将所述多轮对话输入第二组模型而得到,所述第二组模型包括所述若干匹配模型;所述第二组预测结果和所述第二融合结果属于第二候选标签集合中标签指示的分类;
根据所述第一融合结果和所述第二融合结果,综合确定所述多轮对话对应的目标分类,所述目标分类属于所述第一候选标签集合或所述第二候选标签集合。
2.如权利要求1所述的方法,其中,所述方法还包括:
将所述目标用户的预设历史行为的行为特征输入所述第一融合模型;和/或,
将用于指示所述目标用户的行为轨迹的序列数据输入所述第一融合模型;和/或,
将用于指示所述目标用户的服务轨迹的序列数据输入所述第一融合模型。
3.如权利要求1所述的方法,其中,所述方法还包括:
将所述第一融合模型的各输入作为状态,将所述目标分类作为动作,至少根据所述目标分类确定该状态动作对对应的奖励;
根据所述奖励,基于强化学习的方法更新所述第一融合模型。
4.如权利要求3所述的方法,其中,所述至少根据所述目标分类确定该状态动作对对应的奖励,包括:
若所述目标分类属于所述第二候选标签集合且不属于所述第一候选标签集合,则确定该状态动作对对应的奖励为0。
5.如权利要求3所述的方法,其中,所述至少根据所述目标分类确定该状态动作对对应的奖励,包括:
若所述目标分类属于所述第一候选标签集合,则根据所述目标用户对所述目标分类的反馈,确定该状态动作对对应的奖励。
6.如权利要求5所述的方法,其中,所述根据所述目标用户对所述目标分类的反馈,确定该状态动作对对应的奖励,包括:
若所述目标用户对所述目标分类的反馈为正反馈,则确定该状态动作对对应的奖励为第一奖励分数;
若所述目标用户对所述目标分类的反馈为负反馈,则确定该状态动作对对应的奖励为第二奖励分数;所述第一奖励分数大于0,所述第二奖励分数小于0。
7.如权利要求1所述的方法,其中,所述第二候选标签集合与所述第一候选标签集合存在交集。
8.如权利要求1所述的方法,其中,所述标签指示的分类包括:
所述多轮对话对应的标准问句,或,所述多轮对话对应的人工客服技能组。
9.一种基于多个模型结果对多轮对话的分类装置,所述装置包括:
提取单元,用于针对目标用户与机器人客服的多轮对话,提取所述多轮对话中各轮对话的单轮用户文本;
第一融合单元,用于将所述提取单元提取...
【专利技术属性】
技术研发人员:王雅芳,孔心宇,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。