【技术实现步骤摘要】
通用结合记忆存储和神经网络的多轮对话管理方法及装置
本专利技术涉及信息技术及数据业务
,特别涉及一种通用结合记忆存储和神经网络的多轮对话管理方法及装置。
技术介绍
目前任务导向多轮对话系统中的对话管理,多是针对特定领域完成对应的任务,对话管理设计简单或仅针对特定领域进行设计,导致对话管理不能完成更复杂的对话系统需求,且不能够适用于更复杂多变的场景。也有使用简单机器学习模型或深度学习模型对对话管理进行改进,然而对话管理的准确度与模型完全关联,导致了模型可能带来的不稳定性传到如对话管理中,波及整个多轮对话管理系统。对话管理的通用适应性,和稳定性仍是制约任务导向多轮对话系统发展的重大难题。现有任务导向多轮对话管理使用简单的规则、机器学习或深度学习模型或预先定义好的有限状态自动机来完成相应的任务,通过对对话状态的识别进行机器下一步动作的预测。比如,(1)一种对话管理器的设计方法,该对话管理器接收先前的用户动作以及先前的观察和当前的观察。假设先前的用户状态和当前的用户状态、先前的用户动作、当前的用户动作、未来系统动作和未 ...
【技术保护点】
1.一种通用结合记忆存储和神经网络的多轮对话管理方法,其特征在于,包括以下步骤:/n接收用户请求,并根据所述用户请求解析输入信息,其中,所述输入信息包括用户意图和槽值;/n获取用户的当前对话状态,并根据所述当前对话状态和历史对话状态更新对话理解数据;/n根据所述对话理解数据通过神经网络模型预测对话动作;以及/n获取查询动作,并将所述查询动作和对话动作的置信度进行比较,以取置信度高的动作作为机器响应动作。/n
【技术特征摘要】 【专利技术属性】
1.一种通用结合记忆存储和神经网络的多轮对话管理方法,其特征在于,包括以下步骤:
接收用户请求,并根据所述用户请求解析输入信息,其中,所述输入信息包括用户意图和槽值;
获取用户的当前对话状态,并根据所述当前对话状态和历史对话状态更新对话理解数据;
根据所述对话理解数据通过神经网络模型预测对话动作;以及
获取查询动作,并将所述查询动作和对话动作的置信度进行比较,以取置信度高的动作作为机器响应动作。
2.根据权利要求1所述的方法,其特征在于,所述根据所述对话理解数据通过神经网络模型预测对话动作,进一步包括:
根据所述对话理解数据判断是否查询到相关状态信息;
如果查询不到所述相关状态信息,则采用预设的对话策略预测动作作为所述对话动作。
3.根据权利要求1所述的方法,其特征在于,所述获取查询动作,进一步包括:
将对话管理语料的数据以key-value存储的方式作为记忆存储,对话状态跟踪器中得到的对话状态在记忆存储中进行查询,查询到的动作作为记忆存储的所述查询动作。
4.根据权利要求1所述的方法,其特征在于,还包括:
将强化学习中的动作信息作为所述机器响应动作,强化学习中环境给的状态信息作为对话管理语料样本,回报信息则设置为识别正确+1,识别错误-1,代理信息则用神经网络模型来代替,以让对话管理形成强化学习的行为模型,并在和环境的交互中,通过检测环境所提供的状态和反馈来实现策略学习。
5.根据权利要求4所述的方法,其特征在于,在深度强化学习的设计模式中,通过经验回放和fixedQ-targets方法设计所述行为模型。
技术研发人员:鄂海红,宋美娜,陈忠富,牛佩晴,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。