一种基于混合编码网络的端到端对话控制方法技术

技术编号:15822746 阅读:42 留言:0更新日期:2017-07-15 04:56
本发明专利技术中提出的一种基于混合编码网络的端到端对话控制方法,其主要内容包括:混合编码网络(HCN)模型,应用循环神经网络(RNN)学习“端到端”模型,监督学习评价,通过监督学习或强化学习来训练神经网络,其过程为,先将用户话语作为文本形成词袋矢量,通过实体抽取、实体跟踪将特征分量级联成特征向量,再将载体递给RNN计算隐藏状态,传递到softmax激活的密集层,标准化后选择动作模板并传递到实体输出,在实体中替换并完全形成动作,若动作是文本,则呈现给用户,并循环重复。本发明专利技术中HCN以相当少的训练数据实现相同的性能,同时保持端到端可训练性,降低了学习的复杂性,提高了准确性;节省人力资源,提高工作效率。

【技术实现步骤摘要】
一种基于混合编码网络的端到端对话控制方法
本专利技术涉及对话控制领域,尤其是涉及了一种基于混合编码网络的端到端对话控制方法。
技术介绍
随着现代语音识别技术和对话控制系统的发展,采用问答形式的自然语言对话系统是当前对话系统领域的研究热点,其包括了自然语言理解、对话管理、信息抽取和自然语言生成等技术。对话控制可以应用在公众场合,如机场、车站、银行等的信息查询系统,移动信息查询终端,在线应答服务等。目前,许多网站都提供了在线应答服务,但其系统需要较多训练数据,学习复杂性高,准确性却较低。本专利技术提出了一种基于混合编码网络的端到端对话控制方法,先将用户话语作为文本形成词袋矢量,通过实体抽取、实体跟踪将特征分量级联成特征向量,再将载体递给RNN计算隐藏状态,传递到softmax激活的密集层,标准化后选择动作模板并传递到实体输出,在实体中替换并完全形成动作,若动作是文本,则呈现给用户,并循环重复。本专利技术中HCN以相当少的训练数据实现相同的性能,同时保持端到端可训练性,降低了学习的复杂性,提高了准确性;节省人力资源,提高工作效率。
技术实现思路
针对需要较多训练数据,学习复杂性高等问题,本专利本文档来自技高网...
一种基于混合编码网络的端到端对话控制方法

【技术保护点】
一种基于混合编码网络的端到端对话控制方法,其特征在于,主要包括混合编码网络(HCN)模型(一);应用循环神经网络(RNN)学习“端到端”模型(二);监督学习评价(三);通过监督学习或强化学习来训练神经网络(四)。

【技术特征摘要】
1.一种基于混合编码网络的端到端对话控制方法,其特征在于,主要包括混合编码网络(HCN)模型(一);应用循环神经网络(RNN)学习“端到端”模型(二);监督学习评价(三);通过监督学习或强化学习来训练神经网络(四)。2.基于权利要求书1所述的混合编码网络(HCN)模型(一),其特征在于,HCN的四个组件是递归神经网络、特定领域的软件、特定领域动作模板、用于标识文本中的实体引用的常规实体抽取模块;RNN和开发者代码都保持状态;每个操作模板可以是文本交际操作或应用程序接口(API)调用。3.基于权利要求书2所述的HCN模型,其特征在于,当用户提供话语作为文本时,周期开始;形成词袋矢量;再使用预建话语嵌入模型形成话语嵌入;接着,实体抽取模块标识实体;然后将文本和实体提及传递给由开发者提供的实体跟踪代码,将文本映射到数据库中的特定行;该代码可以返回动作掩码,指示当前时间步骤允许的动作,作为位向量;它还可以可选地返回上下文特征,有助于区分动作的特征;特征分量级联形成特征向量;该载体被传递给RNN,RNN计算隐藏状态(向量),为下一个时间步长保留隐藏状态,并将其传递到softmax激活的密集层,输出维度等于不同系统动作模板的数量,输出是动作模板分布;接下来,将动作掩模应用为逐元素乘法,并且将结果归一化回概率分布,使非允许的动作采用概率零;从所得到的分布选择动作;当强化学习活动时,从分布中采样动作;当强化学习不活动时,选择最佳动作,即选择具有最高概率的动作;接下来,所选择的动作被传递到实体输出开发人员代码,可以在实体中替换并产生完全形成的动作;如果它是API动作,API充当传感器并返回与对话相关的特征,因此被添加到下一个时间步长中的特征向量;如果动作是文本,则将其呈现给用户,并且循环然后重复;在下一时间步骤中将所采取的动作作为特征提供给RNN。4.基于权利要求书1所述的应用循环神经网络(RNN)来学习“端到端”模型(二),其特征在于,从可观察的对话历史直接映射到输出字序列;这些系统可以通过添加特殊的“API调用”动作,将数据库输出枚举为标记序列,然后使用存储器网络、门控存储器网络、查询减少网络和复制网络来学习RNN,从而应用于面向任务的域;在这些架构的每一个中,RNN学习操纵实体值;通过生成标记序列(或排列所有可能的表面形式)来产生输出;HCN还使用RNN累积对话状态并选择动作;HCN使用开发者提供的动作模板,可以包含实体引用。5.基于权利要求书1所述的监督学习评价(三),其特征在于,应用HCN的简单域专用软件要先对实体提取使用简单的字符串匹配,其具有预定义的实体名称列表;其次,在上下文更新中,创建用于跟踪实体的简单规则,其中在输入中识别的实体覆盖现有条目;然后,系统动作被模板化;当数据库结果接收到实体状态,按评级排序;最后创建编码常识依赖性的动作掩码。6.基于权利要求书5所述的监督学习评价,其特征在于,使用特定领域的软件在训练集上训练HCN,使用优化器为循环层选择长短期...

【专利技术属性】
技术研发人员:夏春秋
申请(专利权)人:深圳市唯特视科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1