一种分层选择槽位相关上下文的对话状态生成方法及装置制造方法及图纸

技术编号：31166348 阅读：19 留言：0更新日期：2021-12-04 11:09

本发明专利技术公开了一种分层选择槽位相关上下文的对话状态生成方法及装置，方法包括：使用门控循环单元编码对话轮向量获得对话轮级隐含状态序列；通过多步选择输出每个对话轮包含槽值的概率；将槽位向量作为门控循环单元的初始输入，在生成槽值的每个时间步中，将上一步生成的单词标签的词向量输入到状态生成器获得当前的隐含状态；采用加权复制机制将对话轮包含槽值的概率和从对话轮复制一个单词的概率分布相乘，获得从对话历史中复制单词的概率分布，进而预测当前时刻的单词标签。装置包括：处理器和存储器。本发明专利技术减少了对话文本中噪声信号的干扰，使槽值的生成结果更加准确。使槽值的生成结果更加准确。使槽值的生成结果更加准确。

全部详细技术资料下载

【技术实现步骤摘要】
一种分层选择槽位相关上下文的对话状态生成方法及装置

[0001]本专利技术涉及对话状态追踪领域，尤其涉及一种分层选择槽位相关上下文的对话状态生成方法及装置，即从语音识别和自然语言理解模块产生的一系列噪声观测中准确地估计当前对话状态的紧凑表示。

技术介绍

[0002]对话是人工智能计算机科学和人工智能领域长期面临的挑战之一。由于人类对话本质上是复杂和含糊的，学习一个可以执行任意任务的开放域对话AI(对话AI是计算机或程序，它们通过自然语言对话与人进行交互，就像真人一样)仍然是非常困难的，因此，工业应用没有侧重于创建能够达到人类水平智能的对话系统，而是侧重于建立面向任务的对话系统，该系统可以帮助用户完成航班预订和查询公共汽车信息等具体任务。随着用户需求多样性及用户目标复杂性的逐渐增加，构建一个能够跨不同应用领域处理任务的对话系统变得越来越重要。一个相对智能的系统是允许在对话过程中用户对自己的需求进行更改或完善的。因此，系统需要时刻监测对话进行的状况并制定合适的对话策略，保证对话朝着预设的服务目标高效进行。对话状态追踪作为整个对话系统中的核心模块，对于对话系统内部状态的更新以及对话策略的生成起到了至关重要的作用。
[0003]在多领域对话状态追踪中，模型期望预测每个领域中的每个槽的(领域，槽，值)三元组，而不只是预测(槽，值)对。这一任务是一个巨大的挑战，因为随着对话的进行对话文本的长度不断增加，而且不同领域的一些槽位具有相关性。
[0004]当前的解决方案存在以下问题，一方面，现有的工作主要集中在多个粒度...

【技术保护点】

【技术特征摘要】
1.一种分层选择槽位相关上下文的对话状态生成方法，其特征在于，所述方法包括：使用门控循环单元编码对话轮向量获得对话轮级隐含状态序列，利用多步选择判断槽值所在的对话轮；利用融合门控将槽位感知上下文向量和槽位向量融合获得重新表述的槽位向量；通过多步选择输出每个对话轮包含槽值的概率；将槽位向量作为门控循环单元的初始输入，在生成槽值的每个时间步中，将上一步生成的单词标签的词向量输入到状态生成器获得当前的隐含状态；采用加权复制机制将对话轮包含槽值的概率和从对话轮复制一个单词的概率分布相乘，获得从对话历史中复制单词的概率分布，进而预测当前时刻的单词标签。2.根据权利要求1所述的一种分层选择槽位相关上下文的对话状态生成方法，其特征在于，所述多步选择具体为：在第τ步使用注意机制作为选择器，在每一步生成回合级上下文向量：在第τ步使用注意机制作为选择器，在每一步生成回合级上下文向量：在第τ步使用注意机制作为选择器，在每一步生成回合级上下文向量：其中，是可学习的参数，为槽位与每个对话轮之间的匹配分数，为归一化后的槽位与每个对话轮之间的匹配分数；c
τ
为第τ步对话轮级上下文向量，tanh为激活函数；d
h
为隐含状态的维度；s
τ
为槽位向量；为对话轮的句子级表示；使用单向门控循环单元存储对话轮级上下文向量，获得槽位感知上下文向量z
τ
：z
τ

【专利技术属性】
技术研发人员：黄浩，谢红岩，
申请(专利权)人：新疆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人