对话状态生成方法和装置制造方法及图纸

技术编号：25223986 阅读：22 留言：0更新日期：2020-08-11 23:13

本发明专利技术公开一种对话状态生成方法和装置，其中，方法包括：构建插槽、领域和<领域，插槽>元组之间的模式图；对历史对话状态和对话文本分别进行编码；将模式图、编码后的历史对话状态和编码后的对话文本输入至融合网络；分别获取融合网络输出的对应于模式图的领域隐藏向量、插槽隐藏向量和<领域，插槽>元组隐藏向量，对应于编码后的历史对话状态的隐藏向量，及对应于编码后的对话文本的隐藏向量；将领域隐藏向量、插槽隐藏向量和<领域，插槽>元组隐藏向量输入至插槽门分类器，获取分类器的第一输出；将历史对话状态隐藏向量和对话文本隐藏向量输入至取值解码器，获取解码器的第二输出；将第一输出和第二输出进行结合生成当前轮的对话状态。

全部详细技术资料下载

【技术实现步骤摘要】
对话状态生成方法和装置
本专利技术属于智能对话
，尤其涉及对话状态生成方法和装置。
技术介绍
现有技术中，FJST：FlatJointStateTracker单调联合状态追踪器，使用一个双向LSTM网络去编码对话历史，并且用一个单独的FFN(FeedForwardNetwork，前馈神经网络)来预测每个插槽的取值。HJST：HierarchicalJointStateTracker层级联合状态追踪器，像FJST一样使用一个LSTM来编码对话历史，不同点在于使用的是一个分级结构。SUMBT：Slot-UtteranceMatchingBeliefTracker插槽-对话对应信念追踪器，使用BERT作文编码器来编码对话文本和<插槽,取值>元组，之后根据对话文本与备选的<插槽,取值>元组之间的距离来为每个取值打分，最后选取得分最高的取值赋给对应的插槽。HyST：HybridStateTracker混合状态追踪器，使用了层级化的RNN，针对“本体集合固定”和“本体集合可扩展”两种不同的设定做了融合。DST-Reader：DialogueStateTracking-Reader对话状态追踪阅读器，从阅读理解任务的角度建模了对话状态追踪任务，在文本中找到对应取值在对话文本中的起始位置。DST-Span：DialogueStateTracking-Span对话状态追踪跨度，像DST-Reader一样，将所有的<领域，插槽>元组看成扩展后的插槽...

【技术保护点】
1.一种对话状态生成方法，包括：/n构建插槽、领域和<领域，插槽>元组之间的模式图；/n对历史对话状态和对话文本分别进行编码，其中，所述历史对话状态有多个<领域，插槽，取值>三元组构成；/n将所述模式图、编码后的历史对话状态和编码后的对话文本输入至融合网络；/n分别获取所述融合网络输出的对应于所述模式图的领域隐藏向量、插槽隐藏向量和<领域，插槽>元组隐藏向量，对应于所述编码后的历史对话状态的历史对话状态隐藏向量，以及对应于所述编码后的对话文本的对话文本隐藏向量；/n将所述领域隐藏向量、所述插槽隐藏向量和所述<领域，插槽>元组隐藏向量输入至插槽门分类器，获取所述插槽门分类器的第一输出；/n将所述历史对话状态隐藏向量和所述对话文本隐藏向量输入至取值解码器，获取所述取值解码器的第二输出；/n将所述第一输出和所述第二输出进行结合生成当前轮的对话状态。/n

【技术特征摘要】
1.一种对话状态生成方法，包括：
构建插槽、领域和<领域，插槽>元组之间的模式图；
对历史对话状态和对话文本分别进行编码，其中，所述历史对话状态有多个<领域，插槽，取值>三元组构成；
将所述模式图、编码后的历史对话状态和编码后的对话文本输入至融合网络；
分别获取所述融合网络输出的对应于所述模式图的领域隐藏向量、插槽隐藏向量和<领域，插槽>元组隐藏向量，对应于所述编码后的历史对话状态的历史对话状态隐藏向量，以及对应于所述编码后的对话文本的对话文本隐藏向量；
将所述领域隐藏向量、所述插槽隐藏向量和所述<领域，插槽>元组隐藏向量输入至插槽门分类器，获取所述插槽门分类器的第一输出；
将所述历史对话状态隐藏向量和所述对话文本隐藏向量输入至取值解码器，获取所述取值解码器的第二输出；
将所述第一输出和所述第二输出进行结合生成当前轮的对话状态。

2.根据权利要求1所述的方法，其中，所述构建插槽、领域和<领域，插槽>元组之间的模式图包括：
将每一领域与其他领域之间互连；
将每一领域与所述每一领域下的所有插槽互连；
将具有共用取值的插槽互连；
将每一<领域，插槽>元组所包含的领域和插槽互连；
基于以上互连构建插槽、领域和<领域，插槽>元组之间的模式图。

3.根据权利要求1所述的方法，其中，所述将所述领域隐藏向量、所述插槽隐藏向量和所述<领域，插槽>元组隐藏向量输入至插槽门分类器，获取所述插槽们分类器的第一输出包括：
经由所述插槽门分类器对所述模式图中每个<领域，插槽>元组所对应的隐藏向量进行三分类，形成<领域，插槽，取值>三元组，其中，三分类的结果对应不同的取值。

4.根据权利要求3所述的方法，其中，所述三分类的结果对应的取值包括NONE，DONTCARE和PTR。

5.根据权利要求4所述的方法，其中，将所述历史对话状态隐藏向量和所述对话文本隐藏向量输入至取值解码器，获取所述取值解码器的第二输出包括：
经由所述取值解码器根据所述历史对话状态隐藏向量和所述对话文本隐藏向量使用带有拷贝机制的RNN去解码；
给每一<领域，插槽>生成对应的取值，其中，解码RNN的初始隐藏状态为当前需要生成取值的<领域，插槽>元组对应的隐藏向量。

6.根据权利要求5所述的方法，其中，所述将所述第一输出和所述第二输出...

【专利技术属性】
技术研发人员：俞凯，朱苏，李杰宇，陈露，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人