应用于多轮对话系统的对话生成方法、装置、设备及介质制造方法及图纸

技术编号:33712206 阅读:51 留言:0更新日期:2022-06-06 08:47
本发明专利技术公开了应用于多轮对话系统的对话生成方法、装置、设备及介质,包括获取用户的第一轮对话,利用语义理解模型对第一轮对话进行特征抽取,得到第一轮对话内容的语义特征表示;利用编码器对语义特征表示抽取深层次的语义信息,生成第一轮中间变量;利用意图特征计算网络对第一轮中间变量抽取得到意图特征表示;将意图特征表示和第一轮中间变量分别解码,将解码结果输入生成网络中,由生成网络完成响应,生成第一轮对话内容的响应文本并返回,完成第一轮对话生成;等待并获取下一轮对话,重复上述步骤,直至用户触发结束条件,本次多轮对话结束。本发明专利技术适用于多轮交互的对话场景,基于当前对话内容和历史对话记录实现响应生成,完成多轮交互。完成多轮交互。完成多轮交互。

【技术实现步骤摘要】
应用于多轮对话系统的对话生成方法、装置、设备及介质


[0001]本专利技术涉及对话系统领域,属于自然语言处理技术,具体涉及应用于多轮对话系统的对话生成方法、装置、设备及介质。

技术介绍

[0002]现有技术中基于对话系统主要包括以下两类:
[0003]第一类是基于匹配或检索的对话系统,专利申请号CN113806509A、CN113901188A,基于匹配或检索的方法:现有技术依赖于几乎全封闭的领域知识库,在识别到用户对话意图后,通过特定的机制在知识库中匹配相似的候选句,最后通过相似度计算输出相似度最高的候选句所对应的答复句。该类方法虽然实现成本较低,可操作性强,但在实际应用中容易受到知识库的限制,在遭遇领域外的知识时,该类方法的可用性会大幅降低。
[0004]第二类是基于生成的对话系统,专利申请号CN113792126A,基于生成的方法:这类方法利用生成对抗网络、自编码器等生成式模型直接进行响应文本的生成,相较于基于匹配和检索的方法,生成类的方法模型更为复杂和不便于操控,但其在应用中也更为灵活,能更好地适用于较为开放的知识领域。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种应用于多轮对话系统的对话生成方法,其特征在于,该方法包括:获取用户的第一轮对话,利用语义理解模型对所述第一轮对话进行特征抽取,得到第一轮对话内容的语义特征表示;根据所述语义特征表示,利用编码器对所述语义特征表示抽取深层次的语义信息,生成第一轮中间变量;根据所述第一轮中间变量,利用意图特征计算网络对所述第一轮中间变量抽取得到意图特征表示;将所述意图特征表示和所述第一轮中间变量分别解码,并将解码结果输入生成网络中,由所述生成网络完成响应,生成第一轮对话内容的响应文本并返回,至此完成是第一轮对话生成;等待并获取下一轮对话,重复上述步骤,直至用户触发结束条件,本次多轮对话结束。2.根据权利要求1所述的一种应用于多轮对话系统的对话生成方法,其特征在于,所述的等待并获取下一轮对话,重复上述步骤,直至用户触发结束条件,本次多轮对话结束;包括:在执行第N轮对话时,将历史用户对话内容的意图特征表示组和所述第N

1轮中间变量分别解码,并将解码结果输入生成网络中,由所述生成网络完成响应,生成第N轮对话内容的响应文本并返回,至此完成是第N轮对话生成;其中,所述历史用户对话内容的意图特征表示组为前N

1轮意图特征表示的集合,包括第一轮的意图特征表示、第二轮的意图特征表示、
……
、第N

1轮的意图特征表示。3.根据权利要求1所述的一种应用于多轮对话系统的对话生成方法,其特征在于,所述的获取用户的第一轮对话,利用语义理解模型对所述第一轮对话进行特征抽取,得到第一轮对话内容的语义特征表示;具体包括:根据用户的第一轮对话,获取用户的第一轮对话输入文本;利用分词算法对用户的第一轮对话输入文本进行分词处理,得到分词序列S1=(s1,s2,...,s
t
,...,s
n
);其中,s
t
=onehot(x
t
),s
t
为采用读热编码法将输入文本数据x
t
转换为的数值向量;t为分词序列中的第t个词;将所述分词序列S1输入预设的语义理解模型中,对所述分词序列S1进行特征抽取,计算第一轮对话的语义向量W1=(w1,w2,...,w
t
,...w
n
)并输出,w
t
为第一轮对话的语义向量W1中的元素。4.根据权利要求3所述的一种应用于多轮对话系统的对话生成方法,其特征在于,所述语义理解模型为bi

LSTM网络,采用所述bi

LSTM网络计算第一轮对话的语义向量,计算公式为:式中,w
t
为第一轮对话的语义向量W1中的元素;是根据基于两个序列方向计算出的语义向量,MLP(
·
)是一层全连接网络。5.根据权利要求3所述的一种应用于多轮对话系统的对话生成方法,其特征在于,所述的根据所述语义特征表示,利用编码器对所述语义特征表示抽取更深层次的语义信息,生成第一轮中间变量;具体包括:
构建以bi

GRU为骨架的编码器;根据所述第一轮对话的语义向量W1,将所述第一轮对话的语义向量W1中的元素w
t
输入构建好的编码器中,计算更新门权重z
t
和重置门r
t
权重:z
t
=σ(W
z...

【专利技术属性】
技术研发人员:徐万珺
申请(专利权)人:四川新网银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1