对话状态的追踪方法及装置、电子设备和存储介质制造方法及图纸

技术编号：40498807 阅读：7 留言：0更新日期：2024-02-26 19:26

本公开公开了对话状态的追踪方法及装置、电子设备和存储介质，涉及人工智能技术领域，通过使用预设词频算法提取文本向量的全局特征，使用神经网络模型提取文本向量的局部特征，以及使用长短期记忆网络模型提取文本向量的时序特征的方法，能获得文本向量在时序、空间、全局和局部的多维特征集合，在提取更多的特征向量的同时兼顾了对会话中的上下文信息的提取，更好的实现对用户对话状态的跟踪。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能，尤其涉及一种对话状态的追踪方法及装置、电子设备和存储介质。

技术介绍

1、对话状态跟踪(dialogue state tracking，dst)是会话式ai中的关键技术，它旨在实时捕捉对话中的信息，以便生成更准确、自然的回复。

2、目前，现有的对话状态追踪研究中，主要使用基于生成模型的方法，基于生成模型的方法是将对话状态建模成贝叶斯网络，可以通过当前的系统动作和语音识别结果来估算当前对话状态的信念分布。上述方法虽然能够在一定程度上实现对话状态的跟踪，但是会随着对话规模的增加导致求解的复杂度逐渐增加，并且由于其使用独立性假设，难以提取会话中的历史和上下文信息，

技术实现思路

1、本公开提供了一种对话状态的追踪方法、装置、电子设备和存储介质。其主要目的在于解决对话状态追踪研究中难以提取会话中的历史和上下文信息的问题。

2、根据本公开的第一方面，提供了一种对话状态的追踪方法，其中，包括：

3、根据预设词频算法确定文本向量中各关键词的词频；其中，所述文本向量中包含词向量、分段向量和位置向量；

4、基于预设筛选算法与各所述关键词的词频，对各所述关键词进行筛选，得到目标关键词；

5、将各所述目标关键词的词向量、分段向量和位置向量输入神经网络模型中，得到所述神经网络模型输出的文本特征向量；

6、将所述文本特征向量输入长短期记忆网络模型，得到所述文本特征向量的对应槽位和槽值。

7、可选的，在根据

8、获取用户的语音文本信息；其中，所述语音文本信息为根据用户的语音数据进行音频转换得到的；

9、根据预设文本向量转换算法，将所述语音文本信息转换为文本向量。

10、可选的，在将所述文本特征向量输入长短期记忆网络模型，得到所述文本特征向量的对应槽位和槽值之前，所述方法还包括：

11、获取第一训练集及第二训练集；其中，所述第一训练集第所述第二训练集包含的训练用文本向量的应用场景不同；

12、将各所述训练用文本特征向量输入所述长短期记忆网络模型，得到各所述训练用文本特征向量的槽值预测概率；

13、计算所述槽值预测概率与真实槽值之间的偏差程度，并根据所述偏差程度，更新所述长短期记忆网络模型及所述神经网络模型的参数设置；

14、重复上述训练过程，直至所述长短期记忆网络模型及所述神经网络模型的参数设置满足预设收敛条件时，停止训练。

15、可选的，在将各所述训练用文本特征向量输入所述长短期记忆网络模型，得到各所述训练用文本特征向量的槽值预测概率之前，所述方法还包括：

16、根据预设词频算法确定各所述训练用文本向量中各训练用关键词的词频；

17、基于预设筛选算法与各所述训练用关键词的词频，对各所述训练用关键词进行筛选，得到训练用目标关键词；

18、将各所述训练用目标关键词的词向量、分段向量和位置向量输入神经网络模型中，得到所述神经网络模型输出的训练用文本特征向量。

19、可选的，所述将各所述训练用文本特征向量输入所述长短期记忆网络模型，得到各所述训练用文本特征向量的槽值预测概率包括：

20、在将各所述训练用文本特征向量输入所述长短期记忆网络模型后，得到所述长短期记忆网络模型输出的结果序列；

21、将所述结果序列与目标卷积核进行卷积计算，得到所述结果序列的槽值预测概率。

22、根据本公开的第二方面，提供了一种对话状态的追踪装置，包括：

23、确定单元，用于根据预设词频算法确定文本向量中各关键词的词频；其中，所述文本向量中包含词向量、分段向量和位置向量；

24、筛选单元，用于基于预设筛选算法与各所述关键词的词频，对各所述关键词进行筛选，得到目标关键词；

25、第一计算单元，用于将各所述目标关键词的词向量、分段向量和位置向量输入神经网络模型中，得到所述神经网络模型输出的文本特征向量；

26、第二计算单元，用于将所述文本特征向量输入长短期记忆网络模型，得到所述文本特征向量的对应槽位和槽值。

27、可选的，所述装置还包括：

28、第一获取单元，用于在确定单元根据预设词频算法确定文本向量中各关键词的词频之前，获取用户的语音文本信息；其中，所述语音文本信息为根据用户的语音数据进行音频转换得到的；

29、转换单元，用于根据预设文本向量转换算法，将所述语音文本信息转换为文本向量。

30、可选的，所述装置还包括：

31、第二获取单元，用于在第二计算单元，用于将所述文本特征向量输入长短期记忆网络模型，得到所述文本特征向量的对应槽位和槽值之前，获取第一训练集及第二训练集；其中，所述第一训练集第所述第二训练集包含的训练用文本向量的应用场景不同；

32、第三计算单元，用于将各所述训练用文本特征向量输入所述长短期记忆网络模型，得到各所述训练用文本特征向量的槽值预测概率；

33、第四计算单元，用于计算所述槽值预测概率与真实槽值之间的偏差程度，并根据所述偏差程度，更新所述长短期记忆网络模型及所述神经网络模型的参数设置；

34、训练单元，用于重复上述训练过程，直至所述长短期记忆网络模型及所述神经网络模型的参数设置满足预设收敛条件时，停止训练。

35、可选的，所述装置还包括：

36、确定单元还用于在第三计算单元将各所述训练用文本特征向量输入所述长短期记忆网络模型，得到各所述训练用文本特征向量的槽值预测概率之前，根据预设词频算法确定各所述训练用文本向量中各训练用关键词的词频；

37、筛选单元还用于基于预设筛选算法与各所述训练用关键词的词频，对各所述训练用关键词进行筛选，得到训练用目标关键词；

38、第一计算单元还用于将各所述训练用目标关键词的词向量、分段向量和位置向量输入神经网络模型中，得到所述神经网络模型输出的训练用文本特征向量。

39、可选的，所述第四计算单元还用于：

40、在将各所述训练用文本特征向量输入所述长短期记忆网络模型后，得到所述长短期记忆网络模型输出的结果序列；

41、将所述结果序列与目标卷积核进行卷积计算，得到所述结果序列的槽值预测概率。

42、根据本公开的第三方面，提供了一种电子设备，包括：

43、至少一个处理器；以及

44、与所述至少一个处理器通信连接的存储器；其中，

45、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述第一方面所述的方法。

46、根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行前述第一方面本文档来自技高网...

【技术保护点】

1.一种对话状态的追踪方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在根据预设词频算法确定文本向量中各关键词的词频之前，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，在将所述文本特征向量输入长短期记忆网络模型，得到所述文本特征向量的对应槽位和槽值之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，在将各所述训练用文本特征向量输入所述长短期记忆网络模型，得到各所述训练用文本特征向量的槽值预测概率之前，所述方法还包括：

5.根据权利要求3所述的方法，其特征在于，所述将各所述训练用文本特征向量输入所述长短期记忆网络模型，得到各所述训练用文本特征向量的槽值预测概率包括：

6.一种对话状态的追踪装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述装置还包括：

8.一种电子设备，其特征在于，包括：

9.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法。

10.一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-5中任一项所述的方法。

...

【技术特征摘要】

1.一种对话状态的追踪方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在根据预设词频算法确定文本向量中各关键词的词频之前，所述方法还包括：

5.根据权利要求3所述的方法，其特征在于，所述将各所...

【专利技术属性】
技术研发人员：黄翔霖，田芳，严蔚岚，
申请(专利权)人：中移苏州软件技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人