对话意图识别方法、装置及计算机可读存储介质制造方法及图纸

技术编号：40040212 阅读：5 留言：0更新日期：2024-01-16 19:36

本申请公开了一种对话意图识别方法、装置及计算机可读存储介质，方法通过获取目标对话数据以及与目标对话数据关联的历史对话数据；对目标对话数据以及历史对话数据进行实体词提取，得到多个候选实体词；分别将每一候选实体词与目标对话数据以及历史对话数据进行拼接，得到每一候选实体词对应的表征数据；基于表征数据对每一候选实体词进行关注度分析，得到每一候选实体词对应的关注度得分；根据每一候选实体词对应的关注度得分对目标对话数据进行意图识别。该方法可以有效提升对话意图识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，具体涉及一种对话意图识别方法、装置及计算机可读存储介质。

技术介绍

1、人工智能(artificial intelligence，ai)，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。近年来，人工智能技术发展迅速，在人们生活的众多领域中也得到了广泛的应用。例如，在一些虚拟人应用，比如智能音箱等应用中，便采用了人工智能中的自然语言处理(natural language processing，nlp)技术。该应用可以大大提升人机交互的体验。

2、然而，目前在一些情况下，与用户进行对话的虚拟人存在无法准确识别用户对话意图，进而无法作出合理对话的情况，大大影响了用户的使用体验。

技术实现思路

1、本申请实施例提供一种对话意图识别方法、装置及计算机可读存储介质，该方法可以提升对话意图识别的准确性。

2、本申请第一方面提供一种对话意图识别方法，方法包括：

3、获取目标对话数据以及与所述目标对话数据关联的历史对话数据；

4、对所述目标对话数据以及所述历史对话数据进行实体词提取，得到多个候选实体词；

5、分别将每一候选实体词与所述目标对话数据以及所述历史对话数据进行拼接，得到每一候选实体词对应的表征数据；

6、基于所述表征数据对每一候选实体词进行关注度分析，得到每一候选实体词对应的关注度得分；

7、根据每一候选实体词对应的关注度得分对所述目标对话数据进行意图识别。

8、相应的，本申请第二方面提供一种对话意图识别装置，装置包括：

9、获取单元，用于获取目标对话数据以及与所述目标对话数据关联的历史对话数据；

10、提取单元，用于对所述目标对话数据以及所述历史对话数据进行实体词提取，得到多个候选实体词；

11、拼接单元，用于分别将每一候选实体词与所述目标对话数据以及所述历史对话数据进行拼接，得到每一候选实体词对应的表征数据；

12、分析单元，用于基于所述表征数据对每一候选实体词进行关注度分析，得到每一候选实体词对应的关注度得分；

13、识别单元，用于根据每一候选实体词对应的关注度得分对所述目标对话数据进行意图识别。

14、在一些实施例中，提取单元，包括：

15、第一获取子单元，用于获取预设的字典树，所述字典树包括多个实体词；

16、提取子单元，用于将所述目标对话数据以及所述历史对话数据输入至所述字典树进行实体词查找，得到输出的所述目标对话数据以及所述历史对话数据中包含的多个候选实体词。

17、在一些实施例中，分析单元，，包括：

18、第二获取子单元，用于获取训练后的神经网络模型，所述神经网络模型用于对实体词进行关注度分析；

19、分析子单元，用于采用所述训练后的神经网络模型对每一候选实体词对应的表征数据进行关注度分析，得到每一候选实体词对应的关注度得分。

20、在一些实施例中，本申请提供的对话意图识别装置，还包括：

21、第三获取子单元，用于获取预设应用场景相关的训练样本数据以及经过预训练的神经网络模型，所述训练样本数据包括多组训练数据集，所述训练数据集包括样本目标对话数据、样本历史对话数据、以及所述样本目标对话数据与所述样本历史对话数据中样本实体词的标注数据；

22、微调子单元，用于采用所述训练样本数据对所述经过预训练的神经网络模型进行微调，得到训练后的神经网络模型。

23、在一些实施例中，微调子单元，包括：

24、增强模块，用于对所述训练样本数据进行数据增强，得到扩充训练样本数据；

25、第一微调模块，用于采用所述扩充训练样本数据对所述经过预训练的神经网络模型进行微调，得到训练后的神经网络模型。

26、在一些实施例中，第一微调模块，包括：

27、微调子模块，用于多次采用所述扩充训练样本数据对所述经过预训练的神经网络模型进行微调，得到多个训练后的神经网络模型；

28、分析子单元，还用于：

29、分别采用所述多个训练后的神经网络模型对每一候选实体词对应的表征数据进行关注度分析，得到每一候选实体词对应的多个关注度得分；

30、计算子模块，用于计算每一候选实体词对应的多个关注度得分的均值，得到每一候选实体词对应的关注度得分。

31、在一些实施例中微调子单元，包括：

32、拼接模块，用于将每一样本实体词与对应的样本目标对话数据以及样本历史对话数据进行拼接，得到每一样本实体词对应的表征数据；

33、第二微调模块，用于以每一样本实体词对应的表征数据为输入，每一样本实体词对应的标注数据为输出对经过预训练的神经网络模型进行微调，得到训练后的神经网络模型。

34、在一些实施例中，本申请提供的对话意图识别装置，还包括：

35、第四获取子单元，用于获取初始训练样本数据，所述初始训练样本数据包括正样本数据以及负样本数据；

36、训练子单元，用于根据所述初始训练样本数据对预设的神经网络模型进行训练，得到训练过的神经网络模型。

37、在一些实施例中，识别单元，包括：

38、第一确定子单元，用于确定关注度得分最高的第一目标候选实体词；

39、第一识别子单元，用于基于所述第一目标候选实体词对所述目标对话数据进行意图识别，得到对话意图。

40、在一些实施例中，识别单元，包括：

41、第二确定子单元，用于确定关注度得分高于预设分值的多个第二目标候选实体词；

42、第二识别子单元，用于基于所述多个第二目标候选实体词对所述目标对话数据进行意图识别，得到对话意图。

43、在一些实施例中，本申请提供的对话意图识别装置，还包括：

44、生成子单元，用于基于所述对话意图生成对应的答复数据；

45、答复子单元，用于采用所述答复数据进行对话答复。

46、本申请第三方面还提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本申请第一方面所提供的对话意图识别方法中的步骤。

47、本申请第四方面提供一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本申请第一方面所提供的对话意图识别方法中的步骤。

48、本申请第五方面提供一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现第一方面所提供的对话意图识别方法中的步骤。

49、本申请实施例提供的对话意图识别方法，通过获取目标对话数据以及与目标对话数据关联的历史对话数据；对目标对话数据以及历史对话数据进行实体词提取，得到多个候选实体词；分别将每一候选实体词本文档来自技高网...

【技术保护点】

1.一种对话意图识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述目标对话数据以及所述历史对话数据进行实体词提取，得到多个候选实体词，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述表征数据对每一候选实体词进行关注度分析，得到每一候选实体词对应的关注度得分，包括：

4.根据权利要求3所述的方法，其特征在于，所述获取训练过的神经网络模型，所述神经网络模型用于对实体词进行关注度分析之前，还包括：

5.根据权利要求4所述的方法，其特征在于，所述采用所述训练样本数据对所述经过预训练的神经网络模型进行微调，得到训练后的神经网络模型，包括：

6.根据权利要求5所述的方法，其特征在于，所述采用所述扩充训练样本数据对所述经过预训练的神经网络模型进行微调，得到训练后的神经网络模型，包括：

7.根据权利要求4所述的方法，其特征在于，所述采用所述训练样本数据对所述经过预训练的神经网络模型进行微调，得到训练后的神经网络模型，包括：

8.根据权利要求4所述的方法，其特征

9.根据权利要求1所述的方法，其特征在于，所述根据每一候选实体词对应的关注度得分对所述目标对话数据进行意图识别，包括：

10.根据权利要求1所述的方法，其特征在于，所述根据每一候选实体词对应的关注度得分对所述目标对话数据进行意图识别，包括：

11.根据权利要求9或权利要求10所述的方法，其特征在于，所述方法还包括：

12.一种对话意图识别装置，其特征在于，所述装置包括：

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至11中任一项所述的对话意图识别方法中的步骤。

14.一种计算机设备，其特征在于，包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的对话意图识别方法中的步骤。

15.一种计算机程序产品，包括计算机程序/指令，其特征在于，所述计算机程序/指令被处理器执行时实现权利要求1至11中任一项所述的对话意图识别方法中的步骤。

...

【技术特征摘要】

1.一种对话意图识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述目标对话数据以及所述历史对话数据进行实体词提取，得到多个候选实体词，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述表征数据对每一候选实体词进行关注度分析，得到每一候选实体词对应的关注度得分，包括：

4.根据权利要求3所述的方法，其特征在于，所述获取训练过的神经网络模型，所述神经网络模型用于对实体词进行关注度分析之前，还包括：

8.根据权利要求4所述的方法，其特征在于，所述获取预设应用场景相关的训练样本数...

【专利技术属性】
技术研发人员：颜泽龙，魏重强，王智圣，
申请(专利权)人：腾讯数码深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人