对话回复信息的生成方法及装置、介质、终端制造方法及图纸

技术编号：41127806 阅读：3 留言：0更新日期：2024-04-30 17:56

本申请公开了一种对话回复信息的生成方法及装置、介质、终端，涉及人工智能技术领域以及保险领域，主要目的在于改善现有回复准确率低下，影响电销对话整体流程，降低电销转化率的问题。包括：基于目标领域业务，向目标用户发起对话请求；若目标用户允许开启对话，则获取目标用户的用户信息，并基于生成式对话模型，根据接收到的首轮问题信息、目标领域业务信息以及用户信息生成首轮回复信息；接收针对首轮回复信息反馈的次轮问题信息，并基于生成式对话模型，根据次轮问题信息、对话上文信息、目标领域业务信息生成次轮回复信息；基于生成式对话模型，对目标用户各个轮次的问题信息进行逐轮回复，若已满足预设对话结束条件，则结束当前对话线程。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能以及保险领域，特别是涉及一种对话回复信息的生成方法及装置、介质、终端。

技术介绍

1、随着时代的发展、科学技术的进步和人们风险意识的提高，保险作为一种经济保障制度，其功能也得到了空前的发挥，保险电销行业应运而生。现如今，随着人工智能技术的飞速发展，很多保险行业使用外呼对话机器人进行保险电销。

2、目前，电销外呼对话机器人的回复内容大部分来自提前构建的保险知识库。

3、然而，由于用户提问多样化、对话场景复杂化，导致根据保险知识库生成的机器人回复内容存在无法覆盖用户多样性意图的情况以及针对个性化用户提出的问题无法给出合理回复的情况，无法满足对应场景的人机交互要求，进而降低回复准确率，影响电销对话整体流程，降低电销转化率。

技术实现思路

1、有鉴于此，本申请提供一种对话回复信息的生成方法及装置、介质、终端，主要目的在于改善现有回复准确率低下，影响电销对话整体流程，降低电销转化率的问题。

2、依据本申请一个方面，提供了一种对话回复信息的生成方法，包括：

3、基于目标领域业务，向目标用户发起对话请求；

4、若所述目标用户允许开启对话，则获取所述目标用户的用户信息，并基于已完成模型训练的生成式对话模型，根据接收到的首轮问题信息、目标领域业务信息以及所述用户信息生成首轮回复信息，所述生成式对话模型是通过对大语言模型进行目标领域知识注入和目标领域历史对话数据训练得到的；

5、接收针对所述首轮回复信息反馈的次轮

6、基于所述生成式对话模型，对所述目标用户各个轮次的问题信息进行逐轮回复，若已满足预设对话结束条件，则结束当前对话线程。

7、优选的，所述方法还包括：

8、所述目标领域业务信息包括业务介绍信息、业务流程信息和业务操作信息，所述生成式对话模型用于基于用户问题信息推理用户意图，并基于用户意图、所述用户问题信息、所述用户信息、所述对话上下文信息和所述目标领域业务信息生成回复信息；

9、其中，在用户意图为业务介绍询问的情况下，基于所述业务介绍信息、所述用户问题信息、所述用户信息和所述对话上下文信息生成回复信息；在用户意图为业务流程反馈的情况下，基于所述业务流程信息、所述用户问题信息、所述用户信息和所述对话上下文信息生成回复信息；在用户意图为业务操作询问的情况下，基于所述用户问题信息和所述业务操作信息推理用户操作界面，并基于与所述用户操作界面对应的业务操作信息、所述用户问题信息、所述用户信息和所述对话上下文信息生成回复信息。

10、优选的，所述基于已完成模型训练的生成式对话模型，根据接收到的首轮问题信息、目标领域业务信息以及所述用户信息生成首轮回复信息之前，所述方法还包括：

11、获取所述目标领域的知识数据，生成无监督学习训练样本集；

12、基于所述无监督学习训练样本集对预训练大语言模型进行无监督学习模型训练，以使得将所述知识数据注入所述预训练大语言模型，得到初步生成式对话模型；

13、获取所述目标领域的历史对话数据，生成有监督学习训练样本集，所述有监督学习训练样本包括历史问题信息、历史对话上文信息、历史目标领域业务信息以及多条标签数据，其中，所述标签数据包括预设回复信息和对应的评分；

14、基于所述有监督学习训练样本集对所述初步生成式对话模型进行有监督学习模型训练，得到已完成模型训练的生成式对话模型，所述生成式对话模型的输入为所述历史问题信息、所述历史对话上文信息、所述历史目标领域业务信息，基于所述生成式对话模型的输出为所述预设回复信息以及对应的回复信息生成概率。

15、优选的，所述基于所述有监督学习训练样本集对所述初步生成式对话模型进行有监督学习模型训练，得到已完成模型训练的生成式对话模型，具体包括：

16、基于所述初步生成式对话模型，根据所述历史问题信息、所述历史对话上文信息、所述历史目标领域业务信息得到各个所述预设回复信息的回复信息生成概率；

17、若所述回复信息生成概率与所述评分不匹配，则将所述回复信息生成概率的差值确定为第一惩罚系数；

18、基于所述初步生成式对话模型，获取最高评分预设回复信息所包含的各个分词对应的分词生成概率，并将各个所述分词生成概率的均值确定为第二惩罚系数；

19、将所述第一惩罚系数与所述第二惩罚系数的和作为所述初步生成式对话模型的损失函数，并根据所述损失函数更新所述初步生成式对话模型的参数，得到已完成模型训练的生成式对话模型。

20、优选的，所述获取所述目标领域的知识数据，生成无监督学习训练样本集，具体包括：

21、获取所述目标领域的知识数据；

22、对所述知识数据进行去重处理以及质量筛选处理，得到筛选后的知识数据；

23、对所述筛选后的知识数据进行格式转换预处理，并基于格式转换预处理后的知识数据生成无监督学习训练样本集。

24、优选的，所述获取所述目标领域的历史对话数据，生成有监督学习训练样本集，具体包括：

25、获取所述目标领域的历史客服通话语音数据；

26、将所述历史客服通话语音数据转换为文本数据；

27、根据所述文本数据生成历史对话数据，并基于所述历史对话数据生成有监督学习训练样本集。

28、优选的，所述若已满足预设对话结束条件，则结束当前对话线程，具体包括：

29、若对话轮次达到预设对话轮次阈值，则结束当前对话线程；

30、或，响应于所述目标用户触发的对话结束操作，并控制结束当前对话线程。

31、依据本申请另一个方面，提供了一种对话回复信息的生成装置，包括：

32、发起模块，用于基于目标领域业务，向目标用户发起对话请求；

33、回复模块，用于若所述目标用户允许开启对话，则获取所述目标用户的用户信息，并基于已完成模型训练的生成式对话模型，根据接收到的首轮问题信息、目标领域业务信息以及所述用户信息生成首轮回复信息，所述生成式对话模型是通过对大语言模型进行目标领域知识注入和目标领域历史对话数据训练得到的；

34、所述回复模块，用于接收针对所述首轮回复信息反馈的次轮问题信息，并基于所述生成式对话模型，根据所述次轮问题信息、对话上文信息以及所述目标领域业务信息生成次轮回复信息；

35、结束模块，用于基于所述生成式对话模型，对所述目标用户各个轮次的问题信息进行逐轮回复，若已满足预设对话结束条件，则结束当前对话线程。

36、优选的，所述目标领域业务信息包括业务介绍信息、业务流程信息和业务操作信息，所述生成式对话模型用于基于用户问题信息推理用户意图，并基于用户意图、所述用户问题信息、所述用户信息、所述对话上下文信息和所述目标领域业务信息生本文档来自技高网...

【技术保护点】

1.一种对话回复信息的生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，所述基于已完成模型训练的生成式对话模型，根据接收到的首轮问题信息、目标领域业务信息以及所述用户信息生成首轮回复信息之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述有监督学习训练样本集对所述初步生成式对话模型进行有监督学习模型训练，得到已完成模型训练的生成式对话模型，具体包括：

5.根据权利要求3所述的方法，其特征在于，所述获取所述目标领域的知识数据，生成无监督学习训练样本集，具体包括：

6.根据权利要求3所述的方法，其特征在于，所述获取所述目标领域的历史对话数据，生成有监督学习训练样本集，具体包括：

7.根据权利要求1所述的方法，其特征在于，所述若已满足预设对话结束条件，则结束当前对话线程，具体包括：

8.一种对话回复信息的生成装置，其特征在于，包括：

9.一种存储介质，所述存储介质中存储有至少一条可执行

10.一种终端，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

...

【技术特征摘要】

1.一种对话回复信息的生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求3所述的方法，其特征在于，所述获取所述目标领域的知识数据，生成无监督学习训练样本集，具体包括：<...

【专利技术属性】
技术研发人员：张航飞，沈鹏，黄明星，王福钋，周晓波，
申请(专利权)人：北京水滴科技集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人