一种基于知识树的多轮对话模型生成方法、设备及介质技术

技术编号：40370077 阅读：10 留言：0更新日期：2024-02-20 22:14

本申请实施例公开了一种基于知识树的多轮对话模型生成方法、设备及介质。包括，基于预置业务数据，构建业务知识树；遍历业务知识树，以构建多个对话路径，并基于多个对话路径生成多轮对话脚本；基于预置参数模型，对多轮对话脚本进行处理，以得到每轮对话脚本分别对应的第一合成语料；在热线客服系统中获取热线客服日志，基于业务知识树对热线客服日志进行标注，并将标注后的日志转换为第二合成语料；基于多轮对话脚本、第一合成语料与第二合成语料，对预置多轮对话模型进行调节，以使多轮对话模型根据业务知识树生成对话内容。通过上述方法提高多轮对话模型对用户问题回复的专业性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，尤其涉及一种基于知识树的多轮对话模型生成方法、设备及介质。

技术介绍

1、在当今火热的大数据和人工智能技术的驱动下，基于大数据、机器学习等技术的对话机器人不断出现。对话机器人能够根据用户输入的聊天内容，生成相应地回复。除了用于日常聊天的对话机器人外，越来越多面向业务的对话机器人被应用到各个领域中，满足对应的业务需求。

2、现有技术中，通常用管道式方法构建多轮对话系统，基于大模型构建的端到端对话系统。虽然具有较强的理解能力，但是仍存在部分缺陷，特别是生成内容专业性方面依旧欠缺，以及生成内容容易出现幻觉，即，生成的内容中经常出现不属于当前对话领域的专业知识。以致生成的多轮对话模型难以对用户提出的问题进行专业性回复。

技术实现思路

1、本申请实施例提供了一种基于知识树的多轮对话模型生成方法、设备及介质，用于解决如下技术问题：现有技术中，生成的多轮对话模型难以对用户提出的问题进行专业性回复。

2、本申请实施例采用下述技术方案：

3、本申请实施例提供一种基于知识树的多轮对话模型生成方法，包括，基于预置业务数据，构建业务知识树；遍历业务知识树，以构建多个对话路径，并基于多个对话路径生成多轮对话脚本；基于预置参数模型，对多轮对话脚本进行处理，以得到每轮对话脚本分别对应的第一合成语料；在热线客服系统中获取热线客服日志，基于业务知识树对热线客服日志进行标注，并将标注后的日志转换为第二合成语料；基于多轮对话脚本、第一合成语料与第二合成语料，对预置多

4、本申请实施例通过基于预置业务数据，构建业务知识树，能够将机器人的对话内容进行限定，使其限定于业务知识树搭范围内，从而减少对话过程中出现的不属于当前对话领域的专业知识。其次，本申请实施例通过对多轮对话脚本进行处理，以得到每轮对话脚本分别对应的第一合成语料，以及将标注后的日志转换为第二合成语料，通过不同途径获取多种训练语料，一方面能够提高对话模型语言理解能力，另一方面也能提高对用户问题回复的专业性。

5、在本申请的一种实现方式中，确定出预置业务数据中用户输入数据与答复数据，并将用户输入数据与答复数据进行匹配，以得到多个数据组；确定出用户输入数据中的标签；其中，标签与用户输入数据的文本含义相关；在多个数据中，分别进行标签的标注；按照用户输入数据的先后顺序，将标注后的多个数据组进行连接，以构建业务知识树。

6、在本申请的一种实现方式中，确定出用户输入数据中的标签之前，方法还包括：将预置业务数据样本集作为输入，将标注有标签的预置业务数据样本集作为输出，对预置神经网络模型进行训练，以得到标签标注模型；确定出用户输入数据中的标签，具体包括：将用户输入数据输入标签标注模型，通过标签标注模型输出标签。

7、在本申请的一种实现方式中，遍历业务知识树，以构建多个对话路径，具体包括：确定出业务知识树中的节点连接关系；基于节点连接关系，确定出多个节点连接路径；确定出各节点的标签，基于标签与节点连接路径，构建多个对话路径。

8、在本申请的一种实现方式中，基于多个对话路径生成多轮对话脚本，具体包括：确定出多个对话路径中的各节点分别对应的预置业务数据；基于多个对话路径中各节点的连接顺序，与各节点分别对应的预置业务数据，生成多轮对话脚本；其中，一个对话路径对应一轮对话脚本。

9、在本申请的一种实现方式中，基于预置参数模型，对多轮对话脚本进行处理，以得到每轮对话脚本分别对应的第一合成语料，具体包括：将每一轮对话脚本中的用户输入数据输入预置参数模型；基于预置参数模型，确定出每一轮对话脚本中的用户输入数据相匹配的不同文本数据；基于用户输入数据与不同文本数据，得到每轮对话脚本分别对应的第一合成语料；其中不同文本数据，与用户输入数据所对应的文本含义相关。

10、在本申请的一种实现方式中，在热线客服系统中获取热线客服日志，基于业务知识树对热线客服日志进行标注，并将标注后的日志转换为第二合成语料，具体包括：在热线客服系统中获取热线客服日志；其中，热线客服日志与客服人员的通话数据相关；将热线客服日志与业务知识树进行文本含义比对；确定出比对结果符合要求的热线客服日志，并通过业务知识树中的数据，将比对结果符合要求的热线客服日志进行替换；基于预置语料格式，将替换后的热线客服日志转换为第二合成语料。

11、在本申请的一种实现方式中，基于多轮对话脚本、第一合成语料与第二合成语料，对预置多轮对话模型进行调节之前，方法还包括：对多轮对话脚本、第一合成语料与第二合成语料进行数据比对，以确定出重复的数据；以及对多轮对话脚本、第一合成语料与第二合成语料进行数据检测，以确定出缺失的数据；将重复的数据与缺失的数据进行标注，并进行删除处理。

12、本申请实施例提供一种基于知识树的多轮对话模型生成设备，包括：至少一个处理器；以及，与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够：基于预置业务数据，构建业务知识树；遍历业务知识树，以构建多个对话路径，并基于多个对话路径生成多轮对话脚本；基于预置参数模型，对多轮对话脚本进行处理，以得到每轮对话脚本分别对应的第一合成语料；在热线客服系统中获取热线客服日志，基于业务知识树对热线客服日志进行标注，并将标注后的日志转换为第二合成语料；基于多轮对话脚本、第一合成语料与第二合成语料，对预置多轮对话模型进行调节，以使多轮对话模型根据业务知识树生成对话内容。

13、本申请实施例提供的一种非易失性计算机存储介质，存储有计算机可执行指令，计算机可执行指令设置为：基于预置业务数据，构建业务知识树；遍历业务知识树，以构建多个对话路径，并基于多个对话路径生成多轮对话脚本；基于预置参数模型，对多轮对话脚本进行处理，以得到每轮对话脚本分别对应的第一合成语料；在热线客服系统中获取热线客服日志，基于业务知识树对热线客服日志进行标注，并将标注后的日志转换为第二合成语料；基于多轮对话脚本、第一合成语料与第二合成语料，对预置多轮对话模型进行调节，以使多轮对话模型根据业务知识树生成对话内容。

14、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：本申请实施例通过基于预置业务数据，构建业务知识树，能够将机器人的对话内容进行限定，使其限定于业务知识树搭范围内，从而减少对话过程中出现的不属于当前对话领域的专业知识。其次，本申请实施例通过对多轮对话脚本进行处理，以得到每轮对话脚本分别对应的第一合成语料，以及将标注后的日志转换为第二合成语料，通过不同途径获取多种训练语料，一方面能够提高对话模型语言理解能力，另一方面也能提高对用户问题回复的专业性。

本文档来自技高网...

【技术保护点】

1.一种基于知识树的多轮对话模型生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述基于预置业务数据，构建业务知识树，具体包括：

3.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述确定出所述用户输入数据中的标签之前，所述方法还包括：

4.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述遍历所述业务知识树，以构建多个对话路径，具体包括：

5.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述基于所述多个对话路径生成多轮对话脚本，具体包括：

6.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述基于预置参数模型，对所述多轮对话脚本进行处理，以得到每轮对话脚本分别对应的第一合成语料，具体包括：

7.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述在热线客服系统中获取热线客服日志，基于所述业务知识树对所述热线客服日志进行标注，并

8.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述基于所述多轮对话脚本、所述第一合成语料与所述第二合成语料，对预置多轮对话模型进行调节之前，所述方法还包括：

9.一种基于知识树的多轮对话模型生成设备，包括：

10.一种非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：

...

【技术特征摘要】

1.一种基于知识树的多轮对话模型生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述基于预置业务数据，构建业务知识树，具体包括：

3.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述确定出所述用户输入数据中的标签之前，所述方法还包括：

4.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述遍历所述业务知识树，以构建多个对话路径，具体包括：

5.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法，其特征在于，所述基于所述多个对话路径生成多轮对话脚本，具体包括：

6.根据权利要求1所述的一种基于知识树的多轮对话模型生成...

【专利技术属性】
技术研发人员：张琨，丁鑫，田钿，朱锦雷，张传锋，张鑫，
申请(专利权)人：神思电子技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人