System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于知识树的多轮对话模型生成方法、设备及介质技术_技高网

一种基于知识树的多轮对话模型生成方法、设备及介质技术

技术编号:40370077 阅读:10 留言:0更新日期:2024-02-20 22:14
本申请实施例公开了一种基于知识树的多轮对话模型生成方法、设备及介质。包括,基于预置业务数据,构建业务知识树;遍历业务知识树,以构建多个对话路径,并基于多个对话路径生成多轮对话脚本;基于预置参数模型,对多轮对话脚本进行处理,以得到每轮对话脚本分别对应的第一合成语料;在热线客服系统中获取热线客服日志,基于业务知识树对热线客服日志进行标注,并将标注后的日志转换为第二合成语料;基于多轮对话脚本、第一合成语料与第二合成语料,对预置多轮对话模型进行调节,以使多轮对话模型根据业务知识树生成对话内容。通过上述方法提高多轮对话模型对用户问题回复的专业性。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种基于知识树的多轮对话模型生成方法、设备及介质


技术介绍

1、在当今火热的大数据和人工智能技术的驱动下,基于大数据、机器学习等技术的对话机器人不断出现。对话机器人能够根据用户输入的聊天内容,生成相应地回复。除了用于日常聊天的对话机器人外,越来越多面向业务的对话机器人被应用到各个领域中,满足对应的业务需求。

2、现有技术中,通常用管道式方法构建多轮对话系统,基于大模型构建的端到端对话系统。虽然具有较强的理解能力,但是仍存在部分缺陷,特别是生成内容专业性方面依旧欠缺,以及生成内容容易出现幻觉,即,生成的内容中经常出现不属于当前对话领域的专业知识。以致生成的多轮对话模型难以对用户提出的问题进行专业性回复。


技术实现思路

1、本申请实施例提供了一种基于知识树的多轮对话模型生成方法、设备及介质,用于解决如下技术问题:现有技术中,生成的多轮对话模型难以对用户提出的问题进行专业性回复。

2、本申请实施例采用下述技术方案:

3、本申请实施例提供一种基于知识树的多轮对话模型生成方法,包括,基于预置业务数据,构建业务知识树;遍历业务知识树,以构建多个对话路径,并基于多个对话路径生成多轮对话脚本;基于预置参数模型,对多轮对话脚本进行处理,以得到每轮对话脚本分别对应的第一合成语料;在热线客服系统中获取热线客服日志,基于业务知识树对热线客服日志进行标注,并将标注后的日志转换为第二合成语料;基于多轮对话脚本、第一合成语料与第二合成语料,对预置多轮对话模型进行调节,以使多轮对话模型根据业务知识树生成对话内容。

4、本申请实施例通过基于预置业务数据,构建业务知识树,能够将机器人的对话内容进行限定,使其限定于业务知识树搭范围内,从而减少对话过程中出现的不属于当前对话领域的专业知识。其次,本申请实施例通过对多轮对话脚本进行处理,以得到每轮对话脚本分别对应的第一合成语料,以及将标注后的日志转换为第二合成语料,通过不同途径获取多种训练语料,一方面能够提高对话模型语言理解能力,另一方面也能提高对用户问题回复的专业性。

5、在本申请的一种实现方式中,确定出预置业务数据中用户输入数据与答复数据,并将用户输入数据与答复数据进行匹配,以得到多个数据组;确定出用户输入数据中的标签;其中,标签与用户输入数据的文本含义相关;在多个数据中,分别进行标签的标注;按照用户输入数据的先后顺序,将标注后的多个数据组进行连接,以构建业务知识树。

6、在本申请的一种实现方式中,确定出用户输入数据中的标签之前,方法还包括:将预置业务数据样本集作为输入,将标注有标签的预置业务数据样本集作为输出,对预置神经网络模型进行训练,以得到标签标注模型;确定出用户输入数据中的标签,具体包括:将用户输入数据输入标签标注模型,通过标签标注模型输出标签。

7、在本申请的一种实现方式中,遍历业务知识树,以构建多个对话路径,具体包括:确定出业务知识树中的节点连接关系;基于节点连接关系,确定出多个节点连接路径;确定出各节点的标签,基于标签与节点连接路径,构建多个对话路径。

8、在本申请的一种实现方式中,基于多个对话路径生成多轮对话脚本,具体包括:确定出多个对话路径中的各节点分别对应的预置业务数据;基于多个对话路径中各节点的连接顺序,与各节点分别对应的预置业务数据,生成多轮对话脚本;其中,一个对话路径对应一轮对话脚本。

9、在本申请的一种实现方式中,基于预置参数模型,对多轮对话脚本进行处理,以得到每轮对话脚本分别对应的第一合成语料,具体包括:将每一轮对话脚本中的用户输入数据输入预置参数模型;基于预置参数模型,确定出每一轮对话脚本中的用户输入数据相匹配的不同文本数据;基于用户输入数据与不同文本数据,得到每轮对话脚本分别对应的第一合成语料;其中不同文本数据,与用户输入数据所对应的文本含义相关。

10、在本申请的一种实现方式中,在热线客服系统中获取热线客服日志,基于业务知识树对热线客服日志进行标注,并将标注后的日志转换为第二合成语料,具体包括:在热线客服系统中获取热线客服日志;其中,热线客服日志与客服人员的通话数据相关;将热线客服日志与业务知识树进行文本含义比对;确定出比对结果符合要求的热线客服日志,并通过业务知识树中的数据,将比对结果符合要求的热线客服日志进行替换;基于预置语料格式,将替换后的热线客服日志转换为第二合成语料。

11、在本申请的一种实现方式中,基于多轮对话脚本、第一合成语料与第二合成语料,对预置多轮对话模型进行调节之前,方法还包括:对多轮对话脚本、第一合成语料与第二合成语料进行数据比对,以确定出重复的数据;以及对多轮对话脚本、第一合成语料与第二合成语料进行数据检测,以确定出缺失的数据;将重复的数据与缺失的数据进行标注,并进行删除处理。

12、本申请实施例提供一种基于知识树的多轮对话模型生成设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:基于预置业务数据,构建业务知识树;遍历业务知识树,以构建多个对话路径,并基于多个对话路径生成多轮对话脚本;基于预置参数模型,对多轮对话脚本进行处理,以得到每轮对话脚本分别对应的第一合成语料;在热线客服系统中获取热线客服日志,基于业务知识树对热线客服日志进行标注,并将标注后的日志转换为第二合成语料;基于多轮对话脚本、第一合成语料与第二合成语料,对预置多轮对话模型进行调节,以使多轮对话模型根据业务知识树生成对话内容。

13、本申请实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:基于预置业务数据,构建业务知识树;遍历业务知识树,以构建多个对话路径,并基于多个对话路径生成多轮对话脚本;基于预置参数模型,对多轮对话脚本进行处理,以得到每轮对话脚本分别对应的第一合成语料;在热线客服系统中获取热线客服日志,基于业务知识树对热线客服日志进行标注,并将标注后的日志转换为第二合成语料;基于多轮对话脚本、第一合成语料与第二合成语料,对预置多轮对话模型进行调节,以使多轮对话模型根据业务知识树生成对话内容。

14、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本申请实施例通过基于预置业务数据,构建业务知识树,能够将机器人的对话内容进行限定,使其限定于业务知识树搭范围内,从而减少对话过程中出现的不属于当前对话领域的专业知识。其次,本申请实施例通过对多轮对话脚本进行处理,以得到每轮对话脚本分别对应的第一合成语料,以及将标注后的日志转换为第二合成语料,通过不同途径获取多种训练语料,一方面能够提高对话模型语言理解能力,另一方面也能提高对用户问题回复的专业性。

本文档来自技高网...

【技术保护点】

1.一种基于知识树的多轮对话模型生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述基于预置业务数据,构建业务知识树,具体包括:

3.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述确定出所述用户输入数据中的标签之前,所述方法还包括:

4.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述遍历所述业务知识树,以构建多个对话路径,具体包括:

5.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述基于所述多个对话路径生成多轮对话脚本,具体包括:

6.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述基于预置参数模型,对所述多轮对话脚本进行处理,以得到每轮对话脚本分别对应的第一合成语料,具体包括:

7.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述在热线客服系统中获取热线客服日志,基于所述业务知识树对所述热线客服日志进行标注,并将标注后的日志转换为第二合成语料,具体包括:

8.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述基于所述多轮对话脚本、所述第一合成语料与所述第二合成语料,对预置多轮对话模型进行调节之前,所述方法还包括:

9.一种基于知识树的多轮对话模型生成设备,包括:

10.一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:

...

【技术特征摘要】

1.一种基于知识树的多轮对话模型生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述基于预置业务数据,构建业务知识树,具体包括:

3.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述确定出所述用户输入数据中的标签之前,所述方法还包括:

4.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述遍历所述业务知识树,以构建多个对话路径,具体包括:

5.根据权利要求1所述的一种基于知识树的多轮对话模型生成方法,其特征在于,所述基于所述多个对话路径生成多轮对话脚本,具体包括:

6.根据权利要求1所述的一种基于知识树的多轮对话模型生成...

【专利技术属性】
技术研发人员:张琨丁鑫田钿朱锦雷张传锋张鑫
申请(专利权)人:神思电子技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1