System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于对话结构的驱动型对话生成方法及相关产品技术_技高网

一种基于对话结构的驱动型对话生成方法及相关产品技术

技术编号:40005767 阅读:9 留言:0更新日期:2024-01-09 05:00
本申请公开了一种基于对话结构的驱动型对话生成方法及相关产品,可应用于自然语言处理技术领域,该方法包括:获取输入指令,并按照所述输入指令确定对应的业务需求;基于所述业务需求建设与所述业务需求对应的实际对话流程和实际马可夫矩阵;基于所述实际对话流程和所述实际马可夫矩阵,以提示工程的方式控制训练好的优化大模型生成与所述业务需求对应的对话。如此,以提示工程的方式控制通过大量预训练语料训练好的优化大模型按需生成符合分布要求的对话数据,提高了生成对话数据的高效性和准确性。

【技术实现步骤摘要】

本申请涉及自然语言处理,特别是涉及一种基于对话结构的驱动型对话生成方法及相关产品


技术介绍

1、在实际的对话类项目冷启动阶段,许多项目没有符合该项目业务需求的实际业务对话数据。这就使得该项目的开发、测试、工作需要人工制造大量的数据,需要耗费大量的人力物力。大模型基于其对话生成能力刚好可以缓解这种状况。

2、现有技术用到的大模型对于任务驱动型对话的任务理解不足,生成的对话存在不符合预期的问题。具体的,目前的大模型具备一定的对话生成能力,给定一定的语境确实可以生成相关的对话,但是对于相对复杂的语境或者说给定一定的任务流程,大模型无法根据任务流程生成符合任务流程的对话,容易产生对话数据生成效率低以及准确性差的问题。

3、因此,如何提高对话数据的生成效率以及生成准确性,是本领域技术人员急需解决的问题。


技术实现思路

1、基于上述问题,本申请提供了一种基于对话结构的驱动型对话生成方法及相关产品,以提示工程的方式控制通过大量预训练语料训练好的优化大模型按需生成符合分布要求的对话数据,解决了现有技术对话数据生成效率低以及准确性差的问题。

2、第一方面,本申请提供了一种基于对话结构的驱动型对话生成方法,包括:

3、获取输入指令,并按照所述输入指令确定对应的业务需求;

4、基于所述业务需求建设与所述业务需求对应的实际对话流程和实际马可夫矩阵;

5、基于所述实际对话流程和所述实际马可夫矩阵,以提示工程的方式控制训练好的优化大模型生成与所述业务需求对应的对话。

6、可选的,所述基于所述实际对话流程和所述实际马可夫矩阵,以提示工程的方式控制训练好的优化大模型生成与所述业务需求对应的对话之前,还包括:

7、基于所述实际对话流程和所述实际马可夫矩阵生成实际伪代码。

8、可选的,所述基于所述实际对话流程和所述实际马可夫矩阵,以提示工程的方式控制训练好的优化大模型生成与所述业务需求对应的对话,包括:

9、将基于所述实际对话流程和所述实际马可夫矩阵生成的所述实际伪代码加入到对话生成的提示工程中;

10、基于所述提示工程,利用训练好的优化大模型生成与所述业务需求对应的对话。

11、可选的,所述获取输入指令,并按照所述输入指令确定对应的业务需求之前,还包括:

12、基于开源任务型对话数据集训练基础大模型,得到训练好的优化大模型。

13、可选的,所述基于开源任务型对话数据集训练基础大模型,得到训练好的优化大模型,包括:

14、基于槽位识别和意图识别的流程挖掘技术,从开源任务型对话数据集中挖掘出有效的训练对话流程,并形成对应的训练马可夫矩阵;

15、根据所述训练对话流程和所述训练马可夫矩阵生成对应的训练伪代码;

16、基于所述训练伪代码训练基础大模型,得到训练好的优化大模型。

17、可选的,所述基于槽位识别和意图识别的流程挖掘技术,从开源任务型对话数据集中挖掘出有效的训练对话流程,并形成对应的训练马可夫矩阵,包括:

18、对开源任务型对话数据集进行槽位和意图的统一整理;

19、基于所述开源任务型对话数据集的所述槽位和所述意图,使用关联分析算法apriori挖掘有效的训练对话流程,并形成训练马可夫矩阵。

20、可选的,所述基于所述训练伪代码训练基础大模型,得到训练好的优化大模型,包括:

21、将所述训练伪代码加入到对话生成的提示工程中,形成包含任务流信息的对话数据集;

22、将所述对话数据集加入到基础大模型的预训练监督微调阶段对所述基础大模型进行训练,得到训练好的优化大模型。

23、第二方面,本申请提供了一种基于对话结构的驱动型对话生成装置,其特征在于,包括:

24、获取模块,用于获取输入指令,并按照所述输入指令确定对应的业务需求;

25、建设模块,用于基于所述业务需求建设与所述业务需求对应的实际对话流程和实际马可夫矩阵;

26、生成模块,用于基于所述实际对话流程和所述实际马可夫矩阵,以提示工程的方式控制训练好的优化大模型生成与所述业务需求对应的对话。

27、第三方面,本申请提供了一种基于对话结构的驱动型对话生成设备,其特征在于,包括:

28、存储器,用于存储计算机程序;

29、处理器,用于执行所述计算机程序时实现如上述任一项所述基于对话结构的驱动型对话生成方法的步骤。

30、第四方面,本申请提供了一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述基于对话结构的驱动型对话生成方法的步骤。

31、从以上技术方案可以看出,相较于现有技术,本申请具有以下优点:

32、本申请首先获取输入指令,并按照输入指令确定对应的业务需求。然后基于业务需求建设与业务需求对应的实际对话流程和实际马可夫矩阵。最后基于实际对话流程和实际马可夫矩阵,以提示工程的方式控制训练好的优化大模型生成与业务需求对应的对话。如此,以提示工程的方式控制通过大量预训练语料训练好的优化大模型按需生成符合分布要求的对话数据,提高了生成对话数据的高效性和准确性。

本文档来自技高网...

【技术保护点】

1.一种基于对话结构的驱动型对话生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述实际对话流程和所述实际马可夫矩阵,以提示工程的方式控制训练好的优化大模型生成与所述业务需求对应的对话之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述实际对话流程和所述实际马可夫矩阵,以提示工程的方式控制训练好的优化大模型生成与所述业务需求对应的对话,包括:

4.根据权利要求1所述的方法,其特征在于,所述获取输入指令,并按照所述输入指令确定对应的业务需求之前,还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于开源任务型对话数据集训练基础大模型,得到训练好的优化大模型,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于槽位识别和意图识别的流程挖掘技术,从开源任务型对话数据集中挖掘出有效的训练对话流程,并形成对应的训练马可夫矩阵,包括:

7.根据权利要求5所述的方法,其特征在于,所述基于所述训练伪代码训练基础大模型,得到训练好的优化大模型,包括:

8.一种基于对话结构的驱动型对话生成装置,其特征在于,包括:

9.一种基于对话结构的驱动型对话生成设备,其特征在于,包括:

10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于对话结构的驱动型对话生成方法的步骤。

...

【技术特征摘要】

1.一种基于对话结构的驱动型对话生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述实际对话流程和所述实际马可夫矩阵,以提示工程的方式控制训练好的优化大模型生成与所述业务需求对应的对话之前,还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述实际对话流程和所述实际马可夫矩阵,以提示工程的方式控制训练好的优化大模型生成与所述业务需求对应的对话,包括:

4.根据权利要求1所述的方法,其特征在于,所述获取输入指令,并按照所述输入指令确定对应的业务需求之前,还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于开源任务型对话数据集训练基础大模型,得到训练好...

【专利技术属性】
技术研发人员:尹陆鋆
申请(专利权)人:太保科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1