System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大语言模型的数据链生成方法及装置制造方法及图纸_技高网

基于大语言模型的数据链生成方法及装置制造方法及图纸

技术编号:40493790 阅读:5 留言:0更新日期:2024-02-26 19:23
本发明专利技术提供一种基于大语言模型的数据链生成方法及装置,该基于大语言模型的数据链生成方法包括:根据输入信息确定第一提示词,所述第一提示词包括:待处理任务、初始数据信息和数据链描述,其中,所述输入信息包括所述待处理任务和所述初始数据信息,所述数据链描述包括所述待处理任务对应的处理方法指示;将所述第一提示词输入大语言模型,并获取所述大语言模型输出的目标数据链,所述目标数据链包括对所述待处理任务进行处理的至少一个操作节点,每个操作节点包括中间数据变量及所述中间数据变量对应的操作指令。本发明专利技术中,可以使得大语言模型输出完整的数据链解决思路,避免了步骤未知和得不到任务解决方案的情况。

【技术实现步骤摘要】

本专利技术实施例涉及大语言模型,尤其涉及一种基于大语言模型的数据链生成方法、装置及电子设备。


技术介绍

1、提示工程用于指导人工智能(artificial intelligence,ai)如何完成任务。思维链是一种提示大语言模型(也可以称为大模型)解释行为的提示方法。尤其在解决复杂问题时,思维链提示范式使大语言模型能够一步一步地拆分问题,并做出相应的行动解决问题。这种方法有利于梳理思路减少出错,提高了解决问题的成功率。

2、然而,这种‘想一步,做一步’的思维链方法,在执行中有很多的未知性和不确定性。使用者不知道大语言模型执行的下一步会是什么,且不到最后一刻,使用者不知道大语言模型还需要多少步骤才能解决这个问题,也不知道问题是否被成功地解决。

3、当面对复杂问题或者大语言模型的能力不够强大时,使用思维链方法,由于是“思考-行动-观察”这样的循环流程,其思考的发散性和颗粒度难以控制,容易导致思路偏向二迷失方向,或在中间步骤循环不停,从而得不到理想的答案。

4、另外,局限于大语言模型自身的上下文长度,随着思维链的步骤增多,思维链的步骤有可能会超过了大语言模型处理量的限制,导致大模型无法继续思考,后续的思维链步骤会漏掉。


技术实现思路

1、本专利技术实施例提供一种基于大语言模型的数据链生成方法及装置,用于解决使用思维链方法的提示工程,大语言模型思考的发散性和颗粒度难以控制的问题。

2、为了解决上述技术问题,本专利技术是这样实现的:

>3、第一方面,本专利技术实施例提供了一种基于大语言模型的数据链生成方法,其特征在于,包括:

4、根据输入信息确定第一提示词,所述第一提示词包括:待处理任务、初始数据信息和数据链描述,其中,所述输入信息包括所述待处理任务和所述初始数据信息,所述数据链描述包括所述待处理任务对应的处理方法指示;

5、将所述第一提示词输入大语言模型,并获取所述大语言模型输出的目标数据链,所述目标数据链包括对所述待处理任务进行处理的至少一个操作节点,每个操作节点包括中间数据变量及所述中间数据变量对应的操作指令。

6、第二方面,本专利技术实施例提供了一种基于大语言模型的数据链生成装置,包括:

7、第一确定模块,用于根据输入信息确定第一提示词,所述第一提示词包括:待处理任务、初始数据信息和数据链描述,其中,所述输入信息包括所述待处理任务和所述初始数据信息,所述数据链描述包括所述待处理任务对应的处理方法指示;

8、第一输入模块,用于将所述第一提示词输入大语言模型,并获取所述大语言模型输出的目标数据链,所述目标数据链包括对所述待处理任务进行处理的至少一个操作节点,每个操作节点包括中间数据变量及所述中间数据变量对应的操作指令。

9、第三方面,本专利技术实施例提供了一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上述第一方面所述的基于大语言模型的数据链生成方法的步骤。

10、第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的基于大语言模型的数据链生成方法的步骤。

11、本专利技术实施例中,通过向大语言模型输入第一提示词,可以使得大语言模型输出完整的数据链解决思路,避免了步骤未知和得不到任务解决方案的情况。数据链中每个中间数据变量都有明确的定义和处理方法(即操作指令),相较于思维链的文本表述,执行的指令更明确,降低了出错率;中间数据变量的处理过程相对独立,大语言模型的处理量可控,降低了对大语言模型能力的需求,同时有利于任务调度和模型分工,增效降本。

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的数据链生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述处理方法指示包括以下至少一项:

3.根据权利要求2所述的方法,其特征在于,所述处理方法指示还包括以下至少一项:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一提示词还包括以下至少一项:

5.根据权利要求1所述的方法,其特征在于,所述操作节点包括以下至少一项:所述中间数据变量的名称、数据类型、依赖的数据变量、数据描述和操作指令。

6.根据权利要求1-5任一项所述的方法,其特征在于,还包括:

7.根据权利要求6所述的方法,其特征在于,根据所述目标数据链,生成至少一个第二提示词,包括:

8.根据权利要求6所述的方法,其特征在于,所述将所述至少一个第二提示词输入大语言模型,并获取所述大语言模型输出的至少一个中间输出结果,包括:

9.根据权利要求6-8任一项所述的方法,其特征在于,所述第二提示词包括以下至少一项:

10.根据权利要求6-9任一项所述的方法,其特征在于,还包括:

11.根据权利要求10所述的方法,其特征在于,所述第三提示词包括以下至少一项:

12.根据权利要求11所述的方法,其特征在于,所述第三提示词还包括:

13.一种基于大语言模型的数据链生成装置,其特征在于,包括:

14.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1至12中任一项所述的基于大语言模型的数据链生成方法的步骤。

...

【技术特征摘要】

1.一种基于大语言模型的数据链生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述处理方法指示包括以下至少一项:

3.根据权利要求2所述的方法,其特征在于,所述处理方法指示还包括以下至少一项:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一提示词还包括以下至少一项:

5.根据权利要求1所述的方法,其特征在于,所述操作节点包括以下至少一项:所述中间数据变量的名称、数据类型、依赖的数据变量、数据描述和操作指令。

6.根据权利要求1-5任一项所述的方法,其特征在于,还包括:

7.根据权利要求6所述的方法,其特征在于,根据所述目标数据链,生成至少一个第二提示词,包括:

8.根据权利要求6所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:李学峰刘兆涵方磊尚明栋
申请(专利权)人:北京九章云极科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1