System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种提高大语言模型工具调用效果的方法和装置制造方法及图纸_技高网

一种提高大语言模型工具调用效果的方法和装置制造方法及图纸

技术编号:41148086 阅读:2 留言:0更新日期:2024-04-30 18:15
一种提高大语言模型工具调用效果的方法和装置,涉及人工智能领域。在该方法中,响应于用户输入问题的操作,将问题拆分成子问题,每个子问题对应一个工具;将所有子问题对应的工具进行组合以确定回答问题需要依赖的第一工具链,其中,第一工具链是指将前一个工具的输出作为后一个工具的输入的多个工具的组合,第一工具链的第一个工具的输入为问题中的对应数据;对第一工具链进行动态编译以形成第二工具链,动态编译包括参数格式的调整和工具链路径的补全;根据第二工具链调用对应的工具以形成问题的答案。实施本申请提供的技术方案,通过动态编译实现了提高工具调用能力的效果。

【技术实现步骤摘要】

本申请涉及人工智能的,具体涉及一种提高大语言模型工具调用效果的方法、系统、电子设备及存储介质。


技术介绍

1、随着openai的chatgpt plugin平台的推出,为人们使用大语言模型打开了新思路,大模型通过调用工具能够访问最新、私人或太具体而无法包含在训练数据中的信息,同时也打破了大模型知识的时间局限性。

2、目前,现有的大模型工具调用平台经常会出现回答问题时调用工具不够准确、参数解析出错等现象,极大的降低了用户体验。

3、因此,需要一种提高大语言模型工具调用效果的方法。


技术实现思路

1、本申请提供一种提高大语言模型工具调用效果的方法、系统、设备及存储介质,能够动态编译工具链从而提高了大语言模型工具调用的能力。

2、在本申请的第一方面提供了一种提高大语言模型工具调用效果的方法,应用于大语言模型平台,所述方法包括:

3、响应于用户输入问题的操作,对所述问题进行拆分,所述问题包括第一子问题和第二子问题,所述第一子问题和所述第二子问题是所述问题中的任意两个子问题,每个子问题对应一个工具;

4、将所有子问题对应的工具进行组合以确定回答所述问题需要依赖的第一工具链,其中,所述第一工具链是指将前一个工具的输出作为后一个工具的输入的多个工具的组合,所述第一工具链的第一个工具的输入为所述问题中的对应数据;

5、对所述第一工具链进行动态编译以形成第二工具链,所述动态编译包括参数格式的调整和工具链路径的补全;

6、调用所述第二工具链对应的工具以形成所述问题的答案。

7、通过采用上述技术方案,精确地确定所需工具链和参数,以及后续的动态编译和工具调用,这种方法能够更准确地回答用户的问题,提高了答案的准确性和可靠性。随着工具和技术的不断发展,这种方法可以方便地添加新的工具和调整现有工具链,使得整个系统具有很好的可扩展性。

8、可选的,所述方法包括:

9、对工具进行注册,注册信息包括工具名称、工具描述、输入参数、输出参数和后处理函数,所述后处理函数用于对输入参数进行校正,并将注册完成的工具添加到工具集合中。

10、通过采用上述技术方案,对工具进行注册,所有工具都被标准化和规范化地描述,包括工具名称、描述、输入参数、输出参数和后处理函数。这确保了工具的准确性和一致性,提高了后续处理的可靠性和效率。注册信息被保存在一个集中的地方,这使得对工具的管理和维护变得简单和集中。当需要添加新工具或修改现有工具时,只需在集合中进行相应的操作,而不需要更改整个系统的其他部分。后处理函数的引入是一个重要的创新,通过在工具执行后对输入参数进行校正,可以预防或纠正可能由工具产生的错误或不一致的结果,从而提高整个流程的准确性。

11、可选的,所述对所述第一工具链进行动态编译以形成第二工具链包括:

12、通过所有工具的输入参数和输出参数构建超图结构,基于所述超图结构判断所述第一工具链是否完整;

13、当所述第一工具链不完整时,基于所述超图结构补全所述第一工具链,并对补全后的所述第一工具链传递的参数进行格式调整。

14、通过采用上述技术方案,构建超图结构和基于超图结构判断工具链的完整性,可以确保工具链执行过程的完整性和正确性。这对于后续的工具调用和答案生成至关重要,因为它可以防止因工具链不完整或错误而导致的处理错误。当发现第一工具链不完整时,能够自动基于超图结构进行补全。这大大增强了工具链的适应性和灵活性,使得系统能够处理更多种类的用户问题和场景。在工具链补全后,还会对参数格式进行调整,以确保工具链的顺畅运行。这进一步提高了整个流程的准确性和可靠性,确保了最终答案的质量。

15、可选的,所述基于所述超图结构补全所述第一工具链包括:

16、检索路径不完整的两个工具之间是否存在多条路径,当所述两个工具之间存在多条路径,根据路径中每个工具的查询成功率计算每条路径的权重;

17、第一权重和第二权重是任意一条路径的权重,所述第一权重大于所述第二权重,选择所述第一权重对应的路径补全所述第一工具链。

18、通过采用上述技术方案,当发现两个工具之间的路径不完整时,系统会检索是否存在多条路径。通过比较不同路径的权重,能够选择最优的路径来补全工具链,这确保了工具链的效率和准确性。通过考虑路径中每个工具的查询成功率来计算权重,能够根据工具的历史表现和性能来进行智能选择。这种方法能够更好地应对不同场景和问题,提高了工具链的自适应性和准确性。基于权重的路径选择不仅提高了工具链的补全效率,而且通过选择成功率更高的工具和路径,提高了最终答案的准确性。由于权重是根据工具的查询成功率动态计算的,当工具的性能发生变化时,系统能够自动调整其选择策略,保持了整个流程的动态优化。

19、可选的,所述根据路径中每个工具的查询成功率计算每条路径的权重包括:

20、确定每个工具的查询成功率,并将每条路径中对应工具的查询成功率相乘得到每条路径的权重。

21、通过采用上述技术方案,通过考虑每个工具的查询成功率来计算路径权重,这种方法能够更准确地反映工具链的性能。查询成功率高的工具在计算权重时将获得更高的权重,从而提高了整个工具链的准确性和可靠性。查询成功率是动态变化的,它会随着工具的使用频率、外部环境的变化等因素而变化。通过实时更新查询成功率并计算路径权重,系统能够根据工具链的性能进行动态调整,确保了工具链的最佳状态。基于查询成功率的权重计算方法为系统提供了优化决策的依据。系统可以根据权重的不同选择最优的路径进行工具链的补全,从而提高处理效率和准确性。

22、可选的,所述通过所有工具的输入参数和输出参数构建超图结构包括:

23、对所有工具进行参数归一化,并将每个工具转换为子图,所述子图包括输入参数、工具名称和输出参数;

24、根据所述子图之间参数的连接关系构建环图,并通过所述环图之间顶点的关系构建超图。

25、通过采用上述技术方案,将参数归一化,所有工具的输入和输出参数都得到了统一和规范化的处理。这确保了工具之间的可比性和互操作性,提高了整个流程的准确性和一致性。将每个工具转换为子图,使得工具的输入、输出参数和工具名称得到了结构化的表示。这种表示方法有助于后续的超图构建和工具链分析。通过子图之间的参数连接关系,系统能够构建环图,进一步通过环图之间的关系构建超图。超图结构能够全面地反映工具之间的参数传递和依赖关系,为后续的工具链完整性检查和动态编译提供了基础。

26、可选的,所述对补全后的所述第一工具链传递的参数进行格式调整包括:

27、根据所述超图结构中存储的参数节点的数据类型将获取的输出参数转化为下一个工具指定的数据类型。

28、通过采用上述技术方案,确保了工具链中各个工具之间数据的一致性和兼容性,这避免了因数据类型不匹配而导致的处理错误或效率低下。通过提前进行数据本文档来自技高网...

【技术保护点】

1.一种提高大语言模型工具调用效果的方法,其特征在于,应用于大语言模型平台,所述方法包括:

2.根据权利要求1所述的提高大语言模型工具调用效果的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的提高大语言模型工具调用效果的方法,其特征在于,所述对所述第一工具链进行动态编译以形成第二工具链包括:

4.根据权利要求3所述的提高大语言模型工具调用效果的方法,其特征在于,所述基于所述超图结构补全所述第一工具链包括:

5.根据权利要求4所述的提高大语言模型工具调用效果的方法,其特征在于,所述根据路径中每个工具的查询成功率计算每条路径的权重包括:

6.根据权利要求3所述的提高大语言模型工具调用效果的方法,其特征在于,所述通过所有工具的输入参数和输出参数构建超图结构包括:

7.根据权利要求3所述的提高大语言模型工具调用效果的方法,其特征在于,所述对补全后的所述第一工具链传递的参数进行格式调整包括:

8.一种提高大语言模型工具调用效果的系统,其特征在于,包括分析模块、组合模块、编译模块以及调用模块,其中

9.一种电子设备,其特征在于,包括处理器、存储器、用户接口以及网络接口,所述存储器用于存储指令,所述用户接口和所述网络接口均用于与其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如权利要求1-7任意一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被执行时,执行如权利要求1-7任意一项所述的方法。

...

【技术特征摘要】

1.一种提高大语言模型工具调用效果的方法,其特征在于,应用于大语言模型平台,所述方法包括:

2.根据权利要求1所述的提高大语言模型工具调用效果的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的提高大语言模型工具调用效果的方法,其特征在于,所述对所述第一工具链进行动态编译以形成第二工具链包括:

4.根据权利要求3所述的提高大语言模型工具调用效果的方法,其特征在于,所述基于所述超图结构补全所述第一工具链包括:

5.根据权利要求4所述的提高大语言模型工具调用效果的方法,其特征在于,所述根据路径中每个工具的查询成功率计算每条路径的权重包括:

6.根据权利要求3所述的提高大语言模型工具调用效果的方法,其特征在于,所述通过所有工具的输...

【专利技术属性】
技术研发人员:廖闻剑杨梦玲武志彦王逸飞董文君
申请(专利权)人:南京烽火星空通信发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1