一种理解文本提高大语言模型工具学习的方法技术

技术编号:42101845 阅读:27 留言:0更新日期:2024-07-25 00:27
本申请提供一种理解文本提高大语言模型工具学习的方法,方法包括:步骤一、API描述生成;步骤二、构建Query的上下文信息;步骤三、构建候选API集合,缩小大语言模型搜索API的范围;步骤四、利用大语言模型对Query进行回答;步骤五、设计Cos_F1对生成内容进行自动评价,利用目标Query和答案之间的余弦相似度表示一致性和差异性。创新性的加强了对开放大语言模型中AP功能的理解,并通过使用机器生成的API功能描述代替人类描述来提高API调用的准确性。

【技术实现步骤摘要】

本申请涉及大语言模型,特别涉及一种理解文本提高大语言模型工具学习的方法


技术介绍

1、工具学习的兴起与大语言模型(large language models,llms)的发展密切相关。工具学习的目标在于充分利用llms作为核心认知引擎,以构建各种程序接口(applicationprogramming interface,api)和任务之间的紧密连接,从而在复杂的现实生活场景中实现无缝任务执行。例如,一个女孩提出了一个问题,询问未来三天的天气预报,随后,llms自动选择相关api来提供答案。尽管这看起来非常吸引人且实用,但在实际应用中,llms在理解女孩的查询、选择适当的api以及生成正确答案方面面临一些挑战。这主要有两个原因:首先,大多数开放大语言模型侧重于基本的传统语言任务,而非专注于工具学习;其次,存在对api功能和查询的理解方面的差异。

2、为了应对这些问题,大多数研究人员已将注意力转向特殊的提示,以针对特定任务和数据集对llms进行优化。尽管这些方法增强了利用开放大语言模型作为中央api调用机制解决查询(query)的能力,但它们面临本文档来自技高网...

【技术保护点】

1.一种理解文本提高大语言模型工具学习的方法,其特征在于,所述方法包括:

2.根据权利要求1,其特征在于,步骤一、API描述生成,包括:

3.根据权利要求1所述的方法,其特征在于,步骤二、构建Query的上下文信息,包括:

4.根据权利要求2所述的方法,其特征在于,步骤三、构建候选API集合,缩小大语言模型搜索API的范围,包括:

5.根据权利要求2所述的方法,其特征在于,步骤四、利用大语言模型对Query进行回答,包括:

6.根据权利要求2所述的方法,其特征在于,步骤五、设计Cos_F1对生成内容进行自动评价,利用目标Quer...

【技术特征摘要】

1.一种理解文本提高大语言模型工具学习的方法,其特征在于,所述方法包括:

2.根据权利要求1,其特征在于,步骤一、api描述生成,包括:

3.根据权利要求1所述的方法,其特征在于,步骤二、构建query的上下文信息,包括:

4.根据权利要求2所述的方法,其特征在于,步骤三、构建候选ap...

【专利技术属性】
技术研发人员:袁长森黄河燕
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1