大语言模型的任务调度方法、数据处理系统与电子设备技术方案

技术编号:44077809 阅读:25 留言:0更新日期:2025-01-17 16:12
本公开提供了一种大语言模型的任务调度方法、数据处理系统与电子设备。方法包括:在第一处理器上,从就绪队列获取请求以形成第一运行实例和第二运行实例;生成第一运行实例对应的第一协程和第二运行实例对应的第二协程,第一协程和第二协程均用于执行Q个子阶段的计算任务与传输任务;运行第一协程,以将第1i个计算任务提交到第二处理器的第一工作流,将第1i个传输任务提交到第二处理器的第二工作流,设置第1i个传输任务在第1i个计算任务执行之后执行;运行第二协程,以将第2i个计算任务提交到第一工作流,将第2i个传输任务提交到第二工作流,设置第2i个传输任务的执行条件在第2i个计算任务执行之后执行。本公开实施例可以提高大模型的推理效率。

【技术实现步骤摘要】

所属的技术人员能够理解,本专利技术的各个方面可以实现为系统、方法或程序产品。因此,本专利技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。下面参照图8来描述根据本专利技术的这种实施方式的电子设备800。图8显示的电子设备800仅仅是一个示例,不应对本专利技术实施例的功能和使用范围带来任何限制。如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830。其中,处理单元810可以用于实现数据处理系统100中的第一处理器1的功能,需要注意的是,第一处理器1的功能既可以由一个电子设备800实现,也可以由多个电子设备800实现(分布式计算/云计算)。其中,存储单元存储有程序代码,程序代码可以被处理单元810执行,使得处理单元810执行本说明书上述“示例性方法”部分中描述的根据本专利技术各种示例性实施方式的步骤。本文档来自技高网...

【技术保护点】

1.一种大语言模型的任务调度方法,其特征在于,应用于目标模型,包括:

2.如权利要求1所述的大语言模型的任务调度方法,其特征在于,从就绪队列中获取请求以形成第一运行实例和第二运行实例包括:

3.如权利要求2所述的大语言模型的任务调度方法,其特征在于,还包括:

4.如权利要求2所述的大语言模型的任务调度方法,其特征在于,还包括:

5.如权利要求1所述的大语言模型的任务调度方法,其特征在于,生成与所述第一运行实例对应的第一协程和与所述第二运行实例对应的第二协程包括:

6.如权利要求1所述的大语言模型的任务调度方法,其特征在于,还包括...

【技术特征摘要】

1.一种大语言模型的任务调度方法,其特征在于,应用于目标模型,包括:

2.如权利要求1所述的大语言模型的任务调度方法,其特征在于,从就绪队列中获取请求以形成第一运行实例和第二运行实例包括:

3.如权利要求2所述的大语言模型的任务调度方法,其特征在于,还包括:

4.如权利要求2所述的大语言模型的任务调度方法,其特征在于,还包括:

5.如权利要求1所述的大语言模型的任务调度方法,其特征在于,生成与所述第...

【专利技术属性】
技术研发人员:张文骁李一鹏柳俊丞朱平
申请(专利权)人:北京硅动科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1