一种大模型请求调度方法、大模型网关系统及电子设备技术方案

技术编号:41399719 阅读:25 留言:0更新日期:2024-05-20 19:24
本申请实施例提供了一种大模型请求调度方法、大模型网关系统及电子设备,其中,该方法通过接收目标请求消息,并从预设配置信息中心获取大模型的各个服务设备的通信属性信息以及运行情况信息,然后根据目标请求所要请求的服务类型,结合各服务设备所支持的通信方式类型,以及各服务设备运行服务实例的情况信息,确定可用于响应该目标请求的目标服务设备,控制该目标服务设备响应用户的目标请求消息。选用本申请实施例,无论是简单的请求消息,还是复杂的请求消息,均可直接根据目标请求消息中的服务类型,结合预设配置中心中存储的各服务设备的通信属性信息以及运行情况信息,快速确定出响应该目标请求的目标服务设备。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种大模型请求调度方法、大模型网关系统及电子设备


技术介绍

1、随着大模型技术的发展,如何对客户端发出的各类大模型请求进行合理调度,成为降低大模型调度成本所面临的首要问题。相关技术中,通过为大模型设置网关系统,由网关系统对客户端发出的各类大模型请求进行调度。

2、该大模型下的网关系统常通过提供一个集中管理和控制api(applicationprogram interface,应用程序接口)的功能模块,由该功能模块对各个互联网服务进行管控。但是,现有的网关系统在实际应用过程中,存在难以支持复杂的请求的问题。


技术实现思路

1、有鉴于此,本申请实施例提供了一种大模型请求调度方法、大模型网关系统及电子设备,以解决现有的大模型网关系统功能简单,无法支持复杂的请求调度的问题。

2、第一方面,本申请实施例提供了一种大模型请求调度方法,其中,该方法包括:

3、接收目标请求消息,其中,所述目标请求消息携带有所要请求的服务类型;

4、从预设配置信息中本文档来自技高网...

【技术保护点】

1.一种大模型请求调度方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述基于各所述服务设备的通信属性信息以及运行情况信息,确定响应所述目标请求的目标服务设备,控制所述目标服务设备响应所述目标请求消息,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述基于各所述服务设备的通信属性信息以及运行情况信息,确定响应所述目标请求...

【技术特征摘要】

1.一种大模型请求调度方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述基于各所述服务设备的通信属性信息以及运行情况信息,确定响应所述目标请求的目标服务设备,控制所述目标服务设备响应所述目标请求消息,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:耿旭涵李晓亮徐健赵辉刘哲文
申请(专利权)人:度小满科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1