一种制造技术

技术编号:39504484 阅读:7 留言:0更新日期:2023-11-24 11:35
本申请提供一种

【技术实现步骤摘要】
一种AI服务请求调度的方法、装置、设备及介质


[0001]本申请涉及资源调度
,提供一种
AI
服务请求调度的方法

装置

设备及介质


技术介绍

[0002]随着人工智能(
AI

Artificial Intelligence
)的快速发展,越来越多的企业和组织开始使用“AI
服务”来提高业务效率

优化决策和改进用户体验,其中,
AI
服务包括图像识别

自然语言处理和预测分析等

但是,随着
AI
服务的增加,为确保
AI
服务的高可用性

高性能和安全性,对处理和调度这些
AI
服务请求提出了更高的要求

[0003]然而,在现有的
AI
服务请求调度技术中,需要投入较高的成本来购买和维护大规模的计算和存储设备,需要处理密集型的计算任务,需要与多个
AI
服务微服务进行交互等功能,需要较多的计算时间,需要更多的服务器资源来应对请求量的增加,涉及敏感信息和数据,涉及多个微服务和复杂的网络结构,会依赖一些第三方技术和工具,且这些技术和工具的稳定性和可靠性可能不尽相同,因此,在现有技术中,便会出现成本高

效率低

结构复杂

速度慢

管理维护困难以及技术不稳定等问题


技术实现思路

[0004]本申请提供一种
AI
服务请求调度的方法

装置

设备及介质,用于解决现有的
AI
服务请求调度技术中出现的低资源利用率和低响应等问题

[0005]一方面,提供一种
AI
服务请求调度的方法,所述方法包括:调用目标
AI
网关通过
Nginx
服务器接收
AI
业务系统发送的资源调度请求;根据预设的负载均衡算法与算力集群中各个节点的节点信息,调用所述目标
AI
网关确定进行资源调度的目标节点;其中,所述各个节点均采用
AidLux
融合操作系统,且所述节点信息包括节点状态

资源配置以及负载情况;在所述目标
AI
网关与所述目标节点中的
AI
应用之间建立
websocket
长连接;调用所述目标
AI
网关通过所述
websocket
长连接将所述资源调度请求分配给所述目标节点

[0006]可选的,在调用所述目标
AI
网关通过所述
websocket
长连接将所述资源调度请求分配给所述目标节点之后,所述方法还包括:调用所述
AI
应用对所述资源调度请求进行解析,生成资源调度任务;调用所述
AI
应用对所述资源调度任务进行处理,获得调度处理结果

[0007]可选的,在调用所述
AI
应用对所述资源调度任务进行处理,获得调度处理结果之后,所述方法还包括:调用所述
AI
应用将所述调度处理结果反馈给所述目标
AI
网关;调用所述目标
AI
网关将所述调度处理结果反馈给所述
Nginx
服务器;调用所述
Nginx
服务器将所述调度处理结果反馈给所述
AI
业务系统

[0008]可选的,在根据预设的负载均衡算法与算力集群中各个节点的节点信息,调用所述目标
AI
网关确定进行资源调度的目标节点之前,所述方法还包括:调用节点管理平台通过监控平台获取所述算力集群中各个节点的节点信息;调用所述目标
AI
网关从所述节点管理平台中获取所述算力集群中各个节点的节点信息

[0009]可选的,所述调用节点管理平台通过监控平台获取所述算力集群中各个节点的节点信息的步骤,包括:根据数据缓存或预加载机制,调用节点管理平台通过监控平台从数据库中获取算力集群中各个节点的节点信息

[0010]可选的,在调用所述目标
AI
网关从所述节点管理平台中获取所述算力集群中各个节点的节点信息之后,所述方法还包括:若监控平台监控到存在节点下线,或监控到存在节点资源配置发生变化,则调用所述节点管理平台向所述目标
AI
网关发送节点变化通知;根据所述节点变化通知,调用所述目标
AI
网关获取相应的节点实时更新信息

[0011]可选的,在调用所述目标
AI
网关从所述节点管理平台中获取所述算力集群中各个节点的节点信息之后,所述方法还包括:若监控平台监控到存在节点出现故障,则调用所述节点管理平台向所述目标
AI
网关发送节点切换通知;根据所述节点切换通知,调用所述目标
AI
网关进行节点自动切换

[0012]一方面,提供一种
AI
服务请求调度的装置,所述装置包括:请求发送单元,用于调用目标
AI
网关通过
Nginx
服务器接收
AI
业务系统发送的资源调度请求;节点确定单元,用于根据预设的负载均衡算法与算力集群中各个节点的节点信息,调用所述目标
AI
网关确定进行资源调度的目标节点;其中,所述各个节点均采用
AidLux
融合操作系统,且所述节点信息包括节点状态

资源配置以及负载情况;连接建立单元,用于在所述目标
AI
网关与所述目标节点中的
AI
应用之间建立
websocket
长连接;请求分配单元,用于调用所述目标
AI
网关通过所述
websocket
长连接将所述资源调度请求分配给所述目标节点

[0013]一方面,提供一种电子设备,包括存储器

处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一种方法

[0014]一方面,提供一种计算机存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述任一种方法

[0015]与现有技术相比,本申请的有益效果为:在本申请实施例中,当
AI
服务请求调度时,首先,可以调用目标
AI
网关通过
Nginx
服务器接收
AI
业务系统发送的资源调度请求;然后,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种
AI
服务请求调度的方法,其特征在于,所述方法包括:调用目标
AI
网关通过
Nginx
服务器接收
AI
业务系统发送的资源调度请求;根据预设的负载均衡算法与算力集群中各个节点的节点信息,调用所述目标
AI
网关确定进行资源调度的目标节点;其中,所述各个节点均采用
AidLux
融合操作系统,且所述节点信息包括节点状态

资源配置以及负载情况;在所述目标
AI
网关与所述目标节点中的
AI
应用之间建立
websocket
长连接;调用所述目标
AI
网关通过所述
websocket
长连接将所述资源调度请求分配给所述目标节点
。2.
如权利要求1所述的方法,其特征在于,在调用所述目标
AI
网关通过所述
websocket
长连接将所述资源调度请求分配给所述目标节点之后,所述方法还包括:调用所述
AI
应用对所述资源调度请求进行解析,生成资源调度任务;调用所述
AI
应用对所述资源调度任务进行处理,获得调度处理结果
。3.
如权利要求2所述的方法,其特征在于,在调用所述
AI
应用对所述资源调度任务进行处理,获得调度处理结果之后,所述方法还包括:调用所述
AI
应用将所述调度处理结果反馈给所述目标
AI
网关;调用所述目标
AI
网关将所述调度处理结果反馈给所述
Nginx
服务器;调用所述
Nginx
服务器将所述调度处理结果反馈给所述
AI
业务系统
。4.
如权利要求1所述的方法,其特征在于,在根据预设的负载均衡算法与算力集群中各个节点的节点信息,调用所述目标
AI
网关确定进行资源调度的目标节点之前,所述方法还包括:调用节点管理平台通过监控平台获取所述算力集群中各个节点的节点信息;调用所述目标
AI
网关从所述节点管理平台中获取所述算力集群中各个节点的节点信息
。5.
如权利要求4所述的方法,其特征在于,所述调用节点管理平台通过监控平台获取所述算力集群中...

【专利技术属性】
技术研发人员:孙晓刚徐建刚
申请(专利权)人:成都阿加犀智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1