当前位置: 首页 > 专利查询>浙江大学专利>正文

一种请求调度方法、装置及存储介质制造方法及图纸

技术编号:34789651 阅读:23 留言:0更新日期:2022-09-03 19:52
本申请公开了一种请求调度方法、装置及存储介质,涉及云计算、边缘计算和人工智能领域,包括:接收由默认调度器转发的用户发送的应用请求;将所述应用请求发送至所述扩展调度器的过滤模块对同一集群中的节点进行过滤操作,得到第一过滤后节点;将所述第一过滤后节点发送至所述扩展调度器的打分模块并执行对应的打分操作,得到所述第一过滤后节点对应的分值;将全部所述分值中的最高分值对应的所述第一过滤后节点确定为目标节点并将所述目标节点与待调度的任务进行绑定。本申请设置一个扩展调度器接收默认调度器转发的应用请求,然后通过过滤模块以及打分模块得到一个目标节点并将所述目标节点发送至调度器,提高了调度的效率以及灵活性。率以及灵活性。率以及灵活性。

【技术实现步骤摘要】
一种请求调度方法、装置及存储介质


[0001]本专利技术涉及云计算、边缘计算和人工智能领域,特别涉及一种请求调度方法、装置及存储介质。

技术介绍

[0002]现阶段,随着人工智能和机器学习的迅猛发展,对智能加速卡,如GPU(Graphics Processing Unit,图形处理器)计算资源的需求越来越高。主流的容器化管理平台Kubernetes(K8s,一个开源的用于管理云平台中多个主机上的容器化的应用)虽然提供了扩展接口Device Plugin(设备插件),可以为不同种类的智能加速卡提供支持,但默认的调度器策略并不具备针对多种智能加速卡资源的统一调度能力。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种请求调度方法、装置及存储介质,能够提高调度的效率以及灵活性。其具体方案如下:第一方面,本申请公开了一种请求调度方法,应用于扩展调度器,包括:接收由默认调度器转发的用户发送的应用请求;将所述应用请求发送至所述扩展调度器的过滤模块对同一集群中的节点进行过滤操作,以得到第一过滤后节点;将所述第一过滤后节点发送至所述扩展调度器的打分模块并执行对应的打分操作,以得到所述第一过滤后节点对应的分值;将全部所述分值中的最高分值对应的所述第一过滤后节点确定为目标节点,并将所述目标节点与待调度的任务进行绑定并存储。
[0004]可选的,所述接收由默认调度器转发的用户发送的应用请求,包括:接收由默认调度器转发的满足预设请求转发规则的用户发送的应用请求;其中,所述默认调度器获取接收到所述应用请求中的目标资源类型字段,并判断所述目标资源类型字段是否为所述扩展调度器中的预设资源类型字段,若是则判定所述应用请求满足所述预设请求转发规则。
[0005]可选的,所述将所述应用请求发送至所述扩展调度器的过滤模块对同一集群中的节点进行过滤操作,以得到第一过滤后节点,包括:将所述应用请求发送至所述扩展调度器的过滤模块;通过所述过滤模块获取所述应用请求中的目标字段,向资源适配模块发送适配请求并基于所述目标字段进行初次过滤,以得到第二过滤后节点;通过所述过滤模块并基于所述第二过滤后节点以及资源统一管理模块进行二次过滤,以得到所述第一过滤后节点。
[0006]可选的,所述通过所述过滤模块获取所述应用请求中的目标字段,向资源适配模块发送适配请求并基于所述目标字段进行初次过滤,以得到第二过滤后节点,包括:
通过所述过滤模块获取所述应用请求中的目标字段以及应用需求信息;通过所述过滤模块将所述应用需求信息发送至所述资源适配模块,以便从所述资源适配模块中提取目标信息;所述目标信息提供与所述应用需求信息对应的应用服务;通过所述过滤模块并基于所述目标字段以及所述目标信息进行初次过滤,以得到所述第二过滤后节点。
[0007]可选的,所述通过所述过滤模块并基于所述第二过滤后节点以及资源统一管理模块进行二次过滤,以得到所述第一过滤后节点,包括:通过所述过滤模块获取所述资源统一管理模块中的目标负载信息;所述目标负载信息为与所述第二过滤后节点对应的信息;判断所述目标负载信息是否满足预设负载条件;将满足所述预设负载条件的所述目标负载信息确定为所述第一过滤后节点。
[0008]可选的,所述判断所述目标负载信息是否满足预设负载条件之前,还包括:在所述资源统一管理模块中设置算力统一度量模型,并利用所述算力统一度量模型对所述资源统一管理模块中的负载信息进行打分,以得到负载信息分值表;相应的,所述判断所述目标负载信息是否满足预设负载条件,包括:判断所述目标负载信息对应的分值是否满足预设负载分值条件。
[0009]可选的,所述将所述第一过滤后节点发送至所述扩展调度器的打分模块并执行对应的打分操作,以得到所述第一过滤后节点对应的分值,包括:将所述第一过滤后节点从所述过滤模块发送至所述扩展调度器的打分模块;通过所述打分模块从所述资源统一管理模块中获取与所述第一过滤后节点对应的目标资源信息;基于所述目标资源信息并按照预设打分规则对所述第一过滤后节点打分,以得到所述第一过滤后节点对应的分值表。
[0010]可选的,所述接收由默认调度器转发的用户发送的应用请求之前,还包括:在所述扩展调度器中设置存储模块,以便通过所述存储模块存储持久化管理应用需求、资源匹配策略以及集群中的全部资源信息;在所述扩展调度器中设置所述过滤模块,以便通过所述过滤模块监听所述集群中的节点信息,并且当所述节点信息发生变更时更新所述资源适配模块中的信息;在所述扩展调度器中设置所述资源统一管理模块,以便通过所述资源统一管理模块监听节点的所述资源信息,当所述资源信息发生变更时更新所述资源统一管理模块中的信息。
[0011]第二方面,本申请公开了一种请求调度装置,应用于扩展调度器,包括:请求接收模块,用于接收由默认调度器转发的用户发送的应用请求;过滤模块,用于将所述应用请求发送至所述扩展调度器的过滤模块对同一集群中的节点进行过滤操作,以得到第一过滤后节点;打分模块,用于将所述第一过滤后节点发送至所述扩展调度器的打分模块并执行对应的打分操作,以得到所述第一过滤后节点对应的分值;持久化存储模块,用于将全部所述分值中的最高分值对应的所述第一过滤后节点确定为目标节点,并将所述目标节点与待调度的任务进行绑定并存储。
[0012]第三方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如前述公开的请求调度方法。
[0013]可见,本申请提供了一种请求调度方法,包括:接收由默认调度器转发的用户发送的应用请求;将所述应用请求发送至所述扩展调度器的过滤模块对同一集群中的节点进行过滤操作,以得到第一过滤后节点;将所述第一过滤后节点发送至所述扩展调度器的打分模块并执行对应的打分操作,以得到所述第一过滤后节点对应的分值;将全部所述分值中的最高分值对应的所述第一过滤后节点确定为目标节点,并将所述目标节点与待调度的任务进行绑定并存储。由此可见,本申请设置一个扩展调度器接收默认调度器转发的应用请求,然后通过扩展调度器中设置的过滤模块以及打分模块基于所述应用请求进行对应的过滤以及打分操作,最终得到唯一的一个与所述应用请求对应的节点,并将所述目标节点发送至调度器,可以根据请求灵活的确定目标节点,提高了调度的效率以及灵活性。
附图说明
[0014]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0015]图1为本申请公开的一种请求调度方法流程图;图2为本申请公开的一种扩展调度器架构示意图;图3为本申请公开的一种扩展调度器适配模块架构图;图4为本申请公开的一种扩展调度器资源统一管理模块架构图;图5为本申请公开的一种连接示意图;图6为本申请公开的一种智能加速卡信息示意图;图7为本申请公开的一种智能加速卡节点统一管理验证示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种请求调度方法,其特征在于,应用于扩展调度器,包括:接收由默认调度器转发的用户发送的应用请求;将所述应用请求发送至所述扩展调度器的过滤模块对同一集群中的节点进行过滤操作,以得到第一过滤后节点;将所述第一过滤后节点发送至所述扩展调度器的打分模块并执行对应的打分操作,以得到所述第一过滤后节点对应的分值;将全部所述分值中的最高分值对应的所述第一过滤后节点确定为目标节点,并将所述目标节点与待调度的任务进行绑定并存储。2.根据权利要求1所述的请求调度方法,其特征在于,所述接收由默认调度器转发的用户发送的应用请求,包括:接收由默认调度器转发的满足预设请求转发规则的用户发送的应用请求;其中,所述默认调度器获取接收到所述应用请求中的目标资源类型字段,并判断所述目标资源类型字段是否为所述扩展调度器中的预设资源类型字段,若是则判定所述应用请求满足所述预设请求转发规则。3.根据权利要求1所述的请求调度方法,其特征在于,所述将所述应用请求发送至所述扩展调度器的过滤模块对同一集群中的节点进行过滤操作,以得到第一过滤后节点,包括:将所述应用请求发送至所述扩展调度器的过滤模块;通过所述过滤模块获取所述应用请求中的目标字段,向资源适配模块发送适配请求并基于所述目标字段进行初次过滤,以得到第二过滤后节点;通过所述过滤模块并基于所述第二过滤后节点以及资源统一管理模块进行二次过滤,以得到所述第一过滤后节点。4.根据权利要求3所述的请求调度方法,其特征在于,所述通过所述过滤模块获取所述应用请求中的目标字段,向资源适配模块发送适配请求并基于所述目标字段进行初次过滤,以得到第二过滤后节点,包括:通过所述过滤模块获取所述应用请求中的目标字段以及应用需求信息;通过所述过滤模块将所述应用需求信息发送至所述资源适配模块,以便从所述资源适配模块中提取目标信息;所述目标信息提供与所述应用需求信息对应的应用服务;通过所述过滤模块并基于所述目标字段以及所述目标信息进行初次过滤,以得到所述第二过滤后节点。5.根据权利要求4所述的请求调度方法,其特征在于,所述通过所述过滤模块并基于所述第二过滤后节点以及资源统一管理模块进行二次过滤,以得到所述第一过滤后节点,包括:通过所述过滤模块获取所述资源统一管理模块中的目标负载信息;所述目标负载信息为与所述第二过滤后节点对应的信息;判断所述目标负载信息是否满足预设负载...

【专利技术属性】
技术研发人员:崔广章华炜鲍虎军
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1