一种资源调度方法、装置及系统制造方法及图纸

技术编号：24852705 阅读：32 留言：0更新日期：2020-07-10 19:06

本发明专利技术提供了一种资源调度方法、装置及系统，涉及计算机技术领域。本发明专利技术通过接收客户端发送的资源获取请求，根据资源获取请求，按照预设的资源调度策略从资源管理列表中确定目标服务器对应的第一标识以及目标服务器中的目标GPU对应的第二标识，将第一标识和第二标识发送至客户端，以使客户端根据第一标识和第二标识，启动目标服务器中的目标GPU执行客户端发送的服务请求对应的应用服务。当客户端需要发起AI服务请求时，首先要按照预设的资源调度策略为该AI服务请求分配GPU，提高每个GPU的使用效率，并且使得每个GPU能够高效、可靠的执行AI服务。

全部详细技术资料下载

【技术实现步骤摘要】
一种资源调度方法、装置及系统
本专利技术涉及计算机
，特别是涉及一种资源调度方法、装置及系统。
技术介绍
近年来，AI(ArtificialIntelligence，人工智能)技术得以快速发展和成熟，逐渐被应用到零售、医疗、教育等行业中，AI技术主要依赖于服务器中的CPU(GraphicProcessingUnit，图形处理器)作为执行AI服务的主要资源。目前，是将GPU与具体的AI服务绑定，当客户端发起AI服务请求时，直接调动绑定的GPU执行该AI服务请求对应的AI服务。但是，目前绑定GPU与AI服务的方法，当AI服务的种类较多时，随着AI服务访问的不均衡性，将会导致访问量少的AI服务绑定的GPU的使用率低，而访问量多的AI服务绑定的GPU将会出现GPU资源不足的情况。
技术实现思路
本专利技术提供一种资源调度方法、装置及系统，以解决现有的绑定GPU与AI服务的方法，会导致访问量少的AI服务绑定的GPU的使用率低，而访问量多的AI服务绑定的GPU将会出现GPU资源不足的问题。>为了解决上述问题，本文档来自技高网...

【技术保护点】
1.一种资源调度方法，其特征在于，包括：/n接收客户端发送的资源获取请求；/n根据所述资源获取请求，按照预设的资源调度策略从资源管理列表中确定目标服务器对应的第一标识以及所述目标服务器中的目标GPU对应的第二标识；/n将所述第一标识和所述第二标识发送至所述客户端，以使所述客户端根据所述第一标识和所述第二标识，启动所述目标服务器中的所述目标GPU执行所述客户端发送的服务请求对应的应用服务。/n

【技术特征摘要】
1.一种资源调度方法，其特征在于，包括：
接收客户端发送的资源获取请求；
根据所述资源获取请求，按照预设的资源调度策略从资源管理列表中确定目标服务器对应的第一标识以及所述目标服务器中的目标GPU对应的第二标识；
将所述第一标识和所述第二标识发送至所述客户端，以使所述客户端根据所述第一标识和所述第二标识，启动所述目标服务器中的所述目标GPU执行所述客户端发送的服务请求对应的应用服务。

2.根据权利要求1所述的方法，其特征在于，所述资源管理列表包括多个服务器对应的服务器标识，每个所述服务器中的多个GPU对应的GPU标识，以及每个所述GPU的资源使用情况，所述资源使用情况包括执行的应用服务对应的服务类型和服务数量。

3.根据权利要求2所述的方法，其特征在于，所述资源获取请求包括目标服务类型；所述根据所述资源获取请求，按照预设的资源调度策略从资源管理列表中确定目标服务器对应的第一标识以及所述目标服务器中的目标GPU对应的第二标识的步骤，包括：
确定所述资源管理列表中是否存在，当前执行的应用服务对应的服务类型为所述目标服务类型的GPU对应的GPU标识；
当存在时，从执行所述目标服务类型的GPU对应的GPU标识中，选取执行的服务数量最少的GPU对应的GPU标识作为所述第二标识；
将所述第二标识对应的服务器标识，确定为所述第一标识。

4.根据权利要求3所述的方法，其特征在于，在所述确定所述资源管理列表中是否存在，当前执行的应用服务对应的服务类型为所述目标服务类型的GPU对应的GPU标识的步骤之后，还包括：
当不存在时，从所述资源管理列表中选取任意一个未执行应用服务的GPU对应的GPU标识作为所述第二标识；
将所述第二标识对应的服务器标识，确定为所述第一标识。

5.根据权利要求2所述的方法，其特征在于，在所述根据所述资源获取请求，按照预设的资源调度策略从资源管理列表中确定目标服务器对应的第一标识以及所述目标服务器中的目标GPU对应的第二标识的步骤之前，还包括：
接收服务器发送的每个GPU的资源使用情况；
根据所述资源使用情况，更新所述...

【专利技术属性】
技术研发人员：王晓红，
申请(专利权)人：京东方科技集团股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人