一种AI算力自动调度方法、装置及介质制造方法及图纸

技术编号：39331160 阅读：15 留言：0更新日期：2023-11-12 16:07

本发明专利技术提供了一种AI算力自动调度方法、装置、介质及设备，该方法用以实现AI算力资源的充分利用并降低计算延迟，包括：获取N个AI任务队列，其中，AI任务队列包括多个待处理的AI任务，通过调度引擎查询算力资源池中各个计算节点的运行状态和算力资源的使用情况，确定当前可用的计算资源状态，其中，算力资源池用于管理多个计算节点的计算资源；根据AI任务特征和当前可用的计算资源状态，动态调整AI任务的资源分配策略，根据调整后的AI任务的资源分配策略，为N个AI任务队列分配对应的计算资源。AI任务特征包括AI任务所在队列排序、AI任务所需算力等级和AI任务的优先级，其中，排序靠前、算力等级高和/或优先级高的AI任务优先分配计算资源。源。源。

全部详细技术资料下载

【技术实现步骤摘要】
一种AI算力自动调度方法、装置及介质

[0001]本专利技术涉及人工智能
，尤其涉及一种AI算力自动调度方法、装置、介质及设备。

技术介绍

[0002]现有的人工智能(Artificial Intelligence，AI)算力主要是通过用户主动占用图像处理器(graphics processing unit，GPU)，获取GPU使用权限，才可以使用GPU，这样的方式相当于将GPU与用户绑定，即时当前用户没有任务需要处理，因用户未解绑，导致资源无法及时释放，大大的降低了GPU的使用率，造成GPU资源浪费。因此，亟需提供一种新的AI算力自动调度方案，来解决上述问题。

技术实现思路

[0003]本专利技术的目的在于提供一种AI算力自动调度方法、装置、介质及设备，用以实现AI算力资源的充分利用并降低计算延迟。
[0004]第一方面，本专利技术实施例提供一种AI算力自动调度方法，该方法包括：获取N个AI任务队列，其中，所述AI任务队列包括多个待处理的AI任务，N为正整数；通过调度引擎查询算力资源池中各个计算节点的运行状态和算力资源的使用情况，确定当前可用的计算资源状态，其中，所述算力资源池用于管理多个计算节点的计算资源；根据AI任务特征和当前可用的计算资源状态，动态调整AI任务的资源分配策略，根据调整后的AI任务的资源分配策略，为N个AI任务队列分配对应的计算资源。所述AI任务特征包括AI任务所在队列排序、AI任务所需算力等级和AI任务的优先级，其中，排序靠前的AI任务优先分配计算资源，所需算力等...

【技术保护点】

【技术特征摘要】
1.一种AI算力自动调度方法，其特征在于，包括：获取N个AI任务队列，其中，所述AI任务队列包括多个待处理的AI任务，N为正整数；通过调度引擎查询算力资源池中各个计算节点的运行状态和算力资源的使用情况，确定当前可用的计算资源状态，其中，所述算力资源池用于管理多个计算节点的计算资源；根据AI任务特征和当前可用的计算资源状态，动态调整AI任务的资源分配策略，所述AI任务特征包括AI任务所在队列排序、AI任务所需算力等级和AI任务的优先级，其中，排序靠前的AI任务优先分配计算资源，所需算力等级高的AI任务优先分配计算资源，AI任务的优先级高的AI任务优先分配计算资源；根据调整后的AI任务的资源分配策略，为N个AI任务队列分配对应的计算资源。2.根据权利要求1所述的方法，其特征在于，根据AI任务特征和当前可用的计算资源状态，动态调整AI任务的资源分配策略，包括：当AI任务的优先级为最高优先级时，则为所述AI任务优先分配VIP算力等级的计算资源，且为所述AI任务保留所述VIP算力等级的计算资源至设定时长后再释放计算资源；当AI任务的优先级不是最高优先级时，则为所述AI任务按设定算法分配实时算力等级，非实时算力等级以及夜间算力等级对应的可用计算资源。3.根据权利要求2所述的方法，其特征在于，当AI任务的优先级不是最高优先级，按设定算法分配实时算力等级，非实时算力等级以及夜间算力等级对应的可用计算资源，包括：当AI任务的优先级不是最高优先级时，则判断所述AI任务所需算力等级是否为实时算力等级，若是，则为所述AI任务按比例优先分配VIP算力等级和实时算力等级的计算资源；当所述AI任务所需算力等级不是实时算力等级且不是夜间算力等级时，则为所述AI任务按比例优先分配VIP算力等级、实时算力等级和非实时算力等级的计算资源；当所述AI任务所需算力等级为夜间算力等级，为所述AI任务按比例优先分配VIP算力等级、实时算力等级、非实时算力等级和夜间算力等级的计算资源。4.根据权利要求1至3任一项所述的方法，其特征在于，还包括：当所述AI任务执行完毕后，通过调度引擎向用户反馈计算结果，并释放所述AI任务占用的计算资源。5.根据权利要求1至3任一项所述的方法，其特征在于，还包括：通过监控系统收集和分析多个计算节点的运行状况和计算资源利用状况；根据计算资源利用状况确定是否增加或减少计算节点。6.一种AI算力自动调度装置，其特征在于，包括：获取单元，...

【专利技术属性】
技术研发人员：刘斌，
申请(专利权)人：上海数珩信息科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人