【技术实现步骤摘要】
一种算力资源分配方法及装置
本专利技术涉及数据处理
,尤其涉及一种算力资源分配方法及装置。
技术介绍
常用的公有云环境,以GPU裸算力出租,或者算法层SaaS服务为主要形式输出。以云服务商的异构算力服务为例,通常分为以下几种:1.GPU裸算力服务,以裸服务器的方式,提供搭载CPU+GPU的云服务器;2.AI标注服务;结合商品标签、车牌识别等应用场景,为用户提供在线标注服务;3.AI模型开发:在模型标注的基础上,利用小量数据在线对模型进行调整,对GPU等异构算力有一定的需求,但是需求量碎片化;4.AI模型训练:在标注、模型开发的基础上,用大量数据进行训练。这一阶段需要大量的计算资源。5.AI推衍服务:在公有云海量计算节点的基础上,提供自动负载均衡,动态扩容,并提供面向图像识别、自然语言处理等多个行业领域的服务。公有云上以上服务流程由于所需算力资源量相差大,目前算力资源动态调度困难,采用切割成若干产品,以算力加服务的形式提供给用户,导致用户数据管理复杂,资源调度慢,资源利用率 ...
【技术保护点】
1.一种算力资源分配方法,其特征在于,包括:/n接收带有用户类型标记的任务请求,所述任务请求包括任务类型、任务时长、算力资源需求量、任务优先级以及资源池选择、队列选择;/n根据所述用户类型对任务请求进行初分配,满足第一条件则控制该任务请求进入下一步骤,否则控制该任务请求进入所选资源池内的所选队列;/n根据所述用户类型以及其已用算力资源量计算其算力资源余量,若所述用户的算力资源余量满足该任务请求的所述算力资源需求量,则控制该任务请求进入所选资源池内的所选队列,否则,控制该任务请求进入所述用户的任务请求队列;/n当监测到所述用户的算力资源余量满足该任务请求的所述算力资源需求量, ...
【技术特征摘要】
1.一种算力资源分配方法,其特征在于,包括:
接收带有用户类型标记的任务请求,所述任务请求包括任务类型、任务时长、算力资源需求量、任务优先级以及资源池选择、队列选择;
根据所述用户类型对任务请求进行初分配,满足第一条件则控制该任务请求进入下一步骤,否则控制该任务请求进入所选资源池内的所选队列;
根据所述用户类型以及其已用算力资源量计算其算力资源余量,若所述用户的算力资源余量满足该任务请求的所述算力资源需求量,则控制该任务请求进入所选资源池内的所选队列,否则,控制该任务请求进入所述用户的任务请求队列;
当监测到所述用户的算力资源余量满足该任务请求的所述算力资源需求量,从所述用户的任务请求队列调度所述任务请求进入所选资源池内的所选队列。
2.根据权利要求1所述的算力资源分配方法,其特征在于,当该任务请求位于所选资源池内的所选队列时,
按照该任务请求的所述算力资源需求量与所选资源池内空闲资源的匹配度确定算力资源,并调度给所述任务;或,
按照队列排序,根据用户分值以及该任务请求的所述算力资源需求量确定算力资源,并调度给所述任务。
3.根据权利要求2所述的算力资源分配方法,其特征在于,当调度给该任务的算力资源量小于其算力资源需求量时,按照预设时段,检测该任务的算力资源占用率,若所述算力资源占用率达到调度阈值,则再次根据用户分值以及该任务请求的所述算力资源需求量确定算力资源直至该任务累计调度的算力资源量等于算力资源需求量。
4.根据权利要求2所述的算力资源分配方法,其特征在于,所述用户分值根据本年度合作指数、前n年内付费年次数以及用户重点指数评估。
5.根据权利要求4所述的算力资源分配方法,其特征在于,所述用户分值F>20,则调度的算力资源最大值≤M,其中,
F=5a+2b+5c,M为GPU卡数,
a为本年度合作指数,已签合同且付款则指数为2,已签合同未付款则指数为1;b为前5年内付费年次数;c为用户重点指数,长期重点用户的指数为2,短期重点用户的指...
【专利技术属性】
技术研发人员:徐莹,戴坚君,郭培卿,张怡,周曦民,
申请(专利权)人:上海超级计算中心,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。