System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 服务分配方法、芯片、电子设备及计算机可读存储介质组成比例_技高网

服务分配方法、芯片、电子设备及计算机可读存储介质组成比例

技术编号:40544436 阅读:5 留言:0更新日期:2024-03-05 19:01
本申请涉及计算机技术领域,提供了一种服务分配方法、芯片、电子设备及计算机可读存储介质,该方法包括:获取待分配服务在多个AI核中的每个AI核上运行所需要的预计算力耗时;获取多个AI核中每个AI核的当前可用算力时长;从多个AI核中获取目标AI核,目标AI核的当前可用算力时长满足待分配服务的预计算力耗时;将待分配服务分配至目标AI核。本申请提供的技术方案能够提高服务器部署待分配服务的合理性以及服务器上多个AI核的算力利用率。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种服务分配方法、芯片、电子设备及计算机可读存储介质


技术介绍

1、服务器可以用于进行一些高性能计算和数据处理服务分配任务,具有强大的计算能力和高速的数据处理服务分配能力,可以用于进行复杂的科学计算、数据分析、人工智能训练和推理等任务。

2、服务器通常配置有cpu(central processing unit,中央处理器)大容量的内存、以及gpu(graphics processing unit,图形处理器)或者npu(neural processing unit,神经网络处理器),这些处理器能够为服务器提供并行计算能力。当处理器采用ai(artificial intelligence,人工智能)技术时,可以称之为ai核。由于不同的ai核之间的算力不能共享,需要通过合理的分配,将不同的任务或者服务分配至不同的ai核进行处理,以提高服务器的处理效率。现有的技术方案中,不同的任务或服务是通过用户操作来实现和不同ai核的绑定。

3、通过用户手动对不同的任务或服务绑定ai核的方式容易出现算力分配不均或算力过载的情况。


技术实现思路

1、本申请实施例提供了一种服务分配方法、装置、芯片、电子设备及计算机可读存储介质,能够减少服务器算力资源的浪费,提高服务器算力分配的合理性和算力利用率。

2、第一方面,本申请实施例提供了一种服务分配方法,包括:

3、获取待分配服务在多个ai核中的每个ai核上运行所需要的预计算力耗时。</p>

4、获取多个ai核中每个ai核的当前可用算力时长。

5、从多个ai核中获取目标ai核,目标ai核的当前可用算力时长满足待分配服务的预计算力耗时。

6、将待分配服务分配至目标ai核。

7、在一些实时方式中,目标ai核为多个ai核中的当前可用算力时长最长的ai核。

8、在一些实施方式中,上述将待分配服务分配至目标ai核,包括:

9、确定目标ai核的当前可用算力时长是否大于目标预计算力耗时,目标预计算力耗时为待分配服务在目标ai核上运行所占用的算力耗时。

10、若是,则将待分配服务分配至目标ai核。

11、在一些实施方式中,上述目标预计算力耗时为预计最优算力耗时。

12、在一些实施方式中,上述方法还包括:

13、若目标ai核的当前可用算力时长小于目标预计算力耗时,则获取目标ai核上运行待分配服务所需要的预计最低算力耗时。

14、当目标ai核的当前可用算力时长大于或等于预计最低算力耗时,则将待分配服务分配至目标ai核。

15、在一些实施方式中,当前可用算力时长为当前可用最优算力时长,上述方法还包括:

16、当目标ai核的当前可用最优算力时长小于预计最低算力耗时,则获取多个ai核中每个ai核的当前可用最低算力时长。

17、从多个ai核中选择出当前可用最低算力时长最长的一个作为目标ai核。

18、判断目标ai核的当前可用最低算力时长是否大于或等于预计最低算力耗时。

19、若是,则将待分配服务分配至目标ai核。

20、在一些实施方式中,上述从多个ai核中获取目标ai核,包括:

21、确定第一ai核的当前可用算力时长是否大于第一ai核运行待分配服务所需要的预计算力耗时,第一ai核为多个ai核中的任意一个。

22、若是,则将第一ai核加入待选ai核集。

23、从待选ai核集中筛选出目标ai核,目标ai核上运行的已运行服务中存在和待分配服务的服务类型相同的服务。

24、在一些实施方式中,上述方法还包括:

25、获取多个ai核中每个ai核的预计占用算力时长。

26、根据每个ai核的预计占用算力时长、预设风险阈值和预设安全阈值,对多个ai核中每个ai核进行风险标记,得到至少一个安全ai核和至少一个风险ai核,至少一个安全ai核和至少一个风险ai核为多个ai核中的ai核,预设风险阈值大于预设安全阈值。

27、将风险ai核上的已运行服务迁移至安全ai核。

28、在一些实施方式中,上述将风险ai核上的已运行服务迁移至安全ai核,包括:

29、获取多个已运行服务中每个已运行服务的预计占用算力时长,多个已运行服务为第一风险ai核中运行的服务,第一风险ai核为至少一个风险ai核中的任意一个。

30、根据每个已运行服务的预计占用算力时长,从多个已运行服务中筛选出待迁移服务。

31、将待迁移服务迁移至目标安全ai核,目标安全ai核为至少一个安全ai核中的一个。

32、在一些实施方式中,上述方法还包括:

33、第一风险ai核的预计算力占用时长减去待迁移服务的预计占用算力时长的差为第一差值。

34、第一差值小于预设风险阈值,且大于第二差值。

35、第二差值为第一风险ai核的预计占用算力时长减去其他已运行服务的预计占用算力时长的差值,其他已运行服务为第一风险ai核上运行的多个已运行服务中与待迁移服务不同的任意一个服务。

36、在一些实施方式中,至少一个安全ai核的数量为多个,将待迁移服务迁移至目标安全ai核,包括:

37、获取至少一个安全ai核中每个安全ai核的预计占用算力时长。

38、从至少一个安全ai核中选择预计占用算力时长最短的一个作为目标安全ai核。

39、将待迁移服务迁移至目标安全ai核。

40、在一些实施方式中,将待迁移服务迁移至目标安全ai核,包括:

41、确定待迁移服务的预计占用算力耗时和目标安全ai核的预计占用算力时长的和,是否小于预设风险阈值。

42、若是,则将待迁移服务迁移至目标安全ai核。

43、若否,则返回执行获取多个已运行服务中每个已运行服务的预计占用算力时长的步骤。

44、在一些实施方式中,获取多个ai核中每个ai核的预计占用算力时长,包括:

45、获取第一ai核的预计占用算力时长,第一ai核为多个ai核中的任意一个,预计占用算力时长为多个瞬时占用算力时长、按照预设的权重系数进行加权求和得到的算力时长。

46、多个瞬时占用算力时长为在多个时间点采样得到的占用算力时长,多个瞬时占用算力时长和多个时间点一一对应,多个时间点为预设时段内的互不相同的时间点,第一瞬时占用时长为第一时间点采样得到的瞬时占用算力时长,第二瞬时占用时长为第二时间点采样得到的瞬时占用算力时长,第一瞬时占用算力时长所对应的第一权重系数比第二瞬时占用算力时长对应的第二权重系数大,第一时间点比第二时间点距离预设时段的结束时刻近,第一时间点和第二时间点为多个时间点中不同的时间点。

47、在一些实施方式中,获取第一ai核的预计占用算力时长,包括:

48、基于第一本文档来自技高网...

【技术保护点】

1.一种服务分配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述目标AI核为所述多个AI核中的当前可用算力时长最长的AI核。

3.根据权利要求1或2所述的方法,其特征在于,所述将所述待分配服务分配至所述目标AI核,包括:

4.根据权利要求3所述的方法,其特征在于,所述目标预计算力耗时为预计最优算力耗时。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述当前可用算力时长为当前可用最优算力时长,所述方法还包括:

7.根据权利要求4至6中任一项所述的方法,其特征在于,所述从所述多个AI核中获取目标AI核,包括:

8.根据权利要求1、2、4、5和6中任一项所述的方法,其特征在于,所述方法还包括:

9.根据权利要求8所述的方法,其特征在于,所述将所述风险AI核上的已运行服务迁移至所述安全AI核,包括:

10.根据权利要求9所述的方法,其特征在于,

11.根据权利要求9或10所述的方法,其特征在于,所述至少一个安全AI核的数量为多个,所述将所述待迁移服务迁移至目标安全AI核,包括:

12.根据权利要求11所述的方法,其特征在于,所述将所述待迁移服务迁移至所述目标安全AI核,包括:

13.根据权利要求8所述的方法,其特征在于,所述获取所述多个AI核中每个所述AI核的预计占用算力时长,包括:

14.根据权利要求13所述的方法,其特征在于,所述获取第一AI核的预计占用算力时长,包括:

15.一种电子设备,其特征在于,包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序以实现如上述权利要求1-14中任一项中所述的方法。

16.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述权利要求1-14中任一项中所述的方法。

...

【技术特征摘要】

1.一种服务分配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述目标ai核为所述多个ai核中的当前可用算力时长最长的ai核。

3.根据权利要求1或2所述的方法,其特征在于,所述将所述待分配服务分配至所述目标ai核,包括:

4.根据权利要求3所述的方法,其特征在于,所述目标预计算力耗时为预计最优算力耗时。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述当前可用算力时长为当前可用最优算力时长,所述方法还包括:

7.根据权利要求4至6中任一项所述的方法,其特征在于,所述从所述多个ai核中获取目标ai核,包括:

8.根据权利要求1、2、4、5和6中任一项所述的方法,其特征在于,所述方法还包括:

9.根据权利要求8所述的方法,其特征在于,所述将所述风险ai核上的已运行服务迁移至所述安全ai核,包...

【专利技术属性】
技术研发人员:季永国
申请(专利权)人:普联技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1