System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种服务分配方法、芯片、电子设备及计算机可读存储介质。
技术介绍
1、服务器可以用于进行一些高性能计算和数据处理服务分配任务,具有强大的计算能力和高速的数据处理服务分配能力,可以用于进行复杂的科学计算、数据分析、人工智能训练和推理等任务。
2、服务器通常配置有cpu(central processing unit,中央处理器)大容量的内存、以及gpu(graphics processing unit,图形处理器)或者npu(neural processing unit,神经网络处理器),这些处理器能够为服务器提供并行计算能力。当处理器采用ai(artificial intelligence,人工智能)技术时,可以称之为ai核。由于不同的ai核之间的算力不能共享,需要通过合理的分配,将不同的任务或者服务分配至不同的ai核进行处理,以提高服务器的处理效率。现有的技术方案中,不同的任务或服务是通过用户操作来实现和不同ai核的绑定。
3、通过用户手动对不同的任务或服务绑定ai核的方式容易出现算力分配不均或算力过载的情况。
技术实现思路
1、本申请实施例提供了一种服务分配方法、装置、芯片、电子设备及计算机可读存储介质,能够减少服务器算力资源的浪费,提高服务器算力分配的合理性和算力利用率。
2、第一方面,本申请实施例提供了一种服务分配方法,包括:
3、获取待分配服务在多个ai核中的每个ai核上运行所需要的预计算力耗时。<
...【技术保护点】
1.一种服务分配方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述目标AI核为所述多个AI核中的当前可用算力时长最长的AI核。
3.根据权利要求1或2所述的方法,其特征在于,所述将所述待分配服务分配至所述目标AI核,包括:
4.根据权利要求3所述的方法,其特征在于,所述目标预计算力耗时为预计最优算力耗时。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述当前可用算力时长为当前可用最优算力时长,所述方法还包括:
7.根据权利要求4至6中任一项所述的方法,其特征在于,所述从所述多个AI核中获取目标AI核,包括:
8.根据权利要求1、2、4、5和6中任一项所述的方法,其特征在于,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,所述将所述风险AI核上的已运行服务迁移至所述安全AI核,包括:
10.根据权利要求9所述的方法,其特征在于,
11.根据权利要求9或10所述的方法
12.根据权利要求11所述的方法,其特征在于,所述将所述待迁移服务迁移至所述目标安全AI核,包括:
13.根据权利要求8所述的方法,其特征在于,所述获取所述多个AI核中每个所述AI核的预计占用算力时长,包括:
14.根据权利要求13所述的方法,其特征在于,所述获取第一AI核的预计占用算力时长,包括:
15.一种电子设备,其特征在于,包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序以实现如上述权利要求1-14中任一项中所述的方法。
16.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述权利要求1-14中任一项中所述的方法。
...【技术特征摘要】
1.一种服务分配方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述目标ai核为所述多个ai核中的当前可用算力时长最长的ai核。
3.根据权利要求1或2所述的方法,其特征在于,所述将所述待分配服务分配至所述目标ai核,包括:
4.根据权利要求3所述的方法,其特征在于,所述目标预计算力耗时为预计最优算力耗时。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述当前可用算力时长为当前可用最优算力时长,所述方法还包括:
7.根据权利要求4至6中任一项所述的方法,其特征在于,所述从所述多个ai核中获取目标ai核,包括:
8.根据权利要求1、2、4、5和6中任一项所述的方法,其特征在于,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,所述将所述风险ai核上的已运行服务迁移至所述安全ai核,包...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。