System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种算力可用性和计算能力的监测与抑制系统和方法技术方案_技高网

一种算力可用性和计算能力的监测与抑制系统和方法技术方案

技术编号:40608728 阅读:4 留言:0更新日期:2024-03-12 22:16
本发明专利技术实施例提供的一种算力可用性和计算能力的监测与抑制系统,应用于算力网络中,包括算力可用性监测模块,算力差异性监测模块、算力调度模块,算力可用性监测模块,被配置为将大于预设算力震荡上限阈值的算力资源/服务记入算力震荡列表;算力差异性监测模块,被配置为基于所述算力震荡评估值和实际算力震荡评估值,得到差异性振荡值,基于所述差异性振荡值创建算力实际服务震荡列表;算力调度模块,被配置为基于所述算力震荡列表和算力实际服务震荡列表,减少列表中记录的算力资源/服务在所述算力网络选路算法中被选中的概率。本申请从算力方面考虑算力供给的震荡以及算力实际服务过程中计算能力的震荡对算力网络的影响并给予抑制。

【技术实现步骤摘要】

本专利技术属于网络通信,尤其涉及一种算力可用性和计算能力的监测与抑制系统和方法


技术介绍

1、算力网络是一种新型的网络技术,通过控制平面获取计算、存储、网络等资源信息,在全网算力感知和集中管理的基础上,通过对算力和网络资源的协同调度,将不同的应用沿最优路径,调度到最优算力节点,实现业务服务质量最优的同时,保证网络资源和计算资源的利用率最优化。

2、算力由芯片、存储等计算资源及在其上运行的操作系统和软件组成,算力资源和服务也会因为各种各样的原因导致不稳定性,导致算力资源和服务不稳定性的因素有很多,比如硬件过热导致的问题、软件的间歇性响应速度问题,还有负载等问题导致的备案的计算能力与实际表现不符的问题,这些间歇性算力资源服务的不稳定性我们统称为算力震荡。算力震荡会严重影响算力网络服务的可靠性和稳定性,采用一定的手段和技术抑制不稳定算力对外提供算力服务,也就是抑制算力震荡,对提高算力网络服务的可用性有重大意义。


技术实现思路

1、针对算力震荡引起的算力网络服务的可靠性和稳定性问题。本申请实施例提供了一种算力可用性和计算能力的监测与抑制系统和方法。

2、第一方面,本申请提供了一种算力可用性和计算能力的监测与抑制系统,该系统包括:算力可用性监测模块,被配置为在预设观察时间段内,记录所述算力网络中算力资源/服务出现的不可用次数,并基于所述不可用次数计算算力震荡惩罚值,在所述观察时间段结束后,基于所述算力震荡惩罚值,将大于预设算力震荡上限阈值的所述算力资源/服务记入算力震荡列表;算力评估模块,被配置为基于算力资源/服务的算力类型对所述算力资源/服务进行算力评估,得到所述算力资源/服务的算力评估值;数据库备案模块,被配置为记录所述算力资源/服务的算力初始值;算力差异性监测模块,被配置为基于所述算力资源/服务的算力评估值和算力初始值,计算得出算力震荡评估值;基于所述算力震荡评估值和实际算力震荡评估值,得到差异性振荡值,基于所述差异性振荡值创建算力实际服务震荡列表;所述实际算力震荡评估值为所述算力资源和服务实际服务过程中,基于同一算力任务在所述算力资源/服务上历史若干次运行时间的平均值作为基准值判定得出;算力调度模块,被配置为基于所述算力震荡列表和算力实际服务震荡列表,减少列表中记录的算力资源/服务在所述算力网络选路算法中被选中的概率。

3、在一个实施例中,所述减少列表中记录的算力资源/服务在所述算力网络选路算法中被选中的概率,包括:接收目标算力任务的算力调度请求,通过将算力震荡列表中的所述算力震荡惩罚值作为选路时的参考权重,以及对算力实际服务震荡列表中记录的算力资源/服务添加惩罚因子作为选路时的参考权重;从而确定用于执行目标算力任务的算力资源/服务。

4、在一个实施例中,所述系统还包括:算力资源/服务获取模块,被配置为获取所述算力网络的资源/服务状态;算力计算能力请求模块,被配置为发送算力评估请求。

5、在一个实施例中,首次获取到所述算力网络的资源/服务状态为不可用时,添加所述资源/服务到所述算力震荡观察列表,并赋予初始惩罚值。

6、在一个实施例中,在所述预设观察时间段内,每记录一次算力资源/服务的不可用次数,所述算力资源/服务的惩罚值增加预设的第一常量;以及在所述预设观察时间段内,每记录一次算力资源/服务的可用次数,所述算力资源/服务的奖赏值增加预设的第二常量;在所述预设观察时间段结束后,基于所述初始惩罚值、惩罚值和奖赏值,计算所述预设观察时间段内所述算力资源和服务的综合奖赏值,在所述综合奖赏值小于设定的第一算力震荡下限阈值时,将所述算力资源/服务从所述算力震荡观察列表中移除;在所述综合奖赏值不大于所述第一算力震荡上限阈值且不小于所述第一算力震荡下限阈值时,将所述算力资源/服务继续保留在算力震荡观察列表中进行震荡监控;在所述综合奖赏值大于设定的第一算力震荡上限阈值时,将所述算力资源/服务加入所述算力震荡列表。

7、在一个实施例中,当目标任务所属的任务类型对应服务稳定性要求高等级并且所述任务类型对应性能稳定性要求普通等级时,从所述算力资源/服务列表中,确定至少一个没有出现在算力震荡列表中的第一候选算力资源/服务,以及从至少一个第一候选算力资源/服务中选择用于执行目标任务的算力服务;所述第一候选算力资源/服务为没有出现在算力震荡列表中的算力资源/服务;当所述任务类型对应服务稳定性要求高等级并且所述任务类型对应性能稳定性要求高等级时,从所述算力资源/服务列表中确定至少一个没有出现在算力实际服务震荡列表、算力震荡列表中任意一个的第三候选算力资源/服务,以及从至少一个第三候选算力资源/服务中选择用于执行目标任务的算力资源/服务;所述第三候选算力资源/服务为没有出现在算力震荡列表和算力实际服务震荡列表的算力资源/服务。

8、在一个实施例中,所述算力计算能力请求模块,被配置为获取所述算力网络的算力评估值,包括:由所述算力计算能力请求模块发起算力评估请求,或者在算力资源/服务首次接入所述算力网络时,由所述算力计算能力请求模块发起算力评估请求;在发起算力评估请求之后,还包括:确定算力类型,基于所述算力类型,准备算力评估工具和环境进行算力评估;将评估结果记入算力评估结果数据库;基于所述评估结果,所述评估工具计算出算力评估值。

9、在一个实施例中,所述实际算力震荡评估值的获得包括:获取连续的多次利用目标算力资源/服务完成相应算力任务中每一次利用目标算力资源/服务完成相应任务的第一时长;根据获取的多个第一时长,确定所述实际算力震荡评估值;或者,获取由多个与目标算力资源/服务属于相同算力等级的其他算力资源/服务、目标算力资源/服务组成的算力服务组合中每个算力资源/服务的完成相应任务的第二时长,其中,所述每个算力资源/服务各自完成的相应任务的计算量属于同一计算量等级;根据获取的每个第二时长和所述每个算力资源/服务的备案算力值,确定所述实际算力震荡评估值。

10、另一方面,本申请实施例提供了一种算力可用性和计算能力的监测与抑制方法,应用于上述系统,该方法包括:在预设观察时间段内,记录算力资源/服务出现的不可用次数,并基于所述不可用次数计算算力震荡惩罚值,在所述观察时间段结束后,基于所述算力震荡惩罚值,将大于预设算力震荡上限阈值的所述算力资源和服务记入算力震荡列表;基于所述算力网络中算力资源/服务的算力评估值和算力初始值,计算得出算力震荡评估值;基于所述算力震荡评估值和实际算力震荡评估值,得到差异性振荡值,基于所述差异性振荡值创建算力实际服务震荡列表;所述实际算力震荡评估值为所述算力资源/服务实际服务过程中,基于同一算力任务在所述算力资源/服务历史若干次运行时间的平均值作为基准值判定得出;其中基于算力资源/服务的算力类型对所述算力资源和服务进行算力评估,得到所述算力资源/服务的算力评估值;所述算力资源/服务的算力初始值记录在数据库中;基于所述算力震荡列表和算力实际服务震荡列表,减少列表中记录的算力资源/服务在所述算力网络选路算法中被选中的概本文档来自技高网...

【技术保护点】

1.一种算力可用性和计算能力的监测与抑制系统,应用于算力网络中,包括:

2.根据权利要求1所述的系统,其特征在于,所述减少列表中记录的算力资源/服务在所述算力网络选路算法中被选中的概率,包括:

3.根据权利要求1所述的系统,其特征在于,所述系统还包括:

4.根据权利要求1所述的算力可用性和计算能力的监测与抑制系统,其特征在于,首次获取到所述算力网络的资源/服务状态为不可用时,添加所述资源/服务到所述算力震荡观察列表,并赋予初始惩罚值。

5.根据权利要求1所述的系统,其特征在于,在所述预设观察时间段内,每记录一次算力资源/服务的不可用次数,所述算力资源/服务的惩罚值增加预设的第一常量;以及

6.根据权利要求2所述的系统,其特征在于,

7.根据权利要求1所述的系统,其特征在于,所述算力计算能力请求模块,被配置为获取所述算力网络的算力评估值,包括:由所述算力计算能力请求模块发起算力评估请求,或者在算力资源/服务首次接入所述算力网络时,由所述算力计算能力请求模块发起算力评估请求;

8.根据权利要求1所述的系统,其特征在于,所述实际算力震荡评估值的获得包括:

9.一种算力可用性和计算能力的监测与抑制方法,应用于权利要求1-9任一项所述系统,其特征在于,包括:

...

【技术特征摘要】

1.一种算力可用性和计算能力的监测与抑制系统,应用于算力网络中,包括:

2.根据权利要求1所述的系统,其特征在于,所述减少列表中记录的算力资源/服务在所述算力网络选路算法中被选中的概率,包括:

3.根据权利要求1所述的系统,其特征在于,所述系统还包括:

4.根据权利要求1所述的算力可用性和计算能力的监测与抑制系统,其特征在于,首次获取到所述算力网络的资源/服务状态为不可用时,添加所述资源/服务到所述算力震荡观察列表,并赋予初始惩罚值。

5.根据权利要求1所述的系统,其特征在于,在所述预设观察时间段内,每记录一次算力资源/服务的...

【专利技术属性】
技术研发人员:艾定军陶鸿飞卢彦魁
申请(专利权)人:杭州东方通信软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1