算力监控方法、装置、设备及存储介质制造方法及图纸

技术编号:44414164 阅读:30 留言:0更新日期:2025-02-25 10:29
本发明专利技术提供一种算力监控方法、装置、设备及存储介质,其中,所述方法包括:依据监控配置信息获取设备中多个算力元素的算力信息,所述监控配置信息包括监控元素标识,所述监控元素标识用于指示算力元素;依据所述算力信息对所述多个算力元素进行算力告警判决,生成算力告警消息,所述算力告警消息用于提醒用户算力元素的异常状态;依据所述算力信息构建算力日志,保存所述算力日志,上述方法用户通过设置监控配置信息指定本次需要进行监控的算力元素,从而本方法可适用于具有不同算力元素的算力平台,可维护性及易用性高,成本较低,并将算力信息并记录到算力日志,使得运行过程中的算力状态变动有据可查,便于实时追溯。

【技术实现步骤摘要】

本专利技术涉及计算机 ,尤其涉及一种算力监控方法、装置、设备及存储介质


技术介绍

1、随着人工智能、大模型等技术快速发展,人们对服务器的算力需求也开始飞跃式的提升,算力正呈爆发式增长态势。算力作为数据经济时代的核心生产力,其的重要性日益凸显。

2、作为算力基础设施的服务器要求高效运转,而在实际应用中,对服务器的cpu(中央处理器)使用率、gpu(图形处理器)使用率等算力状态未做实时统计,无法实时监控服务器算力,无法支撑高效的算力调度,造成了资源的极大浪费。


技术实现思路

1、

2、本专利技术提供一种算力监控方法、装置、设备及存储介质,用以解决现有技术中无法实时监控服务器算力的缺陷,实现多算力平台的监控,并且使得算力平台的算力状态变动有据可查。

3、本专利技术提供一种算力监控方法,包括如下步骤:依据监控配置信息获取设备中多个算力元素的算力信息,所述监控配置信息包括监控元素标识,所述监控元素标识用于指示算力元素;依据所述算力信息对所述多个算力元素进行算力告警判决,生成算力告警本文档来自技高网...

【技术保护点】

1.一种算力监控方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述依据所述算力信息对所述多个算力元素进行算力告警判决,生成算力告警消息,包括:

3.根据权利要求2所述的方法,其特征在于,在依据所述算力信息获取每一目标算力元素的使用率之前,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述预设阈值包括使用率上限和使用率下限,所述根据每一目标算力元素的使用率与预设阈值的大小关系,生成所述算力告警消息,包括:

5.根据权利要求1所述的方法,其特征在于,所述依据所述算力信息构建算力日志,保存所述算力日志,包括:<...

【技术特征摘要】

1.一种算力监控方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述依据所述算力信息对所述多个算力元素进行算力告警判决,生成算力告警消息,包括:

3.根据权利要求2所述的方法,其特征在于,在依据所述算力信息获取每一目标算力元素的使用率之前,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述预设阈值包括使用率上限和使用率下限,所述根据每一目标算力元素的使用率与预设阈值的大小关系,生成所述算力告警消息,包括:

5.根据权利要求1所述的方法,其特征在于,所述依据所述算力信息构建算力日志,保存所述算力日志,包括:

6.根据权利要求1所述的方法,其特...

【专利技术属性】
技术研发人员:郝林伟
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1