【技术实现步骤摘要】
本专利技术涉及计算机 ,尤其涉及一种算力监控方法、装置、设备及存储介质。
技术介绍
1、随着人工智能、大模型等技术快速发展,人们对服务器的算力需求也开始飞跃式的提升,算力正呈爆发式增长态势。算力作为数据经济时代的核心生产力,其的重要性日益凸显。
2、作为算力基础设施的服务器要求高效运转,而在实际应用中,对服务器的cpu(中央处理器)使用率、gpu(图形处理器)使用率等算力状态未做实时统计,无法实时监控服务器算力,无法支撑高效的算力调度,造成了资源的极大浪费。
技术实现思路
1、
2、本专利技术提供一种算力监控方法、装置、设备及存储介质,用以解决现有技术中无法实时监控服务器算力的缺陷,实现多算力平台的监控,并且使得算力平台的算力状态变动有据可查。
3、本专利技术提供一种算力监控方法,包括如下步骤:依据监控配置信息获取设备中多个算力元素的算力信息,所述监控配置信息包括监控元素标识,所述监控元素标识用于指示算力元素;依据所述算力信息对所述多个算力元素进行算力告
...【技术保护点】
1.一种算力监控方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述依据所述算力信息对所述多个算力元素进行算力告警判决,生成算力告警消息,包括:
3.根据权利要求2所述的方法,其特征在于,在依据所述算力信息获取每一目标算力元素的使用率之前,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,所述预设阈值包括使用率上限和使用率下限,所述根据每一目标算力元素的使用率与预设阈值的大小关系,生成所述算力告警消息,包括:
5.根据权利要求1所述的方法,其特征在于,所述依据所述算力信息构建算力日志,保存所
...【技术特征摘要】
1.一种算力监控方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述依据所述算力信息对所述多个算力元素进行算力告警判决,生成算力告警消息,包括:
3.根据权利要求2所述的方法,其特征在于,在依据所述算力信息获取每一目标算力元素的使用率之前,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,所述预设阈值包括使用率上限和使用率下限,所述根据每一目标算力元素的使用率与预设阈值的大小关系,生成所述算力告警消息,包括:
5.根据权利要求1所述的方法,其特征在于,所述依据所述算力信息构建算力日志,保存所述算力日志,包括:
6.根据权利要求1所述的方法,其特...
【专利技术属性】
技术研发人员:郝林伟,
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。