智能计算中心的算力运行任务故障防御方法及装置制造方法及图纸

技术编号:46036101 阅读:13 留言:0更新日期:2025-08-05 19:40
本发明专利技术提供一种智能计算中心的算力运行任务故障防御方法及装置,其中方法包括:步骤S1:在多个工作线程并行运行数据恢复任务之前,得到待创建region集合;步骤S2:每隔一预设的等待时间,查询待创建region是否创建完成,得到查询结果;步骤S3:若查询结果指示存在待创建region未创建完成,返回步骤S2直至查询结果指示全部的待创建region均创建完成;步骤S4:若查询结果指示全部的待创建region均创建完成,控制多个工作线程调用智能计算中心的算力资源并行运行数据恢复任务。本发明专利技术能够避免存在待创建region未创建完成的情况下运行数据恢复任务带来的系统故障风险,实现算力运行任务故障防御。

【技术实现步骤摘要】

本专利技术涉及智能计算中心、智算中心及算力基础设施,尤其涉及一种智能计算中心的算力运行任务故障防御方法及装置


技术介绍

1、随着人工智能技术的快速发展,“智能计算中心”和“智算中心”应运而生。

2、“智能计算中心”是指通过使用大规模异构算力资源,包括通用算力和智能算力,主要为人工智能应用(如人工智能深度学习模型开发、模型训练和模型推理等场景)提供所需算力、数据和算法的设施。智能计算中心涵盖设施、硬件、软件,并可提供从底层算力到顶层应用使能的全栈能力。

3、“智能计算中心”包括但不限于“智算中心”。

4、“智算中心”即人工智能计算中心,是基于人工智能理论,采用人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的一类算力基础设施。

5、“算力”是“智能计算中心”和“智算中心”的核心,是计算机设备或计算/数据中心处理信息的能力,是计算机硬件和软件配合共同执行某种计算需求的能力,是通过对信息数据进行处理,实现目标结果输出的计算能力,是集信息计算力、网络运载力、数据存储力于一体的新型生产力,主要通过算本文档来自技高网...

【技术保护点】

1.一种智能计算中心的算力运行任务故障防御方法,其特征在于,包括:

2.根据权利要求1所述的智能计算中心的算力运行任务故障防御方法,其特征在于,

3.根据权利要求1所述的智能计算中心的算力运行任务故障防御方法,其特征在于,

4.根据权利要求1所述的智能计算中心的算力运行任务故障防御方法,其特征在于,所述多个工作线程由主线程创建得到;

5.根据权利要求4所述的智能计算中心的算力运行任务故障防御方法,其特征在于,

6.一种智能计算中心的算力运行任务故障防御装置,其特征在于,包括:

7.根据权利要求6所述的智能计算中心的算...

【技术特征摘要】

1.一种智能计算中心的算力运行任务故障防御方法,其特征在于,包括:

2.根据权利要求1所述的智能计算中心的算力运行任务故障防御方法,其特征在于,

3.根据权利要求1所述的智能计算中心的算力运行任务故障防御方法,其特征在于,

4.根据权利要求1所述的智能计算中心的算力运行任务故障防御方法,其特征在于,所述多个工作线程由主线程创建得到;

5.根据权利要求4所述的智能计算中心的算力运行任务故障防御方法,其特征在于,

6.一种智能计算中心的算力运行任务故障防御装置,其特征在于,包括:

7.根据权利要求6所述的智能计算中心的算力运行任务故障防御装置...

【专利技术属性】
技术研发人员:于海军
申请(专利权)人:北京九章云极科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1