一种容错计算方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39248516 阅读:24 留言:0更新日期:2023-10-30 12:00
本发明专利技术涉及通信技术领域,公开了一种容错计算方法、装置、计算机设备及存储介质,其中容错计算方法包括:根据计算任务执行主进程;当主进程执行至预设操作步骤获取到第一条件指令时,获取主进程的计算路径;根据计算路径生成第一子计算路径和第二子计算路径;获取容错计算系统中计算模块的负载信息;根据负载信息将第一子计算路径和第二子计算路径分别分配至与其匹配的计算模块上执行副进程。由此副进程中与第一子计算路径和第二子计算路径相对应的分段计算任务可以在容错计算系统的不同部分并行进行,不仅可以使副进程的计算尽量不影响系统的性能,而且系统中计算资源的利用更加合理,任务的调度更加精细。任务的调度更加精细。任务的调度更加精细。

【技术实现步骤摘要】
一种容错计算方法、装置、计算机设备及存储介质


[0001]本专利技术涉及通信
,具体涉及一种容错计算方法、装置、计算机设备及存储介质。

技术介绍

[0002]容错计算是在系统存在故障的情况下,仍能正确地执行给定的算法。为了实现这一点,系统需要具有故障检测与诊断、功能切换与系统重组(reconfiguration)、系统恢复与重新运行、系统的重构(reintegration)与可扩展等功能,而且这些功能不能影响系统的正常运行或至少不能使系统的性能下降到不能容忍的程度。
[0003]硬件容错常用的方法包括多备份技术、增加内存、能源系统冗余等。硬件错误通常能够在两个物理机上进行隔离处理。软件容错主要是对软件的鲁棒性特征进行增强。容错计算是服务器可靠性计算的一种技术,其一种较为通用的计算方式是“配置两套资源算两遍”,通过冗余主进程计算任务和冗余计算资源的设计,实现了完全相同的两个主进程计算任务,但是会对系统的性能产生影响。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种容错计算方法、装置、计算机设备及存储介质,以本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种容错计算方法,其特征在于,应用于容错计算系统,所述方法包括:获取计算任务,根据所述计算任务执行主进程;当所述主进程执行至预设操作步骤获取到第一条件指令时,获取所述主进程的计算路径;根据所述计算路径生成第一子计算路径和第二子计算路径;获取所述容错计算系统中计算模块的负载信息;根据所述负载信息将所述第一子计算路径和所述第二子计算路径分别分配至与其匹配的计算模块上执行副进程。2.根据权利要求1所述的方法,其特征在于,所述根据所述计算路径生成第一子计算路径和第二子计算路径包括:在所述操作步骤处将所述计算路径进行拆分得到所述第一子计算路径和所述第二子计算路径,其中所述第一子计算路径为所述计算路径中所述预设操作步骤及所述预设操作步骤之前的部分,所述第二子计算路径为所述计算路径中所述预设操作步骤及所述预设操作步骤之后的部分。3.根据权利要求1所述的方法,其特征在于,根据所述计算任务执行主进程包括:获取所述容错计算系统中的计算模块,以及每一个计算模块的负载信息;基于所述计算任务、所述容错计算系统中的计算模块,以及每一个计算模块的负载信息执行所述主进程。4.根据权利要求3所述的方法,其特征在于,在所述获取所述容错计算系统中的计算模块,以及每一个计算模块的负载信息之后,还包括:基于所述计算模块,以及每一个所述计算模块的负载信息生成资源查询表,并周期性的更新所述资源查询表。5.根据权利要求1~4任一项所述的方法,其特征在于,在根据每一个计算模块的负载信息将所述第一子计算路径和所述第二子计算路径分别分配至与其匹配的计算模块上执行副进程之后,还包括:继续获取所述容错计算系统中每一个计算模块的负载信息;根据继续获取到的每一个计算模块的负载信息确定是否存在空闲的计算模块;当存在空闲的计算模块时,获取与第三条件指令相对应的备用计算路径,并利用所述空闲的计算模块根据所述备用计算路径进行计算,其中所述第一条件...

【专利技术属性】
技术研发人员:林宁亚王贤坤孔令军庞兆春邹晓峰
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1