计算任务的恢复方法、装置、用户设备及存储介质制造方法及图纸

技术编号:29156099 阅读:17 留言:0更新日期:2021-07-06 22:55
本发明专利技术提供一种计算任务的恢复方法、装置及用户设备、存储介质。所述方法包括:当系统的任务待中断时,暂停系统正在进行的所述任务,将所述任务的运行上下文信息保存到转储文件;当所述任务待恢复时,从所述转储文件中解析所述任务的运行上下文信息,根据所述运行上下文信息,恢复所述任务;对恢复后的所述任务继续计算。本发明专利技术能够实现对计算任务的迁移,保存现有的计算任务进度。

【技术实现步骤摘要】
计算任务的恢复方法、装置、用户设备及存储介质
本专利技术涉及超级计算
,尤其涉及一种计算任务的恢复方法、装置、用户设备及存储介质。
技术介绍
任务的迁移分为离线迁移(OfflineMigration)和在线迁移(LiveMigration)。离线迁移是指在迁移过程中,服务节点需要停机或者被挂起不再对外提供服务。在线迁移是指在迁移过程中,服务节点对外持续可用。在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下技术问题:当前的迁移方案均无针对计算任务进行迁移的技术。当任务的计算量很大的时候,往往计算引擎需要执行较长的时间。在这个过程中,如果发生计划性下电、计算机硬件维护更换、计算任务迁移等操作的时候,无法保存现有的计算任务进度,前期的计算进度被丢弃掉了,任务中断后必须重头开始计算。
技术实现思路
本专利技术提供的计算任务的恢复方法、装置、用户设备及存储介质,能够实现计算任务被中断时,对已经进行的计算任务的进度的恢复。第一方面,本专利技术提供一种计算任务的恢复方法,包括:当系统的任务待中断时,暂停系统正在进行的任务,将所述任务的运行上下文信息保存到转储文件;当所述任务待恢复时,从所述转储文件中解析所述任务的运行上下文信息,根据所述运行上下文信息,恢复所述任务;对恢复后的所述任务继续计算。可选的,所述将所述任务的运行上下文信息保存到转储文件的步骤包括:暂停所述系统中运行在用户设备上的用户态计算进程的操作;将所述系统中的计算引擎上的任务暂停,把暂停的所述任务的运行上下文信息保存到所述系统的内存的队列内存区中;将所述系统中用户态进程状态信息保存到所述转储文件;将所述系统中驱动态进程状态信息保存到所述转储文件中;以进程为单位,将暂停的驱动态进程下的队列的信息保存到所述转储文件中。可选的,所述驱动态进程状态信息包括:具有对应关系的进程ID、进程的控制信息、进程页表信息、进程分配的内存块信息和进程事件信息;所述进程分配的内存块信息包括:进程的用户数据;所述进程的控制信息包括:进程地址空间ID;所述将所述系统中驱动态进程状态信息保存到所述转储文件中的步骤具体为:以对应关系保存进程ID、进程的控制信息、进程页表信息、进程分配的内存块信息和进程事件信息。可选的,所述队列的信息包括:队列ID、队列分配的环形缓冲区、队列读写指针和队列内存区信息;所述队列内存区信息包括:计算上下文切换缓冲区、控制栈缓冲区和内存队列描述符;所述队列读写指针包括:门铃寄存器的值;所述以进程为单位,将暂停的驱动态进程下的队列的信息保存到所述转储文件中的步骤具体为:以对应关系保存队列ID、队列分配的环形缓冲区、队列读写指针和队列内存区信息。可选的,所述根据所述运行上下文信息,恢复所述任务的步骤具体包括:从所述转储文件解析出所述用户态进程状态信息,根据所述用户态进程状态信息,恢复所述用户态进程;从所述转储文件中解析出驱动态进程状态信息,根据所述驱动态进程状态,恢复所述驱动态进程;从所述转储文件中解析出恢复的进程信息中的队列信息,根据所述队列信息,恢复所述队列;从所述内存的队列内存区中,提取暂停的任务的运行上下文信息;根据所述任务的运行上下文信息,恢复所述队列的任务,载入所述任务到计算引擎;发送运行信号,使得所述计算引擎和所述用户态进程同时进入运行状态。可选的,所述从所述转储文件中解析出驱动态进程状态信息,根据所述驱动态进程状态,恢复所述驱动态进程的步骤包括:根据保存的进程ID、进程控制信息、进程页表信息、进程分配的内存块和进程事件信息之间的对应关系,为所述驱动态进程分配内存块,将所述进程的用户数据复制到所述内存块,恢复所述进程页表;将进程地址空间ID、进程页表配置到计算引擎的寄存器中。可选的,所述从所述转储文件中解析出恢复的进程信息中的队列信息,根据所述队列信息,恢复所述队列的步骤包括:根据保存的队列ID、队列分配的环形缓冲区、队列读写指针、队列内存区信息之间的对应关系,恢复队列数据,将内存队列描述符配置到对应的硬件队列寄存器,将环形缓冲区、计算上下文切换缓冲区、控制栈缓冲区、队列读写指针和门铃寄存器值均配置到对应的硬件队列寄存器。第二方面,本专利技术提供一种计算任务的恢复装置,包括:保存单元,用于当系统的任务待中断时,暂停系统正在进行的任务,将所述任务的运行上下文信息保存到转储文件;解析单元,用于当所述任务待恢复时,从所述转储文件中解析所述任务的运行上下文信息,根据所述运行上下文信息,恢复所述任务;计算单元,用于对恢复后的所述任务继续计算。可选的,所述保存单元包括:第一暂停子单元,用于暂停所述系统中运行在用户设备上的用户态计算进程的操作;第二暂停子单元,用于将所述系统中的计算引擎上的任务暂停,把暂停的所述任务的运行上下文信息保存到所述系统的内存的队列内存区中;第一保存子单元,用于将所述系统中用户态进程状态信息保存到所述转储文件;第二保存子单元,用于将所述系统中驱动态进程状态信息保存到所述转储文件中;第三保存子单元,用于以进程为单位,将暂停的驱动态进程下的队列的信息保存到所述转储文件中。可选的,所述驱动态进程状态信息包括:具有对应关系的进程ID、进程的控制信息、进程页表信息、进程分配的内存块信息和进程事件信息;所述进程分配的内存块信息包括:进程的用户数据;所述进程的控制信息包括:进程地址空间ID;相应的,所述第二保存子单元具体为:以对应关系保存进程ID、进程的控制信息、进程页表信息、进程分配的内存块信息和进程事件信息。可选的,所述队列的信息包括:队列ID、队列分配的环形缓冲区、队列读写指针和队列内存区信息;所述队列内存区信息包括:计算上下文切换缓冲区、控制栈缓冲区和内存队列描述符;所述队列读写指针包括:门铃寄存器的值;相应的,所述第三保存子单元具体为:以对应关系保存队列ID、队列分配的环形缓冲区、队列读写指针、队列内存区信息。可选的,所示解析单元具体包括:第一恢复子单元,用于从所述转储文件解析出所述用户态进程状态信息,根据所述用户态进程状态信息,恢复所述用户态进程;第二恢复子单元,用于从所述转储文件中解析出驱动态进程状态信息,根据所述驱动态进程状态,恢复所述驱动态进程;第三恢复子单元,用于从所述转储文件中解析出恢复的进程信息中的队列信息,根据所述队列信息,恢复所述队列;第四恢复子单元,用于从所述内存的队列内存区中,提取暂停的任务的运行上下文信息;根据所述任务的运行上下文信息,恢复所述队列的任务,载入所述任务到计算引擎;发送子单元,用于发送运行信号,使得所述计算引擎和所述用户态进程同时进入运行状态。可选的,所述第二恢复子单元具体为:根据保存的进程ID、进程控制信息、进程页表信息、进程分配的内本文档来自技高网...

【技术保护点】
1.一种计算任务的恢复方法,其特征在于,包括:/n当系统的任务待中断时,暂停系统正在进行的任务,将所述任务的运行上下文信息保存到转储文件;/n当所述任务待恢复时,从所述转储文件中解析所述任务的运行上下文信息,根据所述运行上下文信息,恢复所述任务;/n对恢复后的所述任务继续计算。/n

【技术特征摘要】
1.一种计算任务的恢复方法,其特征在于,包括:
当系统的任务待中断时,暂停系统正在进行的任务,将所述任务的运行上下文信息保存到转储文件;
当所述任务待恢复时,从所述转储文件中解析所述任务的运行上下文信息,根据所述运行上下文信息,恢复所述任务;
对恢复后的所述任务继续计算。


2.根据权利要求1所述的方法,其特征在于,所述将所述任务的运行上下文信息保存到转储文件的步骤包括:
暂停所述系统中运行在用户设备上的用户态计算进程的操作;
将所述系统中的计算引擎上的任务暂停,把暂停的所述任务的运行上下文信息保存到所述系统的内存的队列内存区中;
将所述系统中用户态进程状态信息保存到所述转储文件;
将所述系统中驱动态进程状态信息保存到所述转储文件中;
以进程为单位,将暂停的驱动态进程下的队列的信息保存到所述转储文件中。


3.根据权利要求2所述的方法,其特征在于,所述驱动态进程状态信息包括:具有对应关系的进程ID、进程的控制信息、进程页表信息、进程分配的内存块信息和进程事件信息;所述进程分配的内存块信息包括:进程的用户数据;所述进程的控制信息包括:进程地址空间ID;
所述将所述系统中驱动态进程状态信息保存到所述转储文件中的步骤具体为:
以对应关系保存进程ID、进程的控制信息、进程页表信息、进程分配的内存块信息和进程事件信息。


4.根据权利要求2所述的方法,其特征在于,所述队列的信息包括:队列ID、队列分配的环形缓冲区、队列读写指针和队列内存区信息;所述队列内存区信息包括:计算上下文切换缓冲区、控制栈缓冲区和内存队列描述符;所述队列读写指针包括:门铃寄存器的值;
所述以进程为单位,将暂停的驱动态进程下的队列的信息保存到所述转储文件中的步骤具体为:
以对应关系保存队列ID、队列分配的环形缓冲区、队列读写指针和队列内存区信息。


5.根据权利要求1所述的方法,其特征在于,所述根据所述运行上下文信息,恢复所述任务的步骤具体包括:
从所述转储文件解析出所述用户态进程状态信息,根据所述用户态进程状态信息,恢复所述用户态进程;
从所述转储文件中解析出驱动态进程状态信息,根据所述驱动态进程状态,恢复所述驱动态进程;

【专利技术属性】
技术研发人员:黄渠
申请(专利权)人:成都海光集成电路设计有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1