恢复任务的处理方法、装置及电子设备制造方法及图纸

技术编号:32431949 阅读:32 留言:0更新日期:2022-02-24 18:47
本发明专利技术提供了一种恢复任务的处理方法、装置及电子设备,涉及数据处理技术领域,获取数据服务器中恢复任务执行线程的线程状态,以及该数据服务器的剩余容量;根据该线程状态和该剩余容量,确定数据服务器的恢复系数;根据数据服务器的恢复系数向数据服务器分配恢复任务。本发明专利技术实施例通过在数据服务器上为每个恢复任务设置对应的恢复任务执行线程,管理服务器根据各台数据服务器中恢复任务执行线程的线程状态和剩余容量,对各台数据服务器的恢复能力进行评估,进而根据各台数据服务器的实际恢复能力灵活分配相应数量的恢复任务,可以更加充分地利用集群整体的恢复能力,提高集群服务的可靠性。务的可靠性。务的可靠性。

【技术实现步骤摘要】
恢复任务的处理方法、装置及电子设备


[0001]本专利技术涉及数据处理
,尤其是涉及一种恢复任务的处理方法、装置及电子设备。

技术介绍

[0002]在公有云场景下,集群的规模是逐渐增长的,随着集群运行时间变长,集群内可能存在着多种不同的机型,不同机型所能够承接的恢复能力也有所区别。
[0003]目前,现有分布式对象存储集群的恢复能力配置方案是对集群内的所有机器配置固定的恢复能力,但是,固定的恢复能力并不能够满足公有云多变的场景需求。因为,如果固定配置的恢复能力过大,则会造成对部分机器的压力,影响这部分机器的正常服务;而如果固定配置的恢复能力过小,又无法充分利用集群的恢复能力,从而降低集群的可靠性。
[0004]整体而言,现有分布式对象存储集群的恢复能力配置方式无法满足公有云多变场景下对机器恢复能力的不同需求,也无法充分利用集群整体的恢复能力,降低了集群服务的可靠性。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种恢复任务的处理方法、装置及电子设备,可以满足公有云多变场景下对集群内机器恢复能本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种恢复任务的处理方法,其特征在于,应用于存储集群的管理服务器,所述管理服务器与所述存储集群中的数据服务器通信连接,所述方法包括:获取所述数据服务器中恢复任务执行线程的线程状态,以及所述数据服务器的剩余容量;其中,所述数据服务器上运行有预设第一数量的恢复任务执行线程;当所述恢复任务执行线程的线程状态为激活时,该恢复任务执行线程用于处理恢复任务;根据所述线程状态和所述剩余容量,确定所述数据服务器的恢复系数;根据所述数据服务器的恢复系数向所述数据服务器分配恢复任务。2.根据权利要求1所述的恢复任务的处理方法,其特征在于,所述线程状态包括激活或休眠;所述根据所述线程状态和所述剩余容量,确定所述数据服务器的恢复系数,包括:根据每个所述恢复任务执行线程的线程状态,将正在执行恢复任务的恢复任务执行线程的数量确定为第二数量,并且,将线程状态为激活但处于空闲的恢复任务执行线程的数量确定为第三数量;基于所述第二数量、所述第三数量和所述剩余容量,确定所述数据服务器的权重值,根据所述权重值确定所述数据服务器的恢复系数。3.根据权利要求1所述的恢复任务的处理方法,其特征在于,所述根据所述数据服务器的恢复系数向所述数据服务器分配恢复任务的步骤,包括:根据所述数据服务器的恢复系数,通过预设的选取算法从所述存储集群中选取目标数据服务器;向所述目标数据服务器发送恢复任务。4.根据权利要求3所述的恢复任务的处理方法,其特征在于,所述方法还包括:监测所述目标数据服务器上恢复任务的执行情况;如果监测到任一个恢复任务出现异常,停止向所述目标数据服务器分配恢复任务,直至所述目标数据服务器上已经分配的恢复任务均处理完毕;向所述目标数据服务器发送一个恢复任务,判断该恢复任务的执行情况是否正常;如果是,重新向所述目标数据服务器分配恢复任务。5.根据权利要求4所述的恢复任务的处理方法,其特征在于,当监测到以下情况之一时,确定所述恢复任务出现异常:所述目标数据服务器宕机、所述恢复任务对应的恢复任务执行线程终止、所述目标数据服务器与所述管理服务器的通信异常、所述目标数据服务器上存在网络消息堆积。6.根据权利要求1所述的恢复任务的处理方法,其特征在于,所述获取所述数据服务器中恢复任务执行线程的线程状态,以及所述数据服务器的剩余容量,包括:接收所述数据服务器发送的心跳信号;其中,所述数据服务器上运行有心跳服务,所述数据服务器通过所述心跳服务向所述管理服务器发送心跳信号;根据所述心跳信号,获取所述数据服务器中恢复任务执行线程的线程状态,以及所述数据服务器的剩余容量。7.根据权利要求1所述的恢复任务的处理方法,其特征在于,所述第一数量是根据所述数据服务器的网卡带宽、磁盘IO压力和/或CPU承载力确定的。
8.一种恢复任务的处理方法,其特征在于,应用于存储集群的数据服务器,所述数据服务器与所述存储集群中的管理服务器通信连接,所述方法包括:将所述数据服务器中恢复任务执行线程的线程状态、以及所述数据服务器的剩余容量发送给所述管理服务器,以根据所述线程状态和所述剩余容量,确定所述数据服务器的恢复系数;其中,在所述数据服务器上运行有预设第一数量的恢复任务执行线程,当所述恢复任务执行线程的线程状态为激活时,该恢复任务执行线程用于处理恢复任务;接收所述管理服务器分配的恢复任务,其中,所述管理服务器根据所述数据服务器的恢复系数进行恢复任务的分配;处理分配到的恢复任务。9.根据权利要求8所述的恢复任务的处理方法,其特征在于,所述将所述数据服务器中恢复任务执行线程的线程状态...

【专利技术属性】
技术研发人员:张强
申请(专利权)人:北京金山云网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1