一种存储系统单节点故障快速恢复IO的方法及装置制造方法及图纸

技术编号:26375675 阅读:18 留言:0更新日期:2020-11-19 23:44
本发明专利技术公开了一种存储系统单节点故障快速恢复IO的方法及装置,采用业务代表模式设计,由一个中间业务代表来连接客户端和业务端,减少客户端和业务端的通信复杂度,业务实现向外统一暴露接口,由业务代表来具体查询和掉用业务接口执行相关业务,而客户则只需要向业务代表调用相关简化后的接口即可实现响应业务。同时减少通信和对表示层代码中的业务层代码的远程查询功能,减少通信时间以及各模块交叉触发中断和恢复造成的时间差,保证最短I/O中断时间。通过上述方式,本发明专利技术能够减少通信时间以及各模块交叉触发中断和恢复造成的时间差,保证中断时间最优。

【技术实现步骤摘要】
一种存储系统单节点故障快速恢复IO的方法及装置
本专利技术涉及存储
,特别是涉及一种存储系统单节点故障快速恢复IO的方法及装置。
技术介绍
现有节点故障恢复事件处理IO中断的方式主要采用观察者模式,但是观察者模式存在以下问题,存储系统集群作为被观察者,转发层、缓存、卷、RAID等子模块作为观察者:1、被观察者对象有很多的直接和间接观察者,将所有的观察者都通知到会花费很多时间。2、观察者和观察目标之间有循环依赖,观察目标会触发它们之间进行循环调用,可能导致系统崩溃。3、观察者模式没有相应的机制让观察者知道所观察的目标对象是怎么发生变化的,而仅仅只是知道观察目标发生了变化。4.观察者通知被观察者也会花费较多时间,并且被观察者需要检查是否所有的观察者已经恢复,才能通知主机恢复I/O。
技术实现思路
本专利技术主要解决的技术问题是提供一种存储系统单节点故障快速恢复IO的方法及装置,能够减少通信时间以及各模块交叉触发中断和恢复造成的时间差,保证中断时间最优。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种存储系统单节点故障快速恢复IO的方法,包括:第一步,由业务代表查询和调用业务接口执行业务,存储业务子模块向业务代表调用接口实现响应业务,所述业务代表连接存储业务子模块和集群事件管理模块,业务代表向外统一暴露接口;第二步,业务代表管理集群事件序列化,控制事件的统一发布和响应处理。进一步,所述第一步具体包括以下步骤:S100、将需要处理的事件传输到业务代表的缓存中,所述缓存为创建于集群主机端与业务代表端进行数据通信的缓存;S101、设置业务代表属性类以及状态机;S102、控制启动状态机业务代表算法;S103、等待集群单节点加入离开事件的发生,从业务代表的缓存中,将接收的事件读取到业务代表状态机,完成事件发布状态更新以及通知主机I/O的下发。进一步,所述步骤S100中的缓存存放于集群配置管理中。进一步,所述步骤S101中的状态机用于控制发布事件给子模块,以及响应各模块处理结果。进一步,所述第二步具体包括以下步骤:S200、节点离开时,集群生成Pend,发送到业务代表端,I/O栈业务子模块存活节点保持I/O,并在业务端处理因节点离开所需的事务处理;S201、集群BOSS节点切换、重构视图后生成Remove事件,发送到业务代表端,业务代表判断各业务个子模块业务处理是否完成;S202、业务代表监听I/O所有业务子模块处理完成,统一下发Remove事件到各业务配置管理模块,触发I/O开始中断;S203、IO中断后,所有子模块一起进行首选节点切换,元数据更新同步操作,完成后通知业务代表;S204、业务代表收到所有子模块配置更新完成后通知主机,立即恢复I/O;S205、节点加入时,集群生成Add/Unpend/UnpendDone事件;S205、业务代表收到集群事件放到缓存中,Add触发状态机通知各子模块业务层进行Nodes属性更新等操作,同时存活节点保持I/O;S207、更新完成后,通知业务代表,等待节点加入后集群Unpend事件的触发,业务代表触发子业务模块进行Discard操作,存活节点不做操作,继续保持I/O;S208、集群完成视图重建操作发送UnpendDone事件到业务代表;S209、业务代表收到所有子模块配置更新完成后通知主机,立即恢复I/O。进一步,所述步骤S205中Add/Unpend/UnpendDone事件为节点加入、解除、解除完成事件。进一步,所述步骤S208中各子模块已完成Discard操作,业务代表统一触发各子模块配置模块中断I/O,进行首选节点切换,元数据更新和同步。进一步,所述第二步之后减少通信或对表示层代码中的业务层代码的远程查询功能。一种存储系统单节点故障快速恢复IO的装置,包括业务代表模块、存储业务子模块和集群事件管理模块;所述业务代表模块查询和调用业务接口执行业务,存储业务子模块向业务代表调用接口实现响应业务;所述业务代表模块作为中间代表连接存储业务子模块和集群事件管理模块,业务代表模块向外统一暴露接口;所述业务代表模块管理集群事件序列化,控制事件的统一发布和响应处理。本专利技术的有益效果是:本专利技术由一个中间代表来连接存储业务子模块和集群事件管理,减少存储业务子模块和集群事件管理的通信复杂度,集群业务实现向外统一暴露接口,由业务代表来具体查询和调用业务接口执行相关业务,而客户则只需要向业务代表调用相关简化后的接口即可实现响应业务。减少通信或对表示层代码中的业务层代码的远程查询功能,减少通信时间以及各模块交叉触发中断和恢复造成的时间差,保证中断时间最优。附图说明图1是本专利技术一种存储系统单节点故障快速恢复IO的方法一较佳实施例的架构图。图2是本专利技术一种存储系统单节点故障快速恢复IO的装置的结构图。具体实施方式下面结合附图对本专利技术的较佳实施例进行详细阐述,以使本专利技术的优点和特征能更易于被本领域技术人员理解,从而对本专利技术的保护范围做出更为清楚明确的界定。第一方面,请参阅图1,本专利技术实施例提供一种存储系统单节点故障快速恢复IO的方法,包括:首先,采用业务代表模式设计,由一个中间代表来连接存储业务子模块和集群事件管理模块,减少业务子模块和集群事件管理模块的通信复杂度,业务代表实现向外统一暴露接口,由业务代表来具体查询和调用业务接口执行相关业务,而业务子模块则只需要向业务代表调用相关简化后的接口即可实现响应业务;然后,业务代表管理集群事件序列化,控制事件的统一发布和响应处理,减少因发布和响应事件造成各子模块交叉触发中断和恢复造成的时间差;最后,减少通信或对表示层代码中的业务层代码的远程查询功能,减少通信时间保证最低中断时间。快速恢复I/O程序实现时主要包括以下几个步骤:(1)创建集群主机端与业务代表端进行数据通信的缓存,该缓存存放集群配置管理中;(2)将需要处理的事件传输到业务代表的缓存中;(3)设置业务代表属性类以及状态机,用于控制发布事件给子模块,以及响应各模块处理结果;(4)控制启动状态机业务代表算法;(5)等待集群单节点加入/离开事件的发生,从业务代表的缓存中,将接收的事件读取到业务代表状态机,完成事件发布状态更新以及通知主机I/O的下发。采用业务代表模式控制优化IO快速恢复I/O程序主要包括以下步骤:(1)节点离开时,集群生成Pend,发送到业务代表端,I/O栈业务子模块存活节点保持I/O,并在业务端处理因节点离开所需的事务处理;(2)集群BOSS节点切换、重构视图后生成Remove事件,发送到业务代表端,业务代表判断各业务个子模块业务处理是否完成;(3)业务代表监听I/O所有业务子模块处理完成,统一下发Remove事件到各业务配置管理模块,触发I/O开始中断;(4)IO中断后,所本文档来自技高网...

【技术保护点】
1.一种存储系统单节点故障快速恢复IO的方法,其特征在于,包括:第一步,由业务代表查询和调用业务接口执行业务,存储业务子模块向业务代表调用接口实现响应业务,所述业务代表连接存储业务子模块和集群事件管理模块,业务代表向外统一暴露接口;第二步,业务代表管理集群事件序列化,控制事件的统一发布和响应处理。/n

【技术特征摘要】
1.一种存储系统单节点故障快速恢复IO的方法,其特征在于,包括:第一步,由业务代表查询和调用业务接口执行业务,存储业务子模块向业务代表调用接口实现响应业务,所述业务代表连接存储业务子模块和集群事件管理模块,业务代表向外统一暴露接口;第二步,业务代表管理集群事件序列化,控制事件的统一发布和响应处理。


2.根据权利要求1所述的一种存储系统单节点故障快速恢复IO的方法,其特征在于,所述第一步具体包括以下步骤:
S100、将需要处理的事件传输到业务代表的缓存中,所述缓存为创建于集群主机端与业务代表端进行数据通信的缓存;
S101、设置业务代表属性类以及状态机;
S102、控制启动状态机业务代表算法;
S103、等待集群单节点加入离开事件的发生,从业务代表的缓存中,将接收的事件读取到业务代表状态机,完成事件发布状态更新以及通知主机I/O的下发。


3.根据权利要求2所述的一种存储系统单节点故障快速恢复IO的方法,其特征在于,所述步骤S100中的缓存存放于集群配置管理中。


4.根据权利要求2所述的一种存储系统单节点故障快速恢复IO的方法,其特征在于,所述步骤S101中的状态机用于控制发布事件给子模块,以及响应各模块处理结果。


5.根据权利要求1所述的一种存储系统单节点故障快速恢复IO的方法,其特征在于,所述第二步具体包括以下步骤:
S200、节点离开时,集群生成Pend,发送到业务代表端,I/O栈业务子模块存活节点保持I/O,并在业务端处理因节点离开所需的事务处理;
S201、集群BOSS节点切换、重构视图后生成Remove事件,发送到业务代表端,业务代表判断各业务个子模块业务处理是否完成;
S202、业务代表监听I/O所有业务子模块处理完成,统一下发Remove事件到各业务配置管理模块,触发I/O开始中断;
S203、IO中断后,所有...

【专利技术属性】
技术研发人员:贺坤
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1