一种多控制器热插拔记录方法、装置及存储介质制造方法及图纸

技术编号:35581240 阅读:24 留言:0更新日期:2022-11-12 16:10
本发明专利技术涉及一种多控制器热插拔记录方法、装置及存储介质,实现在控制器发生热插拔时,对控制器的热插拔进行记录。本发明专利技术中多个控制器利用背板向其余控制器共享自身的热插拔状态,当目标控制器发生热插拔时,其余活跃的控制器对目标控制器的热插拔标识置位并触发数据管理平台事件修复策略;监测到目标控制器重新插接后,数据管理平台事件修复策略控制目标控制器获取其余活跃的控制器中保存的热插拔标识,并利用获取的热插拔标识的值分析目标控制器是否发生过热插拔动作;保存热插拔动作分析结果,并通过基板管理控制器将分析结果上报上层管理程序,触发管理平台修复策略使控制器取消目标控制器的热插拔标识置位后结束。取消目标控制器的热插拔标识置位后结束。取消目标控制器的热插拔标识置位后结束。

【技术实现步骤摘要】
一种多控制器热插拔记录方法、装置及存储介质


[0001]本专利技术涉及热插拔记录修复
,尤其涉及一种多控制器热插拔记录方法、装置及存储介质。

技术介绍

[0002]服务器中基板管理控制器作为板级硬件管理核心,往往承担着服务器硬件状态监控、故障记录等重要功能,基板管理控制器在运行过程中通常会提供服务器各个现场可更换单元的热插拔状态给服务器管理软件用于运维或者客服技术支持中的数据管理平台事件修复。
[0003]在存储服务器中多控制器冗余设计是较为普遍的设计,各个控制器配置独立的基板管理控制器,对各个控制器中现场可更换单元进行热插拔状态记录,各个控制器之间的关联属于互相冗余,提供数据灾备能力。但是,由于控制器本身的特殊性,热拔插某控制器整体后此控制器关联数据消失,控制器中的基板管理控制器无法做到对自身所在控制器的热插拔状态的监控记录。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本专利技术提供一种多控制器热插拔记录方法、装置及存储介质。
[0005]第一方面,本专利技术提供一种多控制器热插拔记录方法,包括:通过背板相互连接的多个控制器利用背板向其余控制器共享自身的热插拔状态,当目标控制器发生热插拔时,其余活跃的控制器对目标控制器的热插拔标识置位;活跃的控制器通知上层管理程序,触发上层管理程序的数据管理平台事件修复策略;
[0006]监测到目标控制器重新插接后,数据管理平台事件修复策略控制目标控制器访问其余活跃的控制器中保存的热插拔标识,并利用获取的热插拔标识的值分析目标控制器是否发生过热插拔动作;保存热插拔动作分析结果,并通过基板管理控制器将分析结果上报上层管理程序,触发管理平台修复策略使控制器取消目标控制器的热插拔标识置位后结束。
[0007]更进一步地,通过背板相互连接的多个控制器利用背板向其余控制器共享自身的在位状态;活跃的控制器检测到目标控制器在位状态由在位转变为不在位时,判断目标控制器发生热插拔;目标控制器的在位状态由不在位转变为在位时,数据管理平台事件修复策略控制目标控制器访问其余活跃的控制器中保存的热插拔标识。
[0008]更进一步地,对各个控制器的所述在位状态进行编码,使得控制器具有唯一的在位状态编码;目标控制器发生热插拔时,通过在位状态编码的变化判断目标控制器的身份。
[0009]更进一步地,活跃的控制器将目标控制器的热插拔事件通知上层管理程序时,上层管理程序记录相应的发出通知的活跃的控制器于控制器列表,数据管理平台事件修复策略控制目标控制器遍历访问控制器列表中活跃的控制器中保存的热插拔标识。
[0010]更进一步地,利用获取的热插拔标识的值分析目标控制器是否发生过热插拔动作包括:分析获取的热插拔标识的值是否一致,若热插拔标识的值不一致,则统计热插拔标识值的数量,以多数热插拔标识值所代表的结果作为分析结果;若热插拔标识的值一致,则以热插拔标识值所代表的结果作为分析结果。
[0011]更进一步地,重启控制器从其余活跃的控制器获取各个控制器的热插拔标识,按控制器分析获取的热插拔标识的值是否一致,若热插拔标识的值不一致,则统计热插拔标识值的数量,以多数热插拔标识值所代表的结果作为相应控制器的热插拔标识值进行同步;若热插拔标识的值一致,则以热插拔标识值作为相应控制器的热插拔标识值进行同步。
[0012]更进一步地,数据管理平台事件修复策略监测到目标控制器重新插接后进行计时,若计时时间超过设定的时间阈值后仍未收到基板管理控制器反馈的分析结果触发数据管理平台事件修复策略结束,则提示超时,记录超时日志并取消热插拔标识置位。
[0013]第二方面,本专利技术提供一种多控制器热插拔记录装置,包括:经背板连接的若干控制器,通过背板相互连接的多个控制器利用背板向其余控制器共享自身的热插拔状态,当目标控制器发生热插拔时,其余活跃的控制器对目标控制器的热插拔标识置位;活跃的控制器通知上层管理程序,触发上层管理程序的数据管理平台事件修复策略;监测到目标控制器重新插接后,数据管理平台事件修复策略控制目标控制器访问其余活跃的控制器中保存的热插拔标识,并利用获取的热插拔标识的值分析目标控制器是否发生过热插拔动作;将热插拔动作分析结果保存在目标控制器的处理单元的数据区,并通过基板管理控制器将分析结果上报上层管理程序,触发管理平台修复策略使控制器取消目标控制器的热插拔标识置位后结束。
[0014]更进一步地,所述控制器包括:CPU、PCH南桥、基板管理控制器和处理单元,同一控制器上的基板管理控制器和处理单元连接,不同控制器上的处理单元通过背板上的总线互联,所述处理单元用于存储热插拔标识的状态寄存器,所述状态寄存器的位数不低于控制器的数量,状态寄存器的不同存储位对应不同的控制器用于记录不同控制器的热插拔标识,处理单元实现控制器的在位状态感知、与其余处理单元通信获取热插拔标识的值,并利用获取的热插拔标识的值分析目标控制器是否发生过热插拔动作;将热插拔动作分析结果保存在目标控制器的处理单元的数据区,并通过基板管理控制器将分析结果上报上层管理程序。
[0015]第三方面,本专利技术提供一种实现多控制器热插拔记录方法的存储介质,所述存储介质存储计算机程序,所述计算机程序被处理器执行时实现所述的多控制器热插拔记录方法。
[0016]本专利技术实施例提供的上述技术方案与现有技术相比具有如下优点:
[0017]本专利技术中多个控制器利用背板向其余控制器共享自身的热插拔状态,当目标控制器发生热插拔时,其余活跃的控制器对目标控制器的热插拔标识置位并触发数据管理平台事件修复策略;监测到目标控制器重新插接后,数据管理平台事件修复策略控制目标控制器获取其余活跃的控制器中保存的热插拔标识,并利用获取的热插拔标识的值分析目标控制器是否发生过热插拔动作;保存热插拔动作分析结果,并通过基板管理控制器将分析结果上报上层管理程序,触发管理平台修复策略使控制器取消目标控制器的热插拔标识置位后结束。实现在多控制器的结构下控制器自身热拔插动作记录的功能。设计采用分布式的
热插拔动作记录,通过多个控制器对发生热插拔控制器的热插拔进行监测,能避免漏记的问题,而且分析时采用多数控制器的热插拔标识为准,能避免热插拔发生和记录之间的异常控制器漏记造成热插拔分析不准的问题;通过超时控制避免无法实现热插拔记录的事件使数据管理平台事件修复策略卡死。
附图说明
[0018]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0019]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本专利技术实施例提供的一种多控制器热插拔记录方法的流程图;
[0021]图2为本专利技术实施例提供的监测到目标控制器重新插接后,数据管本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多控制器热插拔记录方法,其特征在于,包括:通过背板相互连接的多个控制器利用背板向其余控制器共享自身的热插拔状态,当目标控制器发生热插拔时,其余活跃的控制器对目标控制器的热插拔标识置位;活跃的控制器通知上层管理程序,触发上层管理程序的数据管理平台事件修复策略;监测到目标控制器重新插接后,数据管理平台事件修复策略控制目标控制器访问其余活跃的控制器中保存的热插拔标识,并利用获取的热插拔标识的值分析目标控制器是否发生过热插拔动作;保存热插拔动作分析结果,并通过基板管理控制器将分析结果上报上层管理程序,触发管理平台修复策略使控制器取消目标控制器的热插拔标识置位后结束。2.根据权利要求1所述的多控制器热插拔记录方法,其特征在于,通过背板相互连接的多个控制器利用背板向其余控制器共享自身的在位状态;活跃的控制器检测到目标控制器在位状态由在位转变为不在位时,判断目标控制器发生热插拔;目标控制器的在位状态由不在位转变为在位时,数据管理平台事件修复策略控制目标控制器访问其余活跃的控制器中保存的热插拔标识。3.根据权利要求2所述的多控制器热插拔记录方法,其特征在于,对各个控制器的所述在位状态进行编码,使得控制器具有唯一的在位状态编码;目标控制器发生热插拔时,通过在位状态编码的变化判断目标控制器的身份。4.根据权利要求1所述的多控制器热插拔记录方法,其特征在于,活跃的控制器将目标控制器的热插拔事件通知上层管理程序时,上层管理程序记录相应的发出通知的活跃的控制器于控制器列表,数据管理平台事件修复策略控制目标控制器遍历访问控制器列表中活跃的控制器中保存的热插拔标识。5.根据权利要求1所述的多控制器热插拔记录方法,其特征在于,利用获取的热插拔标识的值分析目标控制器是否发生过热插拔动作包括:分析获取的控制器的热插拔标识的值是否一致,若热插拔标识的值不一致,则统计热插拔标识值的数量,以多数热插拔标识值所代表的结果作为分析结果;若热插拔标识的值一致,则以热插拔标识值所代表的结果作为分析结果。6.根据权利要求1所述的多控制器热插拔记录方法,其特征在于,控制器重启后,重启控制器从其余活跃的控制器获取各个控制器的热插拔标识,按控制器分析获取的热插拔标识的值是否一致,若热插拔标识的值不一致,则...

【专利技术属性】
技术研发人员:张亚男
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1