一种设备热添加方法、系统、设备以及介质技术方案

技术编号:30227067 阅读:27 留言:0更新日期:2021-09-29 09:53
本发明专利技术公开了一种设备热添加方法,包括以下步骤:响应于第一控制器接收到热插拔信号,生成第一上电信号以使能设备上电;延迟预设时间段后,利用所述第一控制器将所述热插拔信号转发给第二控制器;响应于所述第二控制器接收到所述热插拔信号,生成并向所述第一控制器发送第二上电信号;响应于所述第一控制器接收到所述第二上电信号,控制所述设备复位;读取所述设备信息并加载驱动以实现所述设备的热添加本发明专利技术还公开了一种系统、计算机设备以及可读存储介质。本发明专利技术提出的方案是延迟一段时间后再将热插拔信号发送给系统的第二控制器,这样可将设备实际上电时间与系统发送上电时间错开处理,从而在保证系统正常工作的同时消除了系统下的报错。了系统下的报错。了系统下的报错。

【技术实现步骤摘要】
一种设备热添加方法、系统、设备以及介质


[0001]本专利技术涉及热插拔领域,具体涉及一种设备热添加方法、系统、设备以及存储介质。

技术介绍

[0002]随着云计算、AI、无人驾驶、边缘计算、协助加速计算等业务的逐渐成熟,服器中各种外插卡如智能网卡、FPGA(Field Programmable Gate Array,现场可编程逻辑门阵列)加速卡、GPU加速卡等PCIE(Peripheral Component Interconnect Express,高速串行计算机扩展总线标准)扩展设备应用越来越多。
[0003]由于应用业务场景的需要,服务器在运行中,对这些PCIE设备热维护的需求越来越普遍,这就需要在PCIE设备发生故障或需要对PCIE设备进行升级时,服务器不能关机停止运行,也即在服务器运行过程中对PCIE设备进行维修和升级。
[0004]PCIE设备热维护需要用到PCIE热插拔功能。所谓热插拔即带电拔插,允许用户在不关闭系统,不切断电源的情况下能够取出或更换主机下挂的PCIE设备,而不影响主机服务器系统的运行,从而提高系统对灾难的及时恢复能力、扩展性和灵活性等。
[0005]传统的PCIE热插拔功能需要按键及指示灯,用户通过按键操作告知系统需要对PCIE设备进行热插拔操作,系统通过指示灯告知用户PCIE设备的当前状态并同时给PCIE设备进行上电或下电操作,来完成PCIE设备的热维护。该种方式确实实现了PCIE设备的热插拔功能,但有时会在系统下产生报错,这会给客户带来不安或质疑。
>[0006]PCIE规范规定热添加操作时,从系统对卡槽控制寄存器写入上电命令到数据链路层变化,这段时间的间隔要在1s内;而有些PCIE设备(如OCP NIC3.0)的规范却要求热添加时上电到复位的时间大于1s。如图1所示,由于只有在设备复位之后,数据链路层才会发生变化,因此设备上电到复位的时间发生在系统发上电指令到数据链路层变化的时间之内,这样就会导致对一些要求热添加时上电到复位的时间大于1s的PCIE设备做热添加操作时,系统会产生报错。

技术实现思路

[0007]有鉴于此,为了克服上述问题的至少一个方面,本专利技术实施例提出一种设备热添加方法,包括以下步骤:
[0008]响应于第一控制器接收到热插拔信号,生成第一上电信号以使能设备上电;
[0009]延迟预设时间段后,利用所述第一控制器将所述热插拔信号转发给第二控制器;
[0010]响应于所述第二控制器接收到所述热插拔信号,生成并向所述第一控制器发送第二上电信号;
[0011]响应于所述第一控制器接收到所述第二上电信号,控制所述设备复位;
[0012]读取所述设备信息并加载驱动以实现所述设备的热添加。
[0013]在一些实施例中,还包括:
[0014]响应于所述第一控制器未接收到所述第二上电信号,控制所述设备下电。
[0015]在一些实施例中,响应于所述第二控制器接收到所述热插拔信号,生成并向所述第一控制器发送第二上电信号,进一步包括:
[0016]所述第二控制器修改相关的寄存器的值以产生中断。
[0017]在一些实施例中,还包括:
[0018]生成指示灯控制信号以控制指示灯闪烁。
[0019]在一些实施例中,响应于第一控制器接收到热插拔信号,生成第一上电信号以使能设备上电,进一步包括:
[0020]响应于热插拔按键触发,生成所述热插拔信号。
[0021]在一些实施例中,利用所述第一控制器将所述热插拔信号转发给第二控制器,进一步包括:
[0022]利用所述第一控制器将所述热插拔信号转发给IO扩展模块;
[0023]所述IO扩展模块将所述热插拔信号转化为预设格式的信号后将所述预设格式的信号转发给所述第二控制器。
[0024]在一些实施例中,所述第一控制器为可编程逻辑器件。
[0025]基于同一专利技术构思,根据本专利技术的另一个方面,本专利技术的实施例还提供了一种设备热添加系统,包括:
[0026]生成模块,配置为响应于第一控制器接收到热插拔信号,生成第一上电信号以使能设备上电;
[0027]转发模块,配置为延迟预设时间段后,利用所述第一控制器将所述热插拔信号转发给第二控制器;
[0028]第二控制器模块,配置为响应于所述第二控制器接收到所述热插拔信号,生成并向所述第一控制器发送第二上电信号;
[0029]复位模块,配置为响应于所述第一控制器接收到所述第二上电信号,控制所述设备复位;
[0030]加载模块,配置为读取所述设备信息并加载驱动以实现所述设备的热添加。
[0031]基于同一专利技术构思,根据本专利技术的另一个方面,本专利技术的实施例还提供了一种计算机设备,包括:
[0032]至少一个处理器;以及
[0033]存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如上所述的任一种设备热添加方法的步骤。
[0034]基于同一专利技术构思,根据本专利技术的另一个方面,本专利技术的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时执行如上所述的任一种设备热添加方法的步骤。
[0035]本专利技术具有以下有益技术效果之一:本专利技术提出的方案是通过第一控制器接收到热插拔信号后直接控制设备上电,并且延迟一段时间后再将热插拔信号发送给系统的第二控制器,这样可将设备实际上电时间与系统发送上电时间错开处理,并且通过系统产生的上电信号再进行PCIE设备的复位,又能保证设备上电的行为受控于系统,从而在保证系统正常工作的同时消除了系统下的报错。
附图说明
[0036]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0037]图1为系统会产生报错的原因的示意图;
[0038]图2为本专利技术的实施例提供的设备热添加方法的流程示意图;
[0039]图3为本专利技术的实施例提供的设备热添加装置的结构示意图;
[0040]图4为本专利技术的实施例提供的设备热添加系统的结构示意图;
[0041]图5为本专利技术的实施例提供的计算机设备的结构示意图;
[0042]图6为本专利技术的实施例提供的计算机可读存储介质的结构示意图。
具体实施方式
[0043]为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。
[0044]需要说明的是,本专利技术实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本专利技术实施例的限定,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种设备热添加方法,其特征在于,包括以下步骤:响应于第一控制器接收到热插拔信号,生成第一上电信号以使能设备上电;延迟预设时间段后,利用所述第一控制器将所述热插拔信号转发给第二控制器;响应于所述第二控制器接收到所述热插拔信号,生成并向所述第一控制器发送第二上电信号;响应于所述第一控制器接收到所述第二上电信号,控制所述设备复位;读取所述设备信息并加载驱动以实现所述设备的热添加。2.如权利要求1所述的方法,其特征在于,还包括:响应于所述第一控制器未接收到所述第二上电信号,控制所述设备下电。3.如权利要求1所述的方法,其特征在于,响应于所述第二控制器接收到所述热插拔信号,生成并向所述第一控制器发送第二上电信号,进一步包括:所述第二控制器修改相关的寄存器的值以产生中断。4.如权利要求3所述的方法,其特征在于,还包括:生成指示灯控制信号以控制指示灯闪烁。5.如权利要求1所述的方法,其特征在于,响应于第一控制器接收到热插拔信号,生成第一上电信号以使能设备上电,进一步包括:响应于热插拔按键触发,生成所述热插拔信号。6.如权利要求1所述的方法,其特征在于,利用所述第一控制器将所述热插拔信号转发给第二控制器,进一步包括:利用所述第一控制器将所述热插拔信号转...

【专利技术属性】
技术研发人员:杨文静
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1