System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种智能模块保活系统和方法技术方案_技高网

一种智能模块保活系统和方法技术方案

技术编号:41310003 阅读:5 留言:0更新日期:2024-05-13 14:53
本申请涉及一种智能模块的保活系统和方法。所述系统包括:电源开关模块、CPLD模块和CPU模块;电源开关模块,包括多个电源开关单元;电源开关单元一对一连接智能模块,用于控制各个智能模块的上电和掉电;CPLD模块,用于检测智能模块的心跳信号,得到心跳信号检测结果;还用于控制电源开关单元的工作;CPU模块,用于从CPLD模块中周期性读取心跳信号检测结果,并控制CPLD模块使工作异常的智能模块掉电;还用于在工作异常的智能模块掉电完成后,控制CPLD模块使工作异常的智能模块重新上电。采用本方法能够解决现有技术中存在必须通过整机重启来对系统不能正常操作的智能模块进行保活,而导致的智能服务器的所有业务都受到影响的问题。

【技术实现步骤摘要】

本申请涉及服务器,特别是涉及一种智能模块保活系统和方法


技术介绍

1、随着人工智能技术的发展,智能服务器逐渐普及,智能服务器的智能功能主要依靠插入其中的智能模块来完成。通常一台智能服务器满配时可以插入几十个智能模块,这几十个智能模块在处理智能业务时是相互独立运行的。在智能服务器的几十个智能模块处理智能业务时,不可避免的会出现个别智能模块不能正常处理业务的情况,此时需要对出现问题的智能模块进行保活。

2、现有技术主要是通过软件复位的方式对出现问题的智能模块进行保活。而软件复位的前提条件是出现问题的智能模块的系统还能正常操作,当出现问题的智能模块的系统不能正常操作时,无法通过软件复位对出现问题的智能模块进行保活。此时,需要对整机进行重启来实现对出现问题的智能模块的保活,而对整机进行重启,会导致智能服务器的所有业务都受到影响。

3、针对相关技术中存在必须通过整机重启来对系统不能正常操作的智能模块进行保活,而导致的智能服务器的所有业务都受到影响的问题,目前仍没有提出有效的解决方案。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种智能模块保活系统和方法。

2、第一方面,本申请提供了一种智能模块保活系统。所述系统包括:电源开关模块、cpld模块、cpu模块和智能模块;

3、所述电源开关模块,包括多个电源开关单元;所述电源开关单元,一对一连接所述智能模块,用于控制各个所述智能模块的上电和掉电;

4、所述cpld模块,连接所述智能模块,用于检测所述智能模块的心跳信号,得到心跳信号检测结果;所述cpld模块,还连接各个所述电源开关单元,用于向所述电源开关单元发送电源控制信号,控制所述电源开关单元的工作;

5、所述cpu模块,连接所述cpld模块,用于从所述cpld模块中周期性读取所述心跳信号检测结果,并在所述心跳信号检测结果显示当前存在工作异常的智能模块时,控制所述cpld模块将所述工作异常的智能模块所对应的所述电源开关单元的电源控制信号拉至低电平,使所述工作异常的智能模块掉电;所述cpu模块,还用于在所述工作异常的智能模块掉电完成后,控制所述cpld模块将所述工作异常的智能模块所对应的所述电源开关单元的电源控制信号拉至高电平,使所述工作异常的智能模块重新上电。

6、在其中一个实施例中,所述cpld模块,还用于检测所述智能模块的在位信号,得到在位信号检测结果;

7、所述cpu模块从所述cpld模块中周期性读取所述在位信号检测结果中显示当前在位的智能模块的心跳信号检测结果。

8、在其中一个实施例中,所述cpld模块,还用于在对所述工作异常的智能模块重新上电之后,对重新上电后的智能模块加载从片系统。

9、在其中一个实施例中,所述cpld模块,还用于将所述工作异常的智能模块掉电又重新上电记为所述工作异常的智能模块的一次保活操作,并统计各个工作异常的智能模块的保活操作的次数;

10、所述cpld模块,还用于在所述工作异常的智能模块的所述保活操作的次数达到预设的阈值次数时,将所述工作异常的智能模块所对应的所述电源开关单元的电源控制信号,持续拉至低电平,直至整机设备断电为止。

11、在其中一个实施例中,所述cpld模块,包括特定寄存器;所述特定寄存器,用于存储所述心跳信号检测结果和所述在位信号检测结果。

12、在其中一个实施例中,所述特定寄存器,用于基于所述心跳信号检测结果,将所述工作异常的智能模块的异常标志位用第一标志位表示;

13、所述cpu模块,还用于从所述特定寄存器中周期性读取所述特定寄存器的异常标志位,在读取到所述特定寄存器存在异常标志位用所述第一标志位表示的情况时,将用所述第一标志位表示的异常标志位改为用第二标志位表示,并控制所述cpld模块将用所述第一标志位表示的异常标志位所对应的工作异常的智能模块所对应的所述电源开关单元的电源控制信号拉至低电平,使所述工作异常的智能模块掉电。

14、在其中一个实施例中,所述cpld模块在检测到的所述智能模块的心跳信号为预设的特定频率的矩形波时,得到所述智能模块为工作正常的心跳信号检测结果;在检测到的所述智能模块的心跳信号不是所述预设的特定频率的矩形波时,得到所述智能模块为工作异常的心跳信号检测结果。

15、在其中一个实施例中,所述cpld模块在检测到的所述智能模块的在位信号为低电平时,得到所述智能模块为在位的在位信号检测结果;在检测到的所述智能模块的在位信号为高电平时,得到所述智能模块为不在位的在位信号检测结果。

16、第二方面,本实施例中提供了一种智能模块保活方法,应用于上述第一方面所述的智能模块保活系统,所述方法包括以下步骤:

17、所述cpld模块检测智能模块的在位信号,得到在位信号检测结果;

18、所述cpld模块检测智能模块的心跳信号,得到心跳信号检测结果;

19、所述cpu模块通过周期性读取所述cpld模块中的所述在位信号检测结果和所述心跳信号检测结果,确定工作异常的智能模块;

20、所述cpu模块通过控制所述cpld模块将所述工作异常的智能模块所对应的电源开关单元的电源控制信号拉至低电平,使所述工作异常的智能模块掉电;

21、所述cpu模块在所述工作异常的智能模块掉电完成后,控制所述cpld模块将所述工作异常的智能模块所对应的所述电源开关单元的所述电源控制信号拉至高电平,使所述工作异常的智能模块上电。

22、在其中的一个实施例中,所述cpu模块通过周期性读取所述cpld模块中的所述在位信号检测结果和所述心跳信号检测结果,确定工作异常的智能模块,包括以下步骤:

23、所述cpld模块将所述在位信号检测结果和所述心跳信号检测结果存储于特定寄存器中;

24、所述cpu模块通过周期性读取所述特定寄存器中的在位信号检测结果中显示在位的智能模块的心跳信号检测结果,确定所述工作异常的智能模块。

25、上述智能模块保活系统和方法,其中,上述系统包括:电源开关模块、cpld模块和cpu模块;电源开关模块,包括多个电源开关单元;每个电源开关单元一对一连接智能模块,用于控制各个智能模块的上电和掉电;cpld模块,连接智能模块,用于检测智能模块的心跳信号,得到心跳信号检测结果;cpld模块,还连接各个电源开关单元,用于向电源开关单元发送电源控制信号,控制电源开关单元的工作;cpu模块,连接cpld模块,用于从cpld模块中周期性读取心跳信号检测结果,并在心跳信号检测结果显示当前存在工作异常的智能模块时,控制cpld模块将工作异常的智能模块所对应的电源开关单元的电源控制信号拉至低电平,使工作异常的智能模块掉电;cpu模块,还用于在工作异常的智能模块掉电完成后,控制cpld模块将工作异常的智能模块所对应的电源开关单元的电源控制信号拉至高电平,使工作异常的智能模块重新上电。其通过cpl本文档来自技高网...

【技术保护点】

1.一种智能模块保活系统,其特征在于,所述系统包括:电源开关模块、CPLD模块、CPU模块和智能模块;

2.根据权利要求1所述的智能模块保活系统,其特征在于,所述CPLD模块,还用于检测所述智能模块的在位信号,得到在位信号检测结果;

3.根据权利要求1所述的智能模块保活系统,其特征在于,所述CPLD模块,还用于在对所述工作异常的智能模块重新上电之后,对重新上电后的智能模块加载从片系统。

4.根据权利要求1所述的智能模块保活系统,其特征在于,所述CPLD模块,还用于将所述工作异常的智能模块掉电又重新上电记为所述工作异常的智能模块的一次保活操作,并统计各个工作异常的智能模块的保活操作的次数;

5.根据权利要求2所述的智能模块保活系统,其特征在于,所述CPLD模块,包括特定寄存器;所述特定寄存器,用于存储所述心跳信号检测结果和所述在位信号检测结果。

6.根据权利要求5所述的智能模块保活系统,其特征在于,所述特定寄存器,用于基于所述心跳信号检测结果,将所述工作异常的智能模块的异常标志位用第一标志位表示;

7.根据权利要求1所述的智能模块保活系统,其特征在于,所述CPLD模块在检测到的所述智能模块的心跳信号为预设的特定频率的矩形波时,得到所述智能模块为工作正常的心跳信号检测结果;在检测到的所述智能模块的心跳信号不是所述预设的特定频率的矩形波时,得到所述智能模块为工作异常的心跳信号检测结果。

8.根据权利要求1所述的智能模块保活系统,其特征在于,所述CPLD模块在检测到的所述智能模块的在位信号为低电平时,得到所述智能模块为在位的在位信号检测结果;在检测到的所述智能模块的在位信号为高电平时,得到所述智能模块为不在位的在位信号检测结果。

9.一种智能模块保活方法,应用于上述权利要求1至权利要求8中任一项所述的智能模块保活系统,其特征在于,所述方法包括:

10.根据权利要求9所述的智能模块保活方法,其特征在于,所述CPU模块通过周期性读取所述CPLD模块中的所述在位信号检测结果和所述心跳信号检测结果,确定工作异常的智能模块,包括:

...

【技术特征摘要】

1.一种智能模块保活系统,其特征在于,所述系统包括:电源开关模块、cpld模块、cpu模块和智能模块;

2.根据权利要求1所述的智能模块保活系统,其特征在于,所述cpld模块,还用于检测所述智能模块的在位信号,得到在位信号检测结果;

3.根据权利要求1所述的智能模块保活系统,其特征在于,所述cpld模块,还用于在对所述工作异常的智能模块重新上电之后,对重新上电后的智能模块加载从片系统。

4.根据权利要求1所述的智能模块保活系统,其特征在于,所述cpld模块,还用于将所述工作异常的智能模块掉电又重新上电记为所述工作异常的智能模块的一次保活操作,并统计各个工作异常的智能模块的保活操作的次数;

5.根据权利要求2所述的智能模块保活系统,其特征在于,所述cpld模块,包括特定寄存器;所述特定寄存器,用于存储所述心跳信号检测结果和所述在位信号检测结果。

6.根据权利要求5所述的智能模块保活系统,其特征在于,所述特定寄存器,用于基于所述心跳信号检测结果,将所述工作异...

【专利技术属性】
技术研发人员:李志伟刘刚强蔡剑峰
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1