一种服务器故障信息收集方法、系统、设备及介质技术方案

技术编号:37398714 阅读:13 留言:0更新日期:2023-04-30 09:27
本发明专利技术属于计算机领域,具体涉及一种服务器故障信息收集方法、系统、设备及可读存储介质。方法包括:响应于服务器故障,从第一预定存储空间获取寄存器读取策略,并基于寄存器读取策略并行读取对应的目标寄存器的数据;将读取到的对应的目标寄存器的数据按照预定存储方式保存到第二预定存储空间;响应于目标寄存器读取策略执行完成,从第二预定存储空间将寄存器读取策略所涉及的寄存器的数据读取到BMC中。通过本发明专利技术提供的一种服务器故障信息收集方法增加了CPU寄存器收集的并行性,缩短了收集时间,显著提高了CPU寄存器收集的效率,使故障诊断寄存器分析流程得到明显优化,同时减轻了BMC收集CPU寄存器的负担。了BMC收集CPU寄存器的负担。了BMC收集CPU寄存器的负担。

【技术实现步骤摘要】
一种服务器故障信息收集方法、系统、设备及介质


[0001]本专利技术属于计算机领域,具体涉及一种服务器故障信息收集方法、系统、设备及可读存储介质。

技术介绍

[0002]近年来,随着信息化、云计算、大数据、人工智能以及高性能计算等
的快速发展,对服务器系统各方面的要求越来越高,包括服务器的性能、可靠性、安全性等等方面。特别地,服务器的可靠运行能力越来越成为影响服务器性能的重要方面。而服务器的故障诊断功能也正成为保证服务器可靠运行的关键因素。服务器中包含多个相对独立的部件,彼此协作才能使服务器正常运行。每个部件都有可能出现故障,而且每个部件的故障类型也不尽相同,每种故障都能导致服务器异常。在众多故障中,极为关键的是CPU故障、内存故障等,因此需要对故障原因进行分析解决,并将这一解决方案融入到服务器设计当中,降低故障发生率,以逐步提升服务器稳定运行能力。服务器的故障诊断功能正是为解决这一问题而设计提出的,它能在服务器出现故障时感知故障,并对故障类型、产生原因进行深入分析。通过分析结果,确定故障的根因并解决,从而在服务器迭代过程中逐步优化。在进行故障分析时,分析数据依赖于服务器CPU的运行数据,而这些数据存在于CPU的寄存器当中,因此进行故障分析的前提是先获取CPU寄存器的数据。目前有两种寄存器数据获取(收集)技术:1.BMC通过南桥PCH(Platform Controller Hub)中的ME(Management Engine)管理引擎发送寄存器读取命令实现对CPU关键寄存器的信息收集;2.BMC通过其内部的专用控制器通道直接与CPU建立物理链路,在此链路上传输寄存器信息,通过发送不同的命令请求,获取寄存器数据。
[0003]然而,上述现有技术存在两个问题:由于ME本身承担着服务器管理的多项复杂任务,经常发生CPU寄存器收集被其他任务打断的情况;同时,当服务器出现系统宕机时,ME同样会大概率受到影响而无法工作;此外,由于服务器结构越来越复杂,服务器的路数、CPU数量也成上升趋势,而传统方式对寄存器数据收集的工作是串行进行的,也就是需要逐个CPU地进行寄存器数据收集,只有当一个CPU的所有故障寄存器数据收集完成后才能开启下一个CPU寄存器的数据收集流程。对于多路服务器,服务器路数越多,CPU个数越多,寄存器收集的时间变长越明显,效率也会降低。因此,现有技术存在CPU寄存器收集方面表现出效率低下的问题,甚至会出现无法成功获取寄存器信息的问题,影响故障诊断分析流程的高效运行,也严重影响服务器整体的管理监控能力及效率。

技术实现思路

[0004]为解决以上问题,本专利技术提出一种服务器故障信息收集方法,包括:
[0005]响应于服务器故障,从第一预定存储空间获取寄存器读取策略,并基于寄存器读取策略并行读取对应的目标寄存器的数据;
[0006]将读取到的对应的目标寄存器的数据按照预定存储方式保存到第二预定存储空
间;
[0007]响应于所述目标寄存器读取策略执行完成,从所述第二预定存储空间将所述寄存器读取策略所涉及的寄存器的数据读取到BMC中。
[0008]在本专利技术的一些实施方式中,方法还包括:
[0009]根据目标寄存器的分类的在所述第一预定存储空间进行分区,并将每一分类寄存器的命令码以及对应的目标寄存器信息保存到所述目标寄存器对应的分区中。
[0010]在本专利技术的一些实施方式中,从第一预定存储空间获取寄存器读取策略包括:
[0011]通过CPLD从所述第一预定存储空间按照分区顺序依次获取目标寄存器的地址以及目标寄存器的命令码。
[0012]在本专利技术的一些实施方式中,基于寄存器读取策略读取对应的寄存器的数据包括:
[0013]将CPLD与服务器上的一个或多个CPU通过所述CPU上的预定传输通道分别相连,并通过所述预定传输通道基于获取的目标寄存器的地址以及目标寄存器的命令码同时获取所述一个或多个CPU中的目标寄存器的数据。
[0014]在本专利技术的一些实施方式中,将读取到的对应的目标寄存器的数据按照预定存储方式保存到第二预定存储空间包括:
[0015]通过CPLD将获取到每个CPU的目标寄存器的数据按照预定方式分别存存储到多个第二预定存储空间中。
[0016]在本专利技术的一些实施方式中,通过CPLD将获取到每个CPU的目标寄存器的数据按照预定方式分别存存储到多个第二预定存储空间中包括:
[0017]为每个CPU独立分配第二预定存储空间,并基于目标寄存器的种类对每个第二预定存储空间进行分区;
[0018]将获取到目标寄存器的数据根据其种类分别保存到对应的分区。
[0019]在本专利技术的一些实施方式中,方法还包括;
[0020]通过BMC获取服务器的硬件配置信息,并根据硬件配置信息判断所述服务器的CPU是否发生变化;
[0021]响应于所述CPU发生变化,判断所述变化后的CPU的寄存器的信息与第一预定存储空间中保存的目标寄存器信息一致;
[0022]响应于所述变化后的CPU的寄存器的信息与第一预定存储空间中保存的目标寄存器信息不一致,对所述第一预定存储空间中的目标寄存器信息基于变化后的CPU进行更新。
[0023]本专利技术的另一方面还提出一种服务器故障信息收集系统,包括:
[0024]寄存器数据获取模块,所述寄存器数据获取模块配置用于响应于服务器故障,从第一预定存储空间获取寄存器读取策略,并基于寄存器读取策略并行读取对应的目标寄存器的数据;
[0025]寄存器数据保存模块,所述寄存器数据保存模块配置用于将读取到的对应的目标寄存器的数据按照预定存储方式保存到第二预定存储空间;
[0026]寄存器数据收集模块,所述寄存器数据收集模块配置用于响应于所述目标寄存器读取策略执行完成,从所述第二预定存储空间将所述寄存器读取策略所涉及的寄存器的数据读取到BMC中。
[0027]本专利技术的又一方面还提出一种计算机设备,包括:
[0028]至少一个处理器;以及
[0029]存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现上述实施方式中任意一项所述方法的步骤。
[0030]本专利技术的再一方面还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述实施方式中任意一项所述方法的步骤。
[0031]通过本专利技术提供的一种服务器故障信息收集方法,将服务器故障时的寄存器读取策略预先保存到第一存储空间,在服务器故障时从第一预定存储空间读取对应的寄存器读取策略,并基于寄存器读取策略并行读取服务器CPU上的寄存器信息。进一步将读取到每个CPU的寄存器信息单独存储到对应的第二预定存储空间。增加了CPU寄存器收集的并行性,缩短了收集时间,显著提高了CPU寄存器收集的效率,使故障诊断寄存器分析流程得到明显优化,同时减轻了BMC收集CPU寄存器的负担。
附图说明
[0032本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种服务器故障信息收集方法,其特征在于,包括:响应于服务器故障,从第一预定存储空间获取寄存器读取策略,并基于寄存器读取策略并行读取对应的目标寄存器的数据;将读取到的对应的目标寄存器的数据按照预定存储方式保存到第二预定存储空间;响应于所述目标寄存器读取策略执行完成,从所述第二预定存储空间将所述寄存器读取策略所涉及的寄存器的数据读取到BMC中。2.根据权利要求1所述的方法,其特征在于,还包括:根据目标寄存器的分类的在所述第一预定存储空间进行分区,并将每一分类寄存器的命令码以及对应的目标寄存器信息保存到所述目标寄存器对应的分区中。3.根据权利要求2所述的方法,其特征在于,所述从第一预定存储空间获取寄存器读取策略包括:通过CPLD从所述第一预定存储空间按照分区顺序依次获取目标寄存器的地址以及目标寄存器的命令码。4.根据权利要求3所述的方法,其特征在于,所述基于寄存器读取策略读取对应的寄存器的数据包括:将CPLD与服务器上的一个或多个CPU通过所述CPU上的预定传输通道分别相连,并通过所述预定传输通道基于获取的目标寄存器的地址以及目标寄存器的命令码同时获取所述一个或多个CPU中的目标寄存器的数据。5.根据权利要求4所述的方法,其特征在于,所述将读取到的对应的目标寄存器的数据按照预定存储方式保存到第二预定存储空间包括:通过CPLD将获取到每个CPU的目标寄存器的数据按照预定方式分别存存储到多个第二预定存储空间中。6.根据权利要求5所述的方法,其特征在于,所述通过CPLD将获取到每个CPU的目标寄存器的数据按照预定方式分别存存储到多个第二预定存储空间中包括:为每个CPU独立分配第二预定存储空间,并基...

【专利技术属性】
技术研发人员:刘金明陈超凡邸兴娟
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1