一种收集CPU寄存器数据的方法、系统及介质技术方案

技术编号:29488930 阅读:20 留言:0更新日期:2021-07-30 19:00
本发明专利技术公开了一种收集CPU寄存器数据的方法,包括以下步骤:设置延时策略,当服务器发生宕机时,逻辑器件获取服务器的宕机信息并发出宕机信号;当BMC检测到宕机信号时,判断BMC与CPU连接的链路是否正常;若链路正常,则通过PECI收集CPU寄存器中的数据,并提示CPU寄存器中的数据收集完成;若链路异常,则服务器进行软重启,通过BIOS收集CPU寄存器中的数据,将CPU寄存器中的数据发送至BMC中,判断BMC是否接收到CPU寄存器中的数据,根据判断结果提示CPU寄存器中的数据收集完成或失败;本发明专利技术能够通过PECI收集CPU寄存器数据或者通过BIOS收集寄存器数据降低服务器的维护成本,提高产品竞争力。

【技术实现步骤摘要】
一种收集CPU寄存器数据的方法、系统及介质
本专利技术涉及数据处理领域,特别是涉及一种收集CPU寄存器数据的方法、系统及介质。
技术介绍
随着信息技术的飞速发展,用户对服务器的可靠性和信息处理能力有了更高的要求。与传统服务器相比,基于Whitley平台的新一代服务器在计算性能和可靠性上与传统服务器相比具有很大的优势,并在对实时性、可靠性和可用性要求苛刻的领域中应用越来越广泛。同时基于Whitley平台的新一代服务器在发生故障的原因上更加复杂,对故障原因分析更加困难。目前在服务器发生宕机时可以通过XDP或者RemoteXDP来收集服务器CPU寄存器中的数据进行分析,但使用XDP方式需要人为将XDP设备接到服务器上,对于大批量部署的数据中心在操作上是不可行的,使用RemoteXDP可以通过BMC远程收集CPU寄存器中的数据,虽然避免了XDP的问题,但是在时效性上也无法保障。因此在很多方案中提出了在发生宕机时由BMC通过PECI接口自动收集的方法,但BMC和CPU之间的PECI链路在服务器宕机时无法保证连通性,造成CPU寄存器读取失败。
技术实现思路
本专利技术主要解决是使用远程XDP的方式时效性无法保证,以及在服务器宕机时BMC和CPU之间的PECI链路无法保证连通性的问题。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种收集CPU寄存器数据的方法,应用于服务器,包括以下步骤:设置延时策略,通过逻辑器件监控所述服务器,当所述服务器发生宕机时,所述逻辑器件获取所述服务器的宕机信息并发出宕机信号;BMC在第一时间内轮询所述宕机信号,当BMC检测到所述宕机信号时,判断所述BMC与所述服务器中CPU连接的链路是否正常;若所述链路正常,则通过PECI收集CPU寄存器中的数据,所述BMC执行存储策略和更新策略,并提示所述CPU寄存器中的数据收集完成;若所述链路异常,则所述服务器进行软重启,通过BIOS收集CPU寄存器中的数据,将所述CPU寄存器中的数据发送至所述BMC中,判断所述BMC是否接收到所述CPU寄存器中的数据,并根据判断结果提示所述CPU寄存器中的数据收集完成或失败。优选的,所述延时策略为:在所述服务器的BIOS中设置S1状态的延时时间为第二时间,当所述服务器宕机时,不进入S1状态,若所述链路正常,在所述第二时间内,所述BMC通过PECI收集所述CPU寄存器中的数据,经过所述第二时间后进入S1状态。优选的,所述存储策略为:将收集的CPU寄存器中的数据按照时间顺序进行降序排序,找到排名前三位收集CPU寄存器中的数据,记为第一数据,将第一数据保存至所述BMC的文件系统中。优选的,所述更新策略为:当收集到新的CPU寄存器中的数据时,再次执行存储策略,对所述BMC的文件系统中的数据进行更新。优选的,所述提示所述CPU寄存器中的数据收集完成的步骤进一步包括:将所述第一数据保存至所述BMC的文件系统后,所述BMC创建数据收集成功的日志,记为第一日志;通过网络协议发送所述第一日志至客户端,通过所述第一日志提示所述CPU寄存器中的数据收集完成。优选的,所述根据所述判断结果提示所述CPU寄存器中的数据收集完成或失败的步骤进一步包括:若所述BMC接收到所述BIOS发送的CPU寄存器中的数据,则执行所述存储策略,将所述第一数据保存至所述BMC的文件系统后,所述BMC创建数据收集成功的日志,记为第二日志,并通过网络协议发送所述第二日志至客户端,通过所述第二日志提示所述CPU寄存器中的数据收集完成。优选的,所述根据所述判断结果提示所述CPU寄存器中的数据收集完成或失败的步骤进一步还包括:若所述BMC未接收到所述BIOS发送的CPU寄存器中的数据,则所述BMC创建数据收集失败的日志,记为第三日志,并通过网络协议发送所述第三日志至客户端,通过所述第三日志提示所述CPU寄存器中的数据收集失败。优选的,所述链路为PECI链路,所述网络协议包括SNMP和Syslog,所述CPU寄存器包括MSR寄存器、CSR寄存器和PCIe寄存器。本专利技术还提供一种收集CPU寄存器数据的系统,包括:CPU、BMC、CPLD、延时模块、判断模块、收集模块和提示模块;所述CPU通过PECI链路与所述BMC连接;所述CPLD用于监控服务器,当所述服务器发生宕机时,所述CPLD获取所述服务器的宕机信息并发出宕机信号;所述BMC与所述CPLD连接,用于获取所述CPLD中的宕机信号;所述BMC用于执行存储策略和更新策略;所述延时模块用于设定并执行延时策略;所述判断模块用于判断所述BMC与所述CPU连接的所述PECI链路是否正常,用于判断所述BMC是否接收到所述CPU寄存器中的数据;所述收集模块用于通过PECI收集CPU寄存器中的数据,用于通过BIOS收集CPU寄存器中的数据;所述提示模块用于提示所述CPU寄存器中的数据收集完成或者失败。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述的一种收集CPU寄存器数据的方法的步骤。本专利技术的有益效果是:1、本专利技术所述的一种收集CPU寄存器数据的方法,可以实现在系统发生宕机故障时,BMC根据PECI链路是否正常,通过PECI收集CPU寄存器数据或者通过BIOS收集寄存器数据,并将收集结果远程发送给客户,大大降低服务器的维护成本,提高产品竞争力;2、本专利技术所述的一种收集CPU寄存器数据的系统,BMC定期轮询CPLD中的宕机信号,根据宕机信号进行收集CPU寄存器数据的操作,并且根据PECI链路正常或者异常情况进行不同的操作,从而避免了BMC和CPU之间的PECI链路在服务器宕机时无法保证连通性的问题,提高了收集CPU寄存器的稳定性;3、本专利技术所述的一种计算机可读存储介质,将收集到的CPU寄存器中的数据按照时间顺序进行排序,将最新的数据进行收集,确保了数据的准确性,并且当PECI链路正常时,会实时更新BMC文件系统的系统,确保了数据的时效性,当数据收集成功时,通过对应的日志文件提示客户收集成功,当数据收集失败时,通过对应的日志文件提示客户收集失败,保证了处理服务器宕机的效率。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例1所述的一种收集CPU寄存器数据的方法示意图;图2是本专利技术实施例2所述的一种收集CPU寄存器数据的系统架构示意图。具体实施方式下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本发本文档来自技高网...

【技术保护点】
1.一种收集CPU寄存器数据的方法,应用于服务器,其特征在于,包括以下步骤:/n设置延时策略,通过逻辑器件监控所述服务器,当所述服务器发生宕机时,所述逻辑器件获取所述服务器的宕机信息并发出宕机信号;/nBMC在第一时间内轮询所述宕机信号,当BMC检测到所述宕机信号时,判断所述BMC与所述服务器中CPU连接的链路是否正常;/n若所述链路正常,则通过PECI收集CPU寄存器中的数据,所述BMC执行存储策略和更新策略,并提示所述CPU寄存器中的数据收集完成;/n若所述链路异常,则所述服务器进行软重启,通过BIOS收集CPU寄存器中的数据,将所述CPU寄存器中的数据发送至所述BMC中,判断所述BMC是否接收到所述CPU寄存器中的数据,并根据判断结果提示所述CPU寄存器中的数据收集完成或失败。/n

【技术特征摘要】
1.一种收集CPU寄存器数据的方法,应用于服务器,其特征在于,包括以下步骤:
设置延时策略,通过逻辑器件监控所述服务器,当所述服务器发生宕机时,所述逻辑器件获取所述服务器的宕机信息并发出宕机信号;
BMC在第一时间内轮询所述宕机信号,当BMC检测到所述宕机信号时,判断所述BMC与所述服务器中CPU连接的链路是否正常;
若所述链路正常,则通过PECI收集CPU寄存器中的数据,所述BMC执行存储策略和更新策略,并提示所述CPU寄存器中的数据收集完成;
若所述链路异常,则所述服务器进行软重启,通过BIOS收集CPU寄存器中的数据,将所述CPU寄存器中的数据发送至所述BMC中,判断所述BMC是否接收到所述CPU寄存器中的数据,并根据判断结果提示所述CPU寄存器中的数据收集完成或失败。


2.根据权利要求1所述的一种收集CPU寄存器数据的方法,其特征在于:所述延时策略为:在所述服务器的BIOS中设置S1状态的延时时间为第二时间,当所述服务器宕机时,不进入S1状态,若所述链路正常,在所述第二时间内,所述BMC通过PECI收集所述CPU寄存器中的数据,经过所述第二时间后进入S1状态。


3.根据权利要求1所述的一种收集CPU寄存器数据的方法,其特征在于:所述存储策略为:将收集的CPU寄存器中的数据按照时间顺序进行降序排序,找到排名前三位收集CPU寄存器中的数据,记为第一数据,将第一数据保存至所述BMC的文件系统中。


4.根据权利要求3所述的一种收集CPU寄存器数据的方法,其特征在于:所述更新策略为:当收集到新的CPU寄存器中的数据时,再次执行存储策略,对所述BMC的文件系统中的数据进行更新。


5.根据权利要求4所述的一种收集CPU寄存器数据的方法,其特征在于:所述提示所述CPU寄存器中的数据收集完成的步骤进一步包括:将所述第一数据保存至所述BMC的文件系统后,所述BMC创建数据收集成功的日志,记为第一日志;
通过网络协议发送所述第一日志至客户端,通过所述第一日志提示所述CPU寄存器中的数据收集完成。


6.根据权利要求3所述的一种收集CPU寄存器数据的方法,其特征在于:所述根据所述判断...

【专利技术属性】
技术研发人员:袁传博罗鹏芳刘宝阳
申请(专利权)人:山东英信计算机技术有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1