SEL制造技术

技术编号:39413317 阅读:9 留言:0更新日期:2023-11-19 16:04
本发明专利技术涉及服务器技术领域,具体提供一种

【技术实现步骤摘要】
SEL日志管理方法、系统、终端及存储介质


[0001]本专利技术属于服务器
,具体涉及一种
SEL
日志管理方法

系统

终端及存储介质


技术介绍

[0002]BMC(Baseboard Management Controller,
基板管理控制器
)
是服务器特有的管理控制器,通过监视服务器的温度

电压

风扇以及电源等,并做相应的调节工作,以保证服务器处于健康的状态

[0003]BMC
传感器可以记录当前服务器部件健康状态及在位信息,常见的传感器有温度传感器,电压传感器,电流传感器,状态传感器等

不同的传感器用于记录不同的部件的信息,比如温度传感器用于记录各个需要监控的温度点的温度,电源状态传感器用于监控电源的各种故障类型等

[0004]SEL
日志由
BMC
的传感器产生,当传感器的值发生变化时,会产生一条对应于该变化值的
SEL
日志,该
SEL
日志中包含了传感器的名称,序列号,传感器值的变化内容,以及事件是产生还是解除,
SEL
日志能方便地看到在过去一段时间内服务器中的传感器的值的变化情况,从而了解到服务器在一段时间内的健康状况

[0005]SEL
日志一般以文件的形式存储在
BMC
上,但该文件有一定的大小限制,这样只能记录固定数量的
SEL
日志

当日志记录达到限定值时,新产生的
SEL
日志会覆盖旧的
SEL
日志

另外,在进行
BMC
测试或实际应用中,经常会有删除
SEL
日志的操作,以避免旧日志对新日志的干扰

这样,运维人员根据
SEL
日志仅能了解服务器短时间内的运行情况,当出现问题需要追溯历史较长时间的服务器健康状况时,由于
SEL
日志的缺失而无法进行,进一步影响了问题的分析和解决


技术实现思路

[0006]针对现有技术存在的
SEL
日志不可追溯的问题,本专利技术提供一种
SEL
日志管理方法

系统

终端及存储介质,以解决上述技术问题

[0007]第一方面,本专利技术提供一种
SEL
日志管理方法,包括:
[0008]确认
BMC

SEL
日志的覆盖功能被启用,采集新增
SEL
日志数量;
[0009]若新增
SEL
日志数量达到设定的阈值,则将所有新增
SEL
日志备份至指定的存储区域;
[0010]获取服务器历史故障时间,并将存储区域中的无效
SEL
日志删除,所述无效
SEL
的日志生成时间与所述历史故障时间的时间差超过设定的时间阈值

[0011]在一个可选的实施方式中,确认
BMC

SEL
日志的覆盖功能被启用的方法,包括:
[0012]利用
GET
指令获取
BMC
可以存储的
SEL
日志总条目数量,并将所述总条目数量保存至结构体;
[0013]读取服务器的传感器清单,并从所述传感器清单提取传感器
ID

[0014]利用循环指令基于所述传感器
ID
循环模拟生成传感器数据,并将所述传感器数据发送至
BMC
,以使
BMC
不断生成
SEL
日志;
[0015]进入
BMC

SEL
页面查看记录的日志信息,从所述日志信息提取
SEL
日志的最后一条事件编号和第一个事件编号;
[0016]若最后一个事件编号等于所述总条目数量,则判定没有开启覆盖功能;
[0017]若最后一个事件编号大于所述总条目数量,且第一个事件编号不为1,并且最后一个事件编号与第一个事件编号的差值与所述总条目数量,则判定覆盖功能已开启

[0018]在一个可选的实施方式中,利用循环指令基于所述传感器
ID
循环模拟生成传感器数据,并将所述传感器数据发送至
BMC
,以使
BMC
不断生成
SEL
日志,包括:
[0019]创建
loop
循环操作;
[0020]获取传感器数据格式,所述传感器数据格式包括第一位数值等于
raw
,第二位数值对应
0A
;第三位数值表示添加一个
SEL
条目,第四位和第五位数值为记录的事件
ID
,事件
ID
为变量;第六位数值表示普通的系统事件记录;第七位

第八位

第九位和第十位数值表示这个事件发生的时间和当时
BMC
时间一致;第十一位和第十二位数值表示它的发生器
ID
;第十三位数值表示这个事件时间消息的格式版本;第十四位数值表示这个事件代表的传感器类型为电压;第十五位数值表示这个传感器对应的
ID
;第十六位数值表示为一般的声明事件,且事件类型代码为离散;第十七位数值

第十八位数值和第十九位数值表示完全冗余已经恢复;
[0021]随机选取目标传感器
ID
,基于目标传感器
ID
修改代表传感器类型的位和传感器对应的
ID
位,得到一条传感器数据;
[0022]将所述传感器数据通过
ipmi
指令发送至
BMC。
[0023]在一个可选的实施方式中,采集新增
SEL
日志数量,包括:
[0024]定义记录
BMC
新增
SEL
日志数量的变量;
[0025]利用
BMC

SEL
日志查询功能获取当前的
SEL
日志数量,并将当前的
SEL
日志数量赋值给所述变量

[0026]在一个可选的实施方式中,若新增
SEL
日志数量达到设定的阈值,则将所有新增
SEL
日志备份至指定的存储区域,包括:
[0027]创建备份
SEL
日志的线程,所述线程将所有新增
SEL
日志备份至本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种
SEL
日志管理方法,其特征在于,包括:确认
BMC

SEL
日志的覆盖功能被启用,采集新增
SEL
日志数量;若新增
SEL
日志数量达到设定的阈值,则将所有新增
SEL
日志备份至指定的存储区域;获取服务器历史故障时间,并将存储区域中的无效
SEL
日志删除,所述无效
SEL
的日志生成时间与所述历史故障时间的时间差超过设定的时间阈值
。2.
根据权利要求1所述的方法,其特征在于,确认
BMC

SEL
日志的覆盖功能被启用的方法,包括:利用
GET
指令获取
BMC
可以存储的
SEL
日志总条目数量,并将所述总条目数量保存至结构体;读取服务器的传感器清单,并从所述传感器清单提取传感器
ID
;利用循环指令基于所述传感器
ID
循环模拟生成传感器数据,并将所述传感器数据发送至
BMC
,以使
BMC
不断生成
SEL
日志;进入
BMC

SEL
页面查看记录的日志信息,从所述日志信息提取
SEL
日志的最后一条事件编号和第一个事件编号;若最后一个事件编号等于所述总条目数量,则判定没有开启覆盖功能;若最后一个事件编号大于所述总条目数量,且第一个事件编号不为1,并且最后一个事件编号与第一个事件编号的差值与所述总条目数量,则判定覆盖功能已开启
。3.
根据权利要求2所述的方法,其特征在于,利用循环指令基于所述传感器
ID
循环模拟生成传感器数据,并将所述传感器数据发送至
BMC
,以使
BMC
不断生成
SEL
日志,包括:创建
loop
循环操作;获取传感器数据格式,所述传感器数据格式包括第一位数值等于
raw
,第二位数值对应
0A
;第三位数值表示添加一个
SEL
条目,第四位和第五位数值为记录的事件
ID
,事件
ID
为变量;第六位数值表示普通的系统事件记录;第七位

第八位

第九位和第十位数值表示这个事件发生的时间和当时
BMC
时间一致;第十一位和第十二位数值表示它的发生器
ID
;第十三位数值表示这个事件时间消息的格式版本;第十四位数值表示这个事件代表的传感器类型为电压;第十五位数值表示这个传感器对应的
ID
;第十六位数值表示为一般的声明事件,且事件类型代码为离散;第十七位数值

第十八位数值和第十九位数值表示完全冗余已经恢复;随机选取目标传感器
ID
,基于目标传感器
ID
修改代表传感器类型的位和传感器对应的
ID
位,得到一条传感器数据;将所述传感器数据通过
ipmi
指令发送至
BMC。4.
根据权利要求1所述的方法,其特征在于,采集新增
SEL
日志数量,包括...

【专利技术属性】
技术研发人员:袁立国祁晓言张霄鹏
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1