【技术实现步骤摘要】
一种监控服务器内存的方法、设备及可读介质
本专利技术涉及服务器领域,更具体地,特别是指一种监控服务器内存的方法、设备及可读介质。
技术介绍
随着大数据、云计算、人工智能时代的到来,互联网业务量和数据量出现猛烈增长,数据成为当前很多关键技术的基础;在服务器系统中,随着用于存储和计算的数据量的增加,服务器的运载压力越来越大,这就对于整个数据链路稳定性的要求越来越高。在数据传输过程中,对于链路上的数据传输错误而言,少量的错误通过校验机制可以纠正过来,如果链路稳定性比较差,或者数据传输链路上硬件设备存在损伤,传输的错误数据会比较频繁且不断累积,轻微的会造成服务器的计算性能及存储性能降低,严重的会造成硬盘掉盘、系统宕机,由此所引发的后果则是客户的业务中断,数据丢失,造成的损失不可预估。服务器系统中,为了使系统运行的更趋于安全稳定,使用的内存都必须是具有高的稳定性和纠错性能的,与此相关的技术就是带有ECC(ErrorCorrectingCode,错误检查和纠正)功能的内存;对于ECC技术而言,单个数据的错误是可以自己纠正过来并继 ...
【技术保护点】
1.一种监控服务器内存的方法,其特征在于,包括:/n接收错误检查和纠正信息并计数;/n判断在连续的第一预设时长内接收错误检查和纠正信息的次数是否达到第一阈值;/n响应于在连续的第一预设时长内接收错误检查和纠正信息的次数达到第一阈值,将日志信息记录到黑盒日志中;/n判断在连续的第二预设时长内所述黑盒日志中的日志信息是否达到预定标准;以及/n响应于在连续的第二预设时长内所述黑盒日志中的日志信息达到预定标准,将日志信息记录到BMC系统日志中,以提醒用户更换内存。/n
【技术特征摘要】
1.一种监控服务器内存的方法,其特征在于,包括:
接收错误检查和纠正信息并计数;
判断在连续的第一预设时长内接收错误检查和纠正信息的次数是否达到第一阈值;
响应于在连续的第一预设时长内接收错误检查和纠正信息的次数达到第一阈值,将日志信息记录到黑盒日志中;
判断在连续的第二预设时长内所述黑盒日志中的日志信息是否达到预定标准;以及
响应于在连续的第二预设时长内所述黑盒日志中的日志信息达到预定标准,将日志信息记录到BMC系统日志中,以提醒用户更换内存。
2.根据权利要求1所述的方法,其特征在于,所述判断在连续的第二预设时长内所述黑盒日志中的日志信息是否达到预定标准包括:
判断在连续的第二预设时长内接收错误检查和纠正信息的次数是否达到第二阈值。
3.根据权利要求1所述的方法,其特征在于,所述接收错误检查和纠正信息并计数包括:
系统根据接收的错误检查和纠正信息对内存进行修复。
4.根据权利要求1所述的方法,其特征在于,所述响应于在连续的第一预设时长内接收错误检查和纠正信息的次数达到第一阈值,将日志信息记录到黑盒日志中还包括:
响应于在连续的第一预设时长内接收错误检查和纠正信息的次数达到第一阈值,触发中断并将所述中断发送给BMC。
5.根据权利要求1所述的方法,其特征在于,还包括:
判断内存是否更换;以及
响应于内存已经更换,将接收错误检查和纠正信息的次数归零。
6.一种计算机设备,其特征在于,包括:
至少一个处理器...
【专利技术属性】
技术研发人员:岳远斌,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。