一种服务器高低温可靠性测试方法及装置制造方法及图纸

技术编号:20622068 阅读:43 留言:0更新日期:2019-03-20 14:12
本发明专利技术提供一种服务器高低温可靠性测试方法及装置,包括:设置用于循环执行测试的测试时间、间隔时间和测试次数;设置测试温度对应的温度阈值;利用热偶线获取系统关键部件芯片表面实际温度并将所述芯片表面实际温度存储至日志文件;通过BMC获取系统关键部件的Tj温度并将所述Tj温度存储至日志文件;通过将芯片表面实际温度和Tj温度与对应温度阈值对比获取服务器高低温可靠性。本发明专利技术通过自动读取记录系统关键部件的芯片表面温度和Tj温度,并设置温度阈值,经对比后实现对系统温度的自动监控,且记录下测试的温度,方便维护人员查看。

A Test Method and Device for Server Reliability at High and Low Temperatures

The invention provides a high and low temperature reliability testing method and device for servers, which includes: setting test time, interval time and test times for cyclic execution testing; setting temperature threshold corresponding to test temperature; using thermocouple wire to obtain the actual temperature of the chip surface of key components of the system and storing the actual temperature of the chip surface to log files; acquiring system gateway through BMC. The Tj temperature of key components is stored in the log file, and the high and low temperature reliability of the server is obtained by comparing the actual chip surface temperature and Tj temperature with the corresponding temperature threshold. By automatically reading the chip surface temperature and Tj temperature of the key components of the recording system and setting the temperature threshold, the automatic monitoring of the system temperature is realized after comparison, and the measured temperature is recorded, which is convenient for maintenance personnel to view.

【技术实现步骤摘要】
一种服务器高低温可靠性测试方法及装置
本专利技术属于服务器测试
,具体涉及一种服务器高低温可靠性测试方法及装置。
技术介绍
目前服务器的可靠性温度测试包含高低温交变湿热测试、高低温开关机和交变湿热存储等,已经成为可靠性测试工作的重中之重。在产品测试过程中,如何更好的分析和记录问题,是测试中的重要研究内容。由于这些可靠性温度测试经常需要手动观察数据和记录,并且手动切换测试压力脚本,所以经常需要测试人员实时观察记录测试结果和操作机器;当测试出现问题,经常需要进行手动查询以前的log档,但log档记录的信息不全面,测试人员无法做出全面判断,只能靠经验来进行判断。
技术实现思路
针对现有技术的不足,本专利技术提供一种服务器高低温可靠性测试方法及装置,以解决上述技术问题。第一方面,本申请实施例提供一种服务器高低温可靠性测试方法,所述方法包括:设置用于循环执行测试的测试时间、间隔时间和测试次数;设置测试温度对应的温度阈值;利用热偶线获取系统关键部件芯片表面实际温度并将所述芯片表面实际温度存储至日志文件;通过BMC获取系统关键部件的Tj温度并将所述Tj温度存储至日志文件;通过将芯片表面实际温度和本文档来自技高网...

【技术保护点】
1.一种服务器高低温可靠性测试方法,其特征在于,所述方法包括:设置用于循环执行测试的测试时间、间隔时间和测试次数;设置测试温度对应的温度阈值;利用热偶线获取系统关键部件芯片表面实际温度并将所述芯片表面实际温度存储至日志文件;通过BMC获取系统关键部件的Tj温度并将所述Tj温度存储至日志文件;通过将芯片表面实际温度和Tj温度与对应温度阈值对比获取服务器高低温可靠性。

【技术特征摘要】
1.一种服务器高低温可靠性测试方法,其特征在于,所述方法包括:设置用于循环执行测试的测试时间、间隔时间和测试次数;设置测试温度对应的温度阈值;利用热偶线获取系统关键部件芯片表面实际温度并将所述芯片表面实际温度存储至日志文件;通过BMC获取系统关键部件的Tj温度并将所述Tj温度存储至日志文件;通过将芯片表面实际温度和Tj温度与对应温度阈值对比获取服务器高低温可靠性。2.根据权利要求1所述的方法,其特征在于,所述设置用于循环执行测试的测试时间、间隔时间和测试次数包括:在测试时间内运行高温箱并对服务器进行加压,并在进入测试测试时间后立即执行对芯片表面实际温度和Tj温度的获取和对比;在间隔时间停止对服务器的测试操作;根据测试测试交替执行测试时间和间隔时间。3.根据权利要求1所述的方法,其特征在于,所述利用热偶线获取系统关键部件芯片表面实际温度包括:利用串口转RS32线缆将热偶线与服务器相连接;在测试时间内获取热偶线测得的芯片表面实际温度;以excel格式输出所述芯片表面实际温度。4.根据权利要求1所述的方法,其特征在于,所述通过BMC获取系统关键部件的Tj温度并将所述Tj温度存储至日志文件包括:通过BMC的ipmitool命令添加参数如0x040x2d0x“sensor地址”来获取Tj温度并通过命令awk'{printstrtonum("0x"$1)}'|head-n1将获取的16进制Tj温度数据转换为10进制数据;利用命令smartctl-a/dev/sdb|tail-n27|awk'{print$10}'|head-n1获取硬盘温度信息;通过根据nvqual生成的日志文件实时获取GPU相关数据,并通过命令GPU0_Temp=`cat/home/P100/results/mods_thermal*.log|tail-10|grepTemp|awk'{print$4}'|head-n1`GPU0_Power=`cat/home/P100/results/mods_thermal*.log|tail-5|grepTemp|awk'{print$5}'|head-n1`从所述GPU相关数据中筛选出GPU温度和功耗信息。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:通过BMC的ipmitool命令并设置相关参数实时获取风扇的转速。6.一种服务器高低温可靠性测试装置,其特征在于,所述装置包括:参数设置单元,配置用于设...

【专利技术属性】
技术研发人员:马壮高鹏
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1