【技术实现步骤摘要】
模型训练方法、磁盘故障预测方法、相关装置及设备
[0001]本申请涉及深度学习
,尤其涉及一种模型训练方法
、
磁盘故障预测方法
、
相关装置及设备
。
技术介绍
[0002]目前,一块磁盘
(
也可以称为硬盘
)
的生命周期通常为三到五年,并通常在使用两年后故障率明显升高,磁盘故障会导致用户数据丢失或损坏,系统读写性能降低,严重时还会导致系统故障和
/
或业务中断,造成极大的经济损失
。
据统计,在服务器硬件故障中,磁盘故障占比达到
48
%以上,是影响服务器运行可靠性的主要因素
。
[0003]相关技术中,磁盘厂商可以采用自监测分析和报告技术
(SMART
,
Self
‑
Monitoring Analysis and Reporting Technology)
来监测磁盘的健康状态,并可以基于特定的设计规则制定故障检测手段来检测磁 ...
【技术保护点】
【技术特征摘要】
1.
一种模型训练方法,其特征在于,包括:确定训练数据集,所述训练数据集包含多个样本及每个样本对应的标签,所述样本包括一块磁盘在第一日期的时序数据,所述时序数据与所述磁盘的
M
个自我监测分析和报告技术
SMART
指标关联,所述标签表征所述磁盘在所述第一日期后的
N
天内是否发生故障,
M
和
N
为大于0的整数;利用所述训练数据集,训练基于因果卷积结构的第一模型,所述第一模型用于预测目标磁盘在
N
天内是否发生故障
。2.
根据权利要求1所述的方法,其特征在于,所述确定训练数据集,包括:确定多个候选
SMART
指标及每个候选
SMART
指标关联的时序数据集;基于每个候选
SMART
指标关联的时序数据集,确定每个候选
SMART
指标的交叉熵,确定的交叉熵表征候选
SMART
指标关联的故障磁盘的时序数据与健康磁盘的时序数据之间的相似性;根据确定的每个候选
SMART
指标的交叉熵,从所述多个候选
SMART
指标中选择所述
M
个
SMART
指标;基于所述
M
个
SMART
指标中的每个
SMART
指标关联的时序数据集,确定所述训练数据集
。3.
根据权利要求2所述的方法,其特征在于,确定所述训练数据集时,所述方法还包括:将与健康磁盘关联的每个样本均确定为负样本;针对与故障磁盘关联的每个样本,确定样本对应的第二日期和所述第一日期之间间隔的天数,所述第二日期是磁盘发生故障的日期;在确定的天数小于或等于
N
的情况下,将样本确定为正样本;在确定的天数大于
N
的情况下,将样本确定为负样本;其中,所述负样本的标签表征对应磁盘在所述第一日期后的
N
天内未发生故障,所述正样本的标签表征对应磁盘在所述第一日期后的
N
天内发生故障
。4.
根据权利要求1至3任一项所述的方法,其特征在于,所述第一模型包含第一模块
、
第二模块和第三模块,所述第一模块用于对输入样本的时序特征进行标准卷积,所述第二模块用于对所述第一模块输出的标准卷积结果进行空洞卷积,所述第三模块用于基于所述第二模块输出的空洞卷积结果确定对应磁盘在所述第一日期后的
N
天内发生故障的概率,所述第一模块
、
第二模块和第三模块形成因果卷积结构;所述利用所述训练数据集,训...
【专利技术属性】
技术研发人员:王雄,曹紫莹,许云中,高志军,陈晓帆,周旭,
申请(专利权)人:深信服科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。