【技术实现步骤摘要】
一种硬盘状态数据生成方法、系统、设备及介质
[0001]本专利技术属于计算机领域,具体涉及一种硬盘状态数据生成方法、系统、设备及介质。
技术介绍
[0002]在计算机领域,数据是信息系统的核心,其可用性是保证信息系统正常运行的关键。而磁盘是数据存储的载体,通常大规模的集成在存储系统中,由存储系统负责保存数据,提供数据访问接口,是信息系统的主要组成部分之一,其可靠性一直是研究人员与工业界关注的焦点。到目前为止,磁盘仍然是存储系统的核心组成部分。磁盘能否提供稳定可靠的数据访问能力,直接影响整个存储系统的可靠性。
[0003]传统的机械硬盘是磁、电和机械的混合体,其固有结构决定了磁盘本身的可靠性不高。根据统计,磁盘故障导致系统失效的比例达18.1%~49.1%。现有的大规模存储系统往往包含数百甚至数千块磁盘,大大增加了磁盘出现故障的几率。传统的提高数据可靠性的方法主要是冗余磁盘阵列RAID(Redundant Arrays of Inexpensice Disks)技术,通过采用数据冗余,容忍单个或多个磁盘的故障,并通过数 ...
【技术保护点】
【技术特征摘要】
1.一种硬盘状态数据生成方法,其特征在于,包括:获取多个硬盘的状态数据集,根据状态数据集中硬盘的状态将对应硬盘预定时间范围的状态数据进行标注;对标注过的硬盘的状态数据进行预处理得到训练数据集,基于所述训练数据集通过变分自编码算法训练硬盘状态数据生成模型;通过所述硬盘状态数据生成模型生成预定状态的硬盘状态数据。2.根据权利要求1所述的方法,其特征在于,所述对标注过的硬盘的状态数据进行预处理得到训练数据集包括:判断所述硬盘的状态数据中是否存在缺失数据,响应于存在缺失数据,基于预定时间范围内所述硬盘的历史状态数据通过预定算法进行预测,并将预测结果作为所述缺失的替代数据。3.根据权利要求1所述的方法,其特征在于,所述对标注过的硬盘的状态数据进行预处理得到训练数据集包括:对预定时间范围内的硬盘的状态数据中各个属性值基于时间维度进行分解得到多个分量数据,并根据经验法则对多个分量数据进行评估,将大于经验法则的状态数据作为异常值。4.根据权利要求1所述的方法,其特征在于,所述对标注过的硬盘的状态数据进行预处理得到训练数据集包括:根据硬盘的状态数据和所述状态数据对应的标注结果基于预定方式分析所述状态数据中各个属性与标注结果的相关性;基于所述相关性从所述硬盘的状态数据中筛选出与标注结果相关的属性。5.根据权利要求4所述的方法,其特征在于,所述根据硬盘的状态数据和所述状态数据对应的标注结果基于预定方式分析所述状态数据中各个属性与标注结果的相关性包括:通过趋势预测算法将预定时间范围内硬盘的每个属性对应的属性值进行拟合得到每个属性值对应的变化趋势线;基于每个属性的变化趋势线计算...
【专利技术属性】
技术研发人员:陈静静,孙华锦,
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。