一种基于逻辑回归的两地三中心故障预测方法及系统技术方案

技术编号:25891254 阅读:45 留言:0更新日期:2020-10-09 23:33
本发明专利技术提供一种基于逻辑回归的两地三中心故障预测方法及系统,所述方法步骤如下:获取原始样本,获取样本输入及样本输出,并标注故障样本与非故障样本;对原始样本进行加工,获取两地三中心周期性同步过程中异常步骤,并对异常步骤完成时长进行修正;按照设定比例从加工后样本中进行训练样本抽取;通过代价函数对拟合函数进行评价,再通过代价函数计算出更新函数,以各样本的特征值作为输入,以各样本特征值的权重向量作为输出,进行迭代回归计算,最终得到样本特征值权重向量参数;获取实时两地三中心同步的各步骤的完成时长数据,作为样本输入,通过样本特征值权重向量参数计算回归函数样本输出,对该实时两地三中心同步数据进行故障率预测。

【技术实现步骤摘要】
一种基于逻辑回归的两地三中心故障预测方法及系统
本专利技术属于存储快照
,具体涉及一种基于逻辑回归的两地三中心故障预测方法及系统。
技术介绍
LC,是localcopy的缩写,是本地备份。RC,是remotecopy的缩写,是远程备份。面对复杂的业务场景,传统的单数据中心方案和同城同步远程复制方案,已无法完成可靠的容灾。单数据中心方案,当数据中心存储故障后,可能会导致业务长时间中断,甚至数据丢失,造成不可估量的财产损失。同城同步远程复制方案,面对大的自然灾害时,同样容灾能力有限。综上所述,只做本地或同城的数据冗余保护及容灾建设,已不能规避区域性灾难对企业数据的破坏。远程容灾保护数据及保障业务连续性成为了企业亟待解决的问题。此外,企业在远程容灾建设中,也面临网络链路租赁费用高昂和网络带宽不够的问题。两地三中心,是指生产数据中心、同城灾备中心、异地灾备中心的建设方案。通过同步远程复制技术,将生产中的数据同步到同城灾备中心。通过异步远程复制技术,将同城灾备中心的数据复制到异地灾备中心。若生产中心发生灾难,可在同城灾备中心实现业务切换,并保持与异地灾备中心的容灾关系。若生产中心和同城灾备中心均发生灾难,可在异地灾备中心实现业务切换。级联是3DC容灾的实现方案之一,如附图2所示,级联方案涉及三个站点,site1、site2、site3,site1和site2是同城,site3是异地。site1是生产站点,内部包含一个卷,生产卷。site2是第一容灾站点,内部包含两个卷,第一容灾卷和快照卷A,两者之间建立快照关系LCx。site3是第二容灾站点,内部包含两个卷,第二容灾卷和快照卷B,两者之间建立快照关系LCy。site1的生产卷和site2的第一容灾卷之间建立同步远程复制关系RCx。site2的快照卷A和site3的第二容灾卷之间建立异步远程复制关系RCy。为保证三个站点间的数据同步,需进行周期性同步,流程如下:a)登录site1,启动远程复制关系RCx,并等待RCx完成。b)登录site2,启动快照关系LCx,并等待LCx完成。c)登录site2,启动远程复制关系RCy,并等待RCy完成。d)登录site3,启动快照关系LCy,并等待LCy完成。两地三中心级联方案在周期性同步过程中,由于各种原因可能会导致同步过程阻塞或运行停止,具体表现为RCx、LCx、RCy、LCy四个关系运行很长时间得不到完成。究其原因,主要涉及两个方面,其一存储宕机,其二存储缺陷。发现同步故障和解决同步故障成为运维人员的主要工作,一般来说,发现故障的主要手段是被动发现,当同步过程长时间未完成时,运维人员登录存储,查看同步过程的运行阶段,从而判断是否发生故障。上述故障发现的缺点是,缺乏智能,需要运维人员时刻观察同步过程,并介入检查以确定是否发生故障。此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种基于逻辑回归的两地三中心故障预测方法及系统,是非常有必要的。
技术实现思路
针对现有技术的上述现有两地三中心级联的方案发生存储故障时,需要运维人员被动发现,缺乏智能的缺陷,本专利技术提供一种基于逻辑回归的两地三中心故障预测方法及系统,以解决上述技术问题。第一方面,本专利技术提供一种基于逻辑回归的两地三中心故障预测方法,包括如下步骤:S1.获取原始样本,以两地三中心周期性同步过程各步骤的完成时长作为样本输入,以两地三中心整体故障与否状态作为样本输出,并标注故障样本与非故障样本;S2.对原始样本进行加工,获取两地三中心周期性同步过程中完成时长为0的步骤,记为异常步骤,将异常步骤在各样本中的对应步骤完成时长拟合成曲线,对异常步骤完成时长进行修正;S3.按照设定比例从加工后样本中进行训练样本抽取;S4.选择回归函数作为拟合函数,并通过代价函数对拟合函数进行评价,再通过代价函数计算出更新函数,以各样本的特征值作为输入,以各样本特征值的权重向量作为输出,进行迭代回归计算,最终得到样本特征值权重向量参数;S5.获取实时两地三中心同步的各步骤的完成时长数据,作为样本输入,通过样本特征值权重向量参数计算回归函数样本输出,对该实时两地三中心同步数据进行故障率预测。进一步地,两地三中心包括本地生产站点、本地容灾站点和异地容灾站点;本地生产站点上设置有生产卷,本地容灾站点上设置有第一容灾卷和第一快照卷,异地容灾站点上设置有第二容灾卷和第二快照卷;第一容灾卷对生产卷内容进行同步远程复制,记录为RCx;第一快照卷对第一容灾卷内容进行同城快照,记录为LCx;第二容灾卷对第一快照卷内容进行异步远程复制,记录为RCy;第二快照卷对第二容灾卷内容进行异地快照,记录为LCy。进一步地,步骤S1具体步骤如下:S11.记录同步远程复制RCx的完成时长t1、同城快照LCx的完成时长t2、异步远程复制RCy完成时长t3以及异地快照LCy完成时长t4,作为样本输入;S12.以两地三中心整体故障与否状态作为样本输出,设置1表示故障,0表示未故障;S13.通过两地三中心的周期性同步获取未故障样本;S14.给两地三中心设定故障,获取故障样本;未故障样本及故障样本均包括样本输入和样本输出。进一步地,步骤S2具体步骤如下:S21.获取原始样本中两地三中心周期性同步过程中完成时长为0的步骤,记为异常步骤;S22.获取各样本中与异常步骤对应的步骤的完成时长,将各完成时长拟合成高斯分布;S23.通过极大似然估计将高斯分布中样本的置信区间小于设定值的完成时长去除,根据剩余的各完成时长对异常步骤的完成时长进行修正。进一步地,步骤S3具体步骤如下:S31.定义故障样本为正样本,未故障样本为负样本;S32.从加工后的样本中交替选择正负样本,使得正负样本数量相同。实现正负样本比例均衡,保证预测的准确性。进一步地,步骤S4具体步骤如下:S41.选择回归函数作为拟合函数,同时设定回归函数的激活函数,设定回归函数的输入为样本特征向量与样本特征值对应权重向量的乘积,设定回归函数的输出为故障样本概率;S42.选择代价函数对回归函数的拟合进行评价,设定代价函数输入为各样本特征值及样本对应输出值,输出为拟合的评价;S43.通过代价函数计算出更新函数,并通过迭代回归计算出样本特征值权重向量参数。进一步地,步骤S5具体步骤如下:S51.获取实时两地三中心同步的各步骤的完成时长数据;S52.将各步骤的完成时长数据,结合样本特征值权重向量参数作为输入,再通过回归函数计算出样本故障概率;S53.根据样本故障概率判断该实时两地三中心同步是否发生故障。第二方面,本专利技术提供一种基于逻辑回归的两地三中心故障预测系统,包括:原始样本获取模块,用于获取原始样本,以两地三中心周期性同步过程各步骤的完成时长作为样本输入,以两地三中心整体本文档来自技高网
...

【技术保护点】
1.一种基于逻辑回归的两地三中心故障预测方法,其特征在于,包括如下步骤:/nS1.获取原始样本,以两地三中心周期性同步过程各步骤的完成时长作为样本输入,以两地三中心整体故障与否状态作为样本输出,并标注故障样本与非故障样本;/nS2.对原始样本进行加工,获取两地三中心周期性同步过程中完成时长为0的步骤,记为异常步骤,将异常步骤在各样本中的对应步骤完成时长拟合成曲线,对异常步骤完成时长进行修正;/nS3.按照设定比例从加工后样本中进行训练样本抽取;/nS4.选择回归函数作为拟合函数,并通过代价函数对拟合函数进行评价,再通过代价函数计算出更新函数,以各样本的特征值作为输入,以各样本特征值的权重向量作为输出,进行迭代回归计算,最终得到样本特征值权重向量参数;/nS5.获取实时两地三中心同步的各步骤的完成时长数据,作为样本输入,通过样本特征值权重向量参数计算回归函数样本输出,对该实时两地三中心同步数据进行故障率预测。/n

【技术特征摘要】
1.一种基于逻辑回归的两地三中心故障预测方法,其特征在于,包括如下步骤:
S1.获取原始样本,以两地三中心周期性同步过程各步骤的完成时长作为样本输入,以两地三中心整体故障与否状态作为样本输出,并标注故障样本与非故障样本;
S2.对原始样本进行加工,获取两地三中心周期性同步过程中完成时长为0的步骤,记为异常步骤,将异常步骤在各样本中的对应步骤完成时长拟合成曲线,对异常步骤完成时长进行修正;
S3.按照设定比例从加工后样本中进行训练样本抽取;
S4.选择回归函数作为拟合函数,并通过代价函数对拟合函数进行评价,再通过代价函数计算出更新函数,以各样本的特征值作为输入,以各样本特征值的权重向量作为输出,进行迭代回归计算,最终得到样本特征值权重向量参数;
S5.获取实时两地三中心同步的各步骤的完成时长数据,作为样本输入,通过样本特征值权重向量参数计算回归函数样本输出,对该实时两地三中心同步数据进行故障率预测。


2.如权利要求1所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,两地三中心包括本地生产站点、本地容灾站点和异地容灾站点;本地生产站点上设置有生产卷,本地容灾站点上设置有第一容灾卷和第一快照卷,异地容灾站点上设置有第二容灾卷和第二快照卷;
第一容灾卷对生产卷内容进行同步远程复制,记录为RCx;
第一快照卷对第一容灾卷内容进行同城快照,记录为LCx;
第二容灾卷对第一快照卷内容进行异步远程复制,记录为RCy;
第二快照卷对第二容灾卷内容进行异地快照,记录为LCy。


3.如权利要求2所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,步骤S1具体步骤如下:
S11.记录同步远程复制RCx的完成时长t1、同城快照LCx的完成时长t2、异步远程复制RCy完成时长t3以及异地快照LCy完成时长t4,作为样本输入;
S12.以两地三中心整体故障与否状态作为样本输出,设置1表示故障,0表示未故障;
S13.通过两地三中心的周期性同步获取未故障样本;
S14.给两地三中心设定故障,获取故障样本;未故障样本及故障样本均包括样本输入和样本输出。


4.如权利要求1所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,步骤S2具体步骤如下:
S21.获取原始样本中两地三中心周期性同步过程中完成时长为0的步骤,记为异常步骤;
S22.获取各样本中与异常步骤对应的步骤的完成时长,将各完成时长拟合成高斯分布;
S23.通过极大似然估计将高斯分布中样本的置信区间小于设定值的完成时长去除,根据剩余的各完成时长对异常步骤的完成时长进行修正。


5.如权利要求1所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,步骤S3具体步骤如下:
S31.定义故障样本为正样本,未故障样本为负样本;
S32.从加工后的样本中交替选择正负样本,使得正负样本数量相同。


6.如权利要求1所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,步骤S4具体步骤如下:
S41.选择回归函数作为拟合函数,同时设定回归函数的激活函数,设定回归函数的输入为样本特征向量与样本特征值对应权重向量的乘积,设定回归函数的输出为故障样本概率;
S42.选择代价函数对回归函数的拟合进行评价,设定代价函数输入为各样本特征值及样本对应输出值,输出为拟合的评价;
S43.通过代价函数计算出更新函数,并通过迭代回归计算出样本特征值权重向量参数。


7.如权利要求6所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,步骤S5具体步骤如下:
S51.获取实时两地三中心同步的各步骤的完成时长数据;
S52....

【专利技术属性】
技术研发人员:张振广
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1