【技术实现步骤摘要】
一种基于逻辑回归的两地三中心故障预测方法及系统
本专利技术属于存储快照
,具体涉及一种基于逻辑回归的两地三中心故障预测方法及系统。
技术介绍
LC,是localcopy的缩写,是本地备份。RC,是remotecopy的缩写,是远程备份。面对复杂的业务场景,传统的单数据中心方案和同城同步远程复制方案,已无法完成可靠的容灾。单数据中心方案,当数据中心存储故障后,可能会导致业务长时间中断,甚至数据丢失,造成不可估量的财产损失。同城同步远程复制方案,面对大的自然灾害时,同样容灾能力有限。综上所述,只做本地或同城的数据冗余保护及容灾建设,已不能规避区域性灾难对企业数据的破坏。远程容灾保护数据及保障业务连续性成为了企业亟待解决的问题。此外,企业在远程容灾建设中,也面临网络链路租赁费用高昂和网络带宽不够的问题。两地三中心,是指生产数据中心、同城灾备中心、异地灾备中心的建设方案。通过同步远程复制技术,将生产中的数据同步到同城灾备中心。通过异步远程复制技术,将同城灾备中心的数据复制到异地灾备中心。若生产中心发生灾难,可在同城灾备中心实现业务切换,并保持与异地灾备中心的容灾关系。若生产中心和同城灾备中心均发生灾难,可在异地灾备中心实现业务切换。级联是3DC容灾的实现方案之一,如附图2所示,级联方案涉及三个站点,site1、site2、site3,site1和site2是同城,site3是异地。site1是生产站点,内部包含一个卷,生产卷。site2是第一容灾站点,内部包含两个卷,第一容灾卷和快照卷A ...
【技术保护点】
1.一种基于逻辑回归的两地三中心故障预测方法,其特征在于,包括如下步骤:/nS1.获取原始样本,以两地三中心周期性同步过程各步骤的完成时长作为样本输入,以两地三中心整体故障与否状态作为样本输出,并标注故障样本与非故障样本;/nS2.对原始样本进行加工,获取两地三中心周期性同步过程中完成时长为0的步骤,记为异常步骤,将异常步骤在各样本中的对应步骤完成时长拟合成曲线,对异常步骤完成时长进行修正;/nS3.按照设定比例从加工后样本中进行训练样本抽取;/nS4.选择回归函数作为拟合函数,并通过代价函数对拟合函数进行评价,再通过代价函数计算出更新函数,以各样本的特征值作为输入,以各样本特征值的权重向量作为输出,进行迭代回归计算,最终得到样本特征值权重向量参数;/nS5.获取实时两地三中心同步的各步骤的完成时长数据,作为样本输入,通过样本特征值权重向量参数计算回归函数样本输出,对该实时两地三中心同步数据进行故障率预测。/n
【技术特征摘要】
1.一种基于逻辑回归的两地三中心故障预测方法,其特征在于,包括如下步骤:
S1.获取原始样本,以两地三中心周期性同步过程各步骤的完成时长作为样本输入,以两地三中心整体故障与否状态作为样本输出,并标注故障样本与非故障样本;
S2.对原始样本进行加工,获取两地三中心周期性同步过程中完成时长为0的步骤,记为异常步骤,将异常步骤在各样本中的对应步骤完成时长拟合成曲线,对异常步骤完成时长进行修正;
S3.按照设定比例从加工后样本中进行训练样本抽取;
S4.选择回归函数作为拟合函数,并通过代价函数对拟合函数进行评价,再通过代价函数计算出更新函数,以各样本的特征值作为输入,以各样本特征值的权重向量作为输出,进行迭代回归计算,最终得到样本特征值权重向量参数;
S5.获取实时两地三中心同步的各步骤的完成时长数据,作为样本输入,通过样本特征值权重向量参数计算回归函数样本输出,对该实时两地三中心同步数据进行故障率预测。
2.如权利要求1所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,两地三中心包括本地生产站点、本地容灾站点和异地容灾站点;本地生产站点上设置有生产卷,本地容灾站点上设置有第一容灾卷和第一快照卷,异地容灾站点上设置有第二容灾卷和第二快照卷;
第一容灾卷对生产卷内容进行同步远程复制,记录为RCx;
第一快照卷对第一容灾卷内容进行同城快照,记录为LCx;
第二容灾卷对第一快照卷内容进行异步远程复制,记录为RCy;
第二快照卷对第二容灾卷内容进行异地快照,记录为LCy。
3.如权利要求2所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,步骤S1具体步骤如下:
S11.记录同步远程复制RCx的完成时长t1、同城快照LCx的完成时长t2、异步远程复制RCy完成时长t3以及异地快照LCy完成时长t4,作为样本输入;
S12.以两地三中心整体故障与否状态作为样本输出,设置1表示故障,0表示未故障;
S13.通过两地三中心的周期性同步获取未故障样本;
S14.给两地三中心设定故障,获取故障样本;未故障样本及故障样本均包括样本输入和样本输出。
4.如权利要求1所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,步骤S2具体步骤如下:
S21.获取原始样本中两地三中心周期性同步过程中完成时长为0的步骤,记为异常步骤;
S22.获取各样本中与异常步骤对应的步骤的完成时长,将各完成时长拟合成高斯分布;
S23.通过极大似然估计将高斯分布中样本的置信区间小于设定值的完成时长去除,根据剩余的各完成时长对异常步骤的完成时长进行修正。
5.如权利要求1所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,步骤S3具体步骤如下:
S31.定义故障样本为正样本,未故障样本为负样本;
S32.从加工后的样本中交替选择正负样本,使得正负样本数量相同。
6.如权利要求1所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,步骤S4具体步骤如下:
S41.选择回归函数作为拟合函数,同时设定回归函数的激活函数,设定回归函数的输入为样本特征向量与样本特征值对应权重向量的乘积,设定回归函数的输出为故障样本概率;
S42.选择代价函数对回归函数的拟合进行评价,设定代价函数输入为各样本特征值及样本对应输出值,输出为拟合的评价;
S43.通过代价函数计算出更新函数,并通过迭代回归计算出样本特征值权重向量参数。
7.如权利要求6所述的基于逻辑回归的两地三中心故障预测方法,其特征在于,步骤S5具体步骤如下:
S51.获取实时两地三中心同步的各步骤的完成时长数据;
S52....
【专利技术属性】
技术研发人员:张振广,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。