【技术实现步骤摘要】
一种基于ICC的数据一致性检验方法及系统
本专利技术涉及软件开发
,特别是一种基于ICC的数据一致性检验方法及系统。
技术介绍
在信息时代,数据是非常重要的一部分,数据安全更为重中之重,因此数据的备份与恢复尤为重要,例如在数据备份时,系统不能时刻监测数据的变化,会出现没有及时同步数据的情况,因此会进行数据的一致性校验,在数据不一致时进行同步处理。又例如内存数据的持久化需求,磁盘阵列器在早于系统崩溃、意外断电情况下的数据恢复等,都需要进行数据的一致性校验,避免数据在持久化或恢复的过程中出现数据丢失而不自知的情况,所以数据的一致性校验应用的非常广泛。当前,已经有较多的一致性检验方法存在,大多是将所有的数据逐条比对或将数据分块后逐块比对,这在数据量非常大或者分布式存储数据时是不现实的,非常的耗费时间和空间。
技术实现思路
本专利技术的目的是提供一种基于ICC的数据一致性检验方法及系统,旨在解决现有技术中数据逐条比对存在时间、空间耗费大的问题,实现对数据进行快速的一致性校验,有效保证数据备份和还原过
【技术保护点】
1.一种基于ICC的数据一致性检验方法,其特征在于,所述方法包括以下操作:/n将源数据X和备份数据或恢复数据Y同步进行K-means聚类,确定各自的类数和聚类中心点;/n对比类数和聚类中心点是否相同,若不同则返回不一致结果,若相同则继续对比数据;/n计算分类结果维数N,选出支持向量或完备基,任意源数据和备份数据或恢复数据都可由支持向量或完备基线性表示;/n计算各子块的ICC组内相关系数,如果系数为1则数据一致,完成数据一致性校验。/n
【技术特征摘要】
1.一种基于ICC的数据一致性检验方法,其特征在于,所述方法包括以下操作:
将源数据X和备份数据或恢复数据Y同步进行K-means聚类,确定各自的类数和聚类中心点;
对比类数和聚类中心点是否相同,若不同则返回不一致结果,若相同则继续对比数据;
计算分类结果维数N,选出支持向量或完备基,任意源数据和备份数据或恢复数据都可由支持向量或完备基线性表示;
计算各子块的ICC组内相关系数,如果系数为1则数据一致,完成数据一致性校验。
2.根据权利要求1所述的一种基于ICC的数据一致性检验方法,其特征在于,所述类数和聚类中心点依据以下公式确定:
当xsse与ysse最小时,K即为类数,mk为聚类中心点。
3.根据权利要求1所述的一种基于ICC的数据一致性检验方法,其特征在于,所述支持向量或完备基的维数需要降维时通过PCA降维方法进行处理:
计算n维向量{x1,x2,x3,...xk}的协方差矩阵C:
c=E[(X-E(X))(X-E(X))T]
计算协方差矩阵的特征值和特征向量,将特征向量按特征值大小从上到下按行排列,取前q行组成矩阵P,P*X即为降维到q维后的数据。
4.根据权利要求1所述的一种基于ICC的数据一致性检验方法,其特征在于,所述ICC组内相关系数的计算公式如下:
其中,xji、yji为第j个子块中的元素,为第j个子块的联合均值,Sxy2为第j个子块的联合方差。
5.一种基于ICC的数据一致性检验系统,其特征在于,所述系统包括:
分类模块,用于将源数据X和备份数据或恢复数据Y同步进行K-means聚类,确定各自的类数和聚类中心点;
初次比对模块,用于对比类数和聚类中心点是否...
【专利技术属性】
技术研发人员:张芳,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。