一种基于ICC的数据一致性检验方法及系统技术方案

技术编号:26478415 阅读:35 留言:0更新日期:2020-11-25 19:22
本发明专利技术提供了一种基于ICC的数据一致性检验方法及系统,本发明专利技术不拘泥于普通的数据分块,提出了联合K‑means聚类、完备基、pca降维算法的数据分块算法,能够在数据量较大或分布式存储的情况,能够提取出有代表性的子数据,然后计算子数据的ICC组内相关系数,对数据进行快速一致性校验。本发明专利技术能够在数据量较大或分布式存储的情况下,对数据进行快速的一致性校验,能够有效保证数据备份和还原过程的数据安全;能够在内存数据的持久化、磁盘阵列器在系统崩溃、意外断电情况下的数据恢复等情况下进行数据的一致性校验,避免数据在持久化或恢复的过程中出现数据丢失而不自知的情况,能够有效保证数据的安全和完整性。

【技术实现步骤摘要】
一种基于ICC的数据一致性检验方法及系统
本专利技术涉及软件开发
,特别是一种基于ICC的数据一致性检验方法及系统。
技术介绍
在信息时代,数据是非常重要的一部分,数据安全更为重中之重,因此数据的备份与恢复尤为重要,例如在数据备份时,系统不能时刻监测数据的变化,会出现没有及时同步数据的情况,因此会进行数据的一致性校验,在数据不一致时进行同步处理。又例如内存数据的持久化需求,磁盘阵列器在早于系统崩溃、意外断电情况下的数据恢复等,都需要进行数据的一致性校验,避免数据在持久化或恢复的过程中出现数据丢失而不自知的情况,所以数据的一致性校验应用的非常广泛。当前,已经有较多的一致性检验方法存在,大多是将所有的数据逐条比对或将数据分块后逐块比对,这在数据量非常大或者分布式存储数据时是不现实的,非常的耗费时间和空间。
技术实现思路
本专利技术的目的是提供一种基于ICC的数据一致性检验方法及系统,旨在解决现有技术中数据逐条比对存在时间、空间耗费大的问题,实现对数据进行快速的一致性校验,有效保证数据备份和还原过程的数据安全。...

【技术保护点】
1.一种基于ICC的数据一致性检验方法,其特征在于,所述方法包括以下操作:/n将源数据X和备份数据或恢复数据Y同步进行K-means聚类,确定各自的类数和聚类中心点;/n对比类数和聚类中心点是否相同,若不同则返回不一致结果,若相同则继续对比数据;/n计算分类结果维数N,选出支持向量或完备基,任意源数据和备份数据或恢复数据都可由支持向量或完备基线性表示;/n计算各子块的ICC组内相关系数,如果系数为1则数据一致,完成数据一致性校验。/n

【技术特征摘要】
1.一种基于ICC的数据一致性检验方法,其特征在于,所述方法包括以下操作:
将源数据X和备份数据或恢复数据Y同步进行K-means聚类,确定各自的类数和聚类中心点;
对比类数和聚类中心点是否相同,若不同则返回不一致结果,若相同则继续对比数据;
计算分类结果维数N,选出支持向量或完备基,任意源数据和备份数据或恢复数据都可由支持向量或完备基线性表示;
计算各子块的ICC组内相关系数,如果系数为1则数据一致,完成数据一致性校验。


2.根据权利要求1所述的一种基于ICC的数据一致性检验方法,其特征在于,所述类数和聚类中心点依据以下公式确定:






当xsse与ysse最小时,K即为类数,mk为聚类中心点。


3.根据权利要求1所述的一种基于ICC的数据一致性检验方法,其特征在于,所述支持向量或完备基的维数需要降维时通过PCA降维方法进行处理:
计算n维向量{x1,x2,x3,...xk}的协方差矩阵C:
c=E[(X-E(X))(X-E(X))T]
计算协方差矩阵的特征值和特征向量,将特征向量按特征值大小从上到下按行排列,取前q行组成矩阵P,P*X即为降维到q维后的数据。


4.根据权利要求1所述的一种基于ICC的数据一致性检验方法,其特征在于,所述ICC组内相关系数的计算公式如下:



其中,xji、yji为第j个子块中的元素,为第j个子块的联合均值,Sxy2为第j个子块的联合方差。


5.一种基于ICC的数据一致性检验系统,其特征在于,所述系统包括:
分类模块,用于将源数据X和备份数据或恢复数据Y同步进行K-means聚类,确定各自的类数和聚类中心点;
初次比对模块,用于对比类数和聚类中心点是否...

【专利技术属性】
技术研发人员:张芳
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1