一种基于二进制哈希的快速数据校验方法及系统技术方案

技术编号:40759747 阅读:41 留言:0更新日期:2024-03-25 20:12
本发明专利技术提供一种基于二进制哈希的快速数据校验方法及系统,方法包括:通过数据分块器使用动态分块算法分别处理源数据和目标数据,分别评估源数据和目标数据的数据集整体大小和复杂度,根据关键参数确定每个数据块的最优大小,将源数据和目标数据分别分解为多个数据块;对源数据和目标数据每个数据块分别使用哈希计算器计算哈希值;将计算出的哈希值分别存储在源数据和目标数据的哈希列表中;使用校验器比较源数据的哈希列表和目标数据的哈希列表,保证数据完整性和准确性。本发明专利技术基于二进制哈希的快速数据校验方法及系统通过数据分块技术,能够有效处理大型数据集,大大提高了数据校验速率;并且减少了计算和存储开销,有效提升数据校验的效率。

【技术实现步骤摘要】

本专利技术涉及大数据;特别地,涉及数据库etl过程中的快速数据校验;具体而言,涉及一种基于二进制哈希的快速数据校验方法及系统


技术介绍

1、随着现代企业业务的数字化转型技术的迅速演进,数据已经成为企业最宝贵的资产之一。

2、数据量的爆炸性增长,尤其在社交媒体、金融交易、物联网和各种在线业务中,使得数据校验成为数据提取、转换和加载(etl)过程中的一个至关重要的步骤。

3、对于任何依赖数据的决策、分析和操作,确保数据的完整性、准确性和一致性都是至关重要的。

4、然而,传统的数据校验方法,如完整数据比较、行级比较等,在大数据的背景下,需要大量的计算资源和时间,在处理大数据时的效率较为低下。

5、此外,当数据量达到tb或pb级别时,如要完整地读取和比较数据,不仅变得效率低下,而且经常是不切实际的。

6、因此,当前亟需设计一种能够快速、高效地校验大量数据的方法,以解决现有技术的上述难点问题。


技术实现思路

1、鉴于此,本专利技术的第一目的在于设计一种基于二本文档来自技高网...

【技术保护点】

1.一种基于二进制哈希的快速数据校验方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于二进制哈希的快速数据校验方法,其特征在于,所述S1步骤的所述关键参数包括:

3.根据权利要求1所述的基于二进制哈希的快速数据校验方法,其特征在于,所述S4步骤的使用校验器比较源数据的哈希列表和目标数据的哈希列表的方法包括:

4.根据权利要求3所述的基于二进制哈希的快速数据校验方法,其特征在于,对于每个检测到的两个列表中相应位置的哈希值不一致的情况,由校验器记录以下信息:

5.根据权利要求4所述的基于二进制哈希的快速数据校验方法,其特征在于,对于...

【技术特征摘要】

1.一种基于二进制哈希的快速数据校验方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于二进制哈希的快速数据校验方法,其特征在于,所述s1步骤的所述关键参数包括:

3.根据权利要求1所述的基于二进制哈希的快速数据校验方法,其特征在于,所述s4步骤的使用校验器比较源数据的哈希列表和目标数据的哈希列表的方法包括:

4.根据权利要求3所述的基于二进制哈希的快速数据校验方法,其特征在于,对于每个检测到的两个列表中相应位置的哈希值不一致的情况,由校验器记录以下信息:

5.根据权利要求4所述的基于二进制哈希的快速数据校验方法,其特征在于,对于每个检测到的两个列表中相应位置的哈希值不一致的情况,由校验器生成详细的错误报告,所述错误报告包括:

<...

【专利技术属性】
技术研发人员:钟浩邹昌根吴汉楚
申请(专利权)人:上海掌数科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1