【技术实现步骤摘要】
本专利技术涉及大数据;特别地,涉及数据库etl过程中的快速数据校验;具体而言,涉及一种基于二进制哈希的快速数据校验方法及系统。
技术介绍
1、随着现代企业业务的数字化转型技术的迅速演进,数据已经成为企业最宝贵的资产之一。
2、数据量的爆炸性增长,尤其在社交媒体、金融交易、物联网和各种在线业务中,使得数据校验成为数据提取、转换和加载(etl)过程中的一个至关重要的步骤。
3、对于任何依赖数据的决策、分析和操作,确保数据的完整性、准确性和一致性都是至关重要的。
4、然而,传统的数据校验方法,如完整数据比较、行级比较等,在大数据的背景下,需要大量的计算资源和时间,在处理大数据时的效率较为低下。
5、此外,当数据量达到tb或pb级别时,如要完整地读取和比较数据,不仅变得效率低下,而且经常是不切实际的。
6、因此,当前亟需设计一种能够快速、高效地校验大量数据的方法,以解决现有技术的上述难点问题。
技术实现思路
1、鉴于此,本专利技术的第一目
...【技术保护点】
1.一种基于二进制哈希的快速数据校验方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于二进制哈希的快速数据校验方法,其特征在于,所述S1步骤的所述关键参数包括:
3.根据权利要求1所述的基于二进制哈希的快速数据校验方法,其特征在于,所述S4步骤的使用校验器比较源数据的哈希列表和目标数据的哈希列表的方法包括:
4.根据权利要求3所述的基于二进制哈希的快速数据校验方法,其特征在于,对于每个检测到的两个列表中相应位置的哈希值不一致的情况,由校验器记录以下信息:
5.根据权利要求4所述的基于二进制哈希的快速数据校验方
...【技术特征摘要】
1.一种基于二进制哈希的快速数据校验方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于二进制哈希的快速数据校验方法,其特征在于,所述s1步骤的所述关键参数包括:
3.根据权利要求1所述的基于二进制哈希的快速数据校验方法,其特征在于,所述s4步骤的使用校验器比较源数据的哈希列表和目标数据的哈希列表的方法包括:
4.根据权利要求3所述的基于二进制哈希的快速数据校验方法,其特征在于,对于每个检测到的两个列表中相应位置的哈希值不一致的情况,由校验器记录以下信息:
5.根据权利要求4所述的基于二进制哈希的快速数据校验方法,其特征在于,对于每个检测到的两个列表中相应位置的哈希值不一致的情况,由校验器生成详细的错误报告,所述错误报告包括:
<...【专利技术属性】
技术研发人员:钟浩,邹昌根,吴汉楚,
申请(专利权)人:上海掌数科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。