【技术实现步骤摘要】
用于校验数据的方法和装置
本申请实施例涉及计算机
,具体涉及用于校验数据的方法和装置。
技术介绍
随着互联网技术的快速发展,每刻都会产生大量的数据,也会涉及大量数据的传输、存储等。而在数据的产生、传输和存储等过程中,会有各种各样的影响,有的影响会导致数据出现差错。因此,数据校验是常见的一种用于保证数据的完整性、一致性等的方法。在很多情况下,同一份数据会对应有多份存储。例如,服务端的一接口返回的数据集会同时同步到多个客户端。又例如,对于同一数据集,有时需要按照不同的存储方式、或使用不同的数据存储工具等分别进行存储。这些情况下,都会出现在不同位置存储有同一数据集。此时,如何校验这些不同位置处存储的数据集中的数据是否相同是需要考虑的一个问题。目前,常用的可以用于校验不同存储位置的多个数据集的一致性的校验方法包括直接校验和校验和。其中,直接校验就是将多个数据集直接进行一一比较。校验和是利用消息摘要算法等算法对多个数据集分别进行处理,并通过判断多个数据集分别对应的散列值是否相同来校验多个数据集的一致性。
技术实现思路
本申请实施例提出了用于校验数据的方法和装置。第一方面,本申请实施例提供了一种用于校验数据的方法,该方法包括:获取待校验的第一数据集和第二数据集,其中,第一数据集中的数据和第二数据集中的数据一一对应;根据第一数据集和第二数据集,生成第一字符串集和第二字符串集,其中,第一字符串集中的字符串包含第一数据集中的数据,第二字符串集中的字符串包含第二数据集中的数据,且第一字符串集中的字符串与第二字符串集中的字符串一一对应,且对应的两个字符串包含的数据一一对应且排 ...
【技术保护点】
1.一种用于校验数据的方法,包括:获取待校验的第一数据集和第二数据集,其中,所述第一数据集中的数据和所述第二数据集中的数据一一对应;根据所述第一数据集和第二数据集,生成第一字符串集和第二字符串集,其中,所述第一字符串集中的字符串包含所述第一数据集中的数据,所述第二字符串集中的字符串包含所述第二数据集中的数据,且所述第一字符串集中的字符串与所述第二字符串集中的字符串一一对应,且对应的两个字符串包含的数据一一对应且排列顺序一致;基于所述第一字符串集和所述第二字符串集,确定所述第一数据集和所述第二数据集是否相同,以及输出用于表示所述第一数据集和所述第二数据集是否相同的校验结果信息。
【技术特征摘要】
1.一种用于校验数据的方法,包括:获取待校验的第一数据集和第二数据集,其中,所述第一数据集中的数据和所述第二数据集中的数据一一对应;根据所述第一数据集和第二数据集,生成第一字符串集和第二字符串集,其中,所述第一字符串集中的字符串包含所述第一数据集中的数据,所述第二字符串集中的字符串包含所述第二数据集中的数据,且所述第一字符串集中的字符串与所述第二字符串集中的字符串一一对应,且对应的两个字符串包含的数据一一对应且排列顺序一致;基于所述第一字符串集和所述第二字符串集,确定所述第一数据集和所述第二数据集是否相同,以及输出用于表示所述第一数据集和所述第二数据集是否相同的校验结果信息。2.根据权利要求1所述的方法,其中,所述第一数据集和第二数据集通过如下步骤确定:根据预设的查询条件,在第一目标数据库中进行查询,得到返回的第一记录集,以及根据所述查询条件,在第二目标数据库中进行查询,得到返回的第二记录集;响应于确定所述第一记录集包含的记录的数目和所述第二记录集包含的记录的数目相同,确定所述第一记录集作为所述第一数据集,以及确定所述第二记录集作为所述第二数据集。3.根据权利要求1所述的方法,其中,所述根据所述第一数据集和第二数据集,生成第一字符串集和第二字符串集,包括:将所述第一数据集中的数据按照预设的排列顺序依次拼接得到第一字符串,以及确定所述第一字符串作为所述第一字符串集;将所述第二数据集中的数据按照与所述排列顺序对应的排列顺序依次拼接得到第二字符串,以及确定所述第二字符串作为所述第二字符串集。4.根据权利要求1所述的方法,其中,所述根据所述第一数据集和第二数据集,生成第一字符串集和第二字符串集,包括:将所述第一数据集中的数据按照预设的排列顺序依次拼接得到第一字符串,以及将所述第二数据集中的数据按照与所述排列顺序对应的排列顺序依次拼接得到第二字符串;在所述第一字符串包含的每两个数据之间插入预设字符,以及将得到的新的第一字符串确定为所述第一字符串集;在所述第二字符串包含的每两个数据之间插入所述预设字符,以及将得到的新的第二字符串确定为所述第二字符串集。5.根据权利要求1所述的方法,其中,所述根据所述第一数据集和第二数据集,生成第一字符串集和第二字符串集,包括:将所述第一数据集和所述第二数据集分别拆分为至少两个数据子集,其中,所述第一数据集的至少两个数据子集中的数据子集与所述第二数据集的至少两个数据子集中的数据子集一一对应,且对应的两个数据子集包含的数据一一对应;对于所述第一数据集的至少两个数据子集中的数据子集,根据该数据子集,生成该数据子集的第一字符串;对于所述第二数据集的至少两个数据子集中的数据子集,根据该数据子集,生成该数据子集的第二字符串;利用所述第一数据集的至少两个数据子集中的数据子集分别对应的第一字符串,组成所述第一字符串集,以及利用所述第二数据集的至少两个数据子集中的数据子集分别对应的第二字符串,组成所述第二字符串集。6.根据权利要...
【专利技术属性】
技术研发人员:徐飞,
申请(专利权)人:上海掌门科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。