数据保护方法及装置、电子设备、计算机存储介质制造方法及图纸

技术编号:16886044 阅读:25 留言:0更新日期:2017-12-27 03:50
本发明专利技术公开了一种数据保护方法及装置、电子设备、计算机存储介质,其中,方法用于对任意两组数据进行比较,任意两组数据包括第一组数据和第二组数据,方法包括:分别获取存储第一组数据的第一可逆布隆过滤器和存储第二组数据的第二可逆布隆过滤器;将第一可逆布隆过滤器和第二可逆布隆过滤器进行位运算处理,得到第三可逆布隆过滤器;根据第三可逆布隆过滤器中各个区格的数值,得到第一组数据和第二组数据的比较结果。本发明专利技术在存储数据时性能开销小,不受待存储数据的数据量限制。在比较时,仅需要在对两组可逆布隆过滤器进行简单的位运算处理即可检测数据是否一致。

Data protection methods and devices, electronic devices, computer storage media

The invention discloses a data protection method and device, electronic equipment, computer storage medium, the method used to compare two sets of data for any arbitrary, two sets of data includes a first set of data and the data of the second groups. The method includes: obtain second reversible bloom filter stores a first set of data and the first reversible bloom filter second sets of data storage; the first reversible bloom filter and second bit reversible bloom filter processing, third reversible bloom filter; according to the value of each district third reversible bloom filter case, by comparison of the first set of data and second sets of data. The invention has small performance overhead when storing data, and is not limited by the amount of data to be stored. In comparison, only in the two groups of simple reversible bloom filter operations are consistent with the data processing can be detected.

【技术实现步骤摘要】
数据保护方法及装置、电子设备、计算机存储介质
本专利技术涉及数据安全领域,尤其涉及一种数据保护方法及装置、电子设备、计算机存储介质。
技术介绍
随着信息技术的不断发展和网络的普及,大数据技术已经应用至多个领域,并引起广泛关注。使保存的数据具有完整性和真实性是大数据技术能够被有效利用的重要保障。只有数据信息真实可靠,才能有效的提供可靠的信息支持。一旦数据信息被篡改为其他的信息,或者更危险的被篡改为病毒或木马时,不但会造成数据信息的无效,还有可能导致数据信息直接成为安全的威胁。尤其对如银行等金融类公司的敏感数据,一旦遭到攻击和篡改,使用篡改的数据进行生产会给用户造成难以估量的损失。现有技术一般采用如基于哈希函数对数据进行验证,先使用散列函数(HashFunction)把消息或数据压缩成摘要,缩小数据量,将数据的格式固定化。散列函数将数据顺序打乱重新混合,创建散列值指纹。使用该方法对数据进行验证时,将数据按一定顺序排序后,提取最初的哈希值,若与一段时间后重新提取数据的哈希值不同时,则验证该数据已经被改动过。或者利用梅克尔树(merkletree)对数据进行验证。首先为每一个区块去计算一个哈希值,然后将每两个相邻的区块的哈希值再次进行计算得出新的哈希值,以此向上类推,直至生成根节点的哈希值,从而生成一棵树的结构。梅克尔树即一棵身份证树。使用该方法在进行校验时,根据哈希值的不同,直接定位到被篡改的数据位置。在校验整个区块的所有数据是否未被篡改时,通过最顶端的根节点的哈希值进行验证即可。但采用现有技术时,都需要对大量的数据进行哈希运算,使得极其损耗性能。且在验证时只能得知数据一致或者不一致,而无法知晓其中具体被篡改的数据,更无法对被篡改的数据进行恢复。并且,现有技术无法在哈希运行的结果上进行增量运算。当数据发生更新,如添加了新数据,则之前生成的哈希运行结果均需要重新进行运算,重新计算得带整个哈希值或梅克尔树,效率不高。因此,需要一种从根本上可以检测数据的完整性与准确性的数据保护方法。
技术实现思路
本专利技术的专利技术目的是针对现有技术的缺陷,提供了一种数据保护方法及装置、电子设备、计算机存储介质,用于解决现有技术中数据保护存在的运算量大、性能消耗多、无法知晓具体被篡改数据、数据被篡改后无法恢复等问题。根据本专利技术的一个方面,提供了一种数据保护方法,方法用于对任意两组数据进行比较,任意两组数据包括第一组数据和第二组数据,包括:分别获取存储第一组数据的第一可逆布隆过滤器和存储第二组数据的第二可逆布隆过滤器;其中,第一可逆布隆过滤器和第二可逆布隆过滤器均包括预设数量的区格;将第一可逆布隆过滤器和第二可逆布隆过滤器进行位运算处理,得到第三可逆布隆过滤器;根据第三可逆布隆过滤器中各个区格的数值,得到第一组数据和第二组数据的比较结果。根据本专利技术的另一个方面,还提供了一种数据保护装置,装置用于对任意两组数据进行比较,任意两组数据包括第一组数据和第二组数据,包括:获取模块,用于分别获取存储第一组数据的第一可逆布隆过滤器和存储第二组数据的第二可逆布隆过滤器;其中,第一可逆布隆过滤器和第二可逆布隆过滤器均包括预设数量的区格;比较模块,用于将第一可逆布隆过滤器和第二可逆布隆过滤器进行位运算处理,得到第三可逆布隆过滤器;根据第三可逆布隆过滤器中各个区格的数值,得到第一组数据和第二组数据的比较结果。根据本专利技术的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述数据保护方法对应的操作。根据本专利技术的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述数据保护方法对应的操作。根据本专利技术提供的数据保护方法及装置、电子设备、计算机存储介质,利用可逆布隆过滤器对数据进行存储,在存储时可以无需使用复杂的密码学安全的哈希函数,以减小性能开销。同时,存储所使用的可逆布隆过滤器大小固定,与待存储数据的数据量大小无关,不受待存储数据的数据量限制。在对两组数据进行比较时,仅需要在对两组可逆布隆过滤器进行简单的位运算处理即可检测数据是否一致。进一步,本专利技术还可以检测出两组数据中具体的不同的数据值。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例的数据保护方法的流程示意图;图2示出了将数据存储至可逆布隆过滤器中对应区格的算法示意图;图3示出了数据存储至各个区格时数据值的示意图;图4示出了根据本专利技术另一个实施例的数据保护方法的流程示意图;图5a-图5e示出了两组数据存储至各个区格时的数据值及对第三可逆布隆过滤器进行操作后的数据值的示意图;图6示出了根据本专利技术一个实施例的数据保护装置的功能结构示意图;图7示出了根据本专利技术另一个实施例的数据保护装置的功能结构示意图;图8示出了根据本专利技术一个实施例的一种电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1示出了根据本专利技术一个实施例的数据保护方法的流程示意图,如图1所示,该方法具体包括如下步骤:步骤S101,分别获取存储第一组数据的第一可逆布隆过滤器和存储第二组数据的第二可逆布隆过滤器。本专利技术可以用于对任意两组数据进行比较,任意两组数据包括第一组数据和第二组数据。通过比较两组数据可以得到两组数据的比较结果。这两组数据可以为本地的两组数据,或者一组数据在本地存储,另一组数据存储在其他位置。当两组数据已经存储在其对应的可逆布隆过滤器中时,可以直接获取到其对应的可逆布隆过滤器,若两组数据的其中一组或两组数据都还没有存储到可逆布隆过滤器时,可以通过以下方式进行存储:首先,初始化一个可逆布隆过滤器。对每一组数据均初始化一个可逆布隆过滤器,如为第一组数据初始化一个第一可逆布隆过滤器,和/或为第二组数据初始化一个第二可逆布隆过滤器。每个可逆布隆过滤器均包括预设数量的区格,且两个可逆布隆过滤器的区格数量相同。每个区格中都包括了数据个数、数据值总和及哈希值总和。其中,数据个数、数据值总和及哈希值总和的初始值均为0。数据个数用于记录区格中存储的数据的总个数。其次,对一组数据中的所有数据均依次进行第一哈希运算,根据每个数据的第一哈希运算的结果,将每个数据依次存储至可逆布隆过滤器对应的区格。对一组数据中的所有数据依次进行第一哈希运算,其中,第一哈希运算包括预设数量的第一哈希函数。对每个数据均执行预设数量的第一哈希函数。预设数量可以根据实施情况进行设置。在本实施例中采用3个第一哈希函数,分别为Hk1、Hk2和Hk3。对每个数据分别执行Hk1、Hk2和Hk3,得到该数据对应的Hk1、Hk2和Hk3的3个本文档来自技高网
...
数据保护方法及装置、电子设备、计算机存储介质

【技术保护点】
一种数据保护方法,所述方法用于对任意两组数据进行比较,所述任意两组数据包括第一组数据和第二组数据,其特征在于,包括:分别获取存储第一组数据的第一可逆布隆过滤器和存储第二组数据的第二可逆布隆过滤器;其中,所述第一可逆布隆过滤器和第二可逆布隆过滤器均包括预设数量的区格;将所述第一可逆布隆过滤器和所述第二可逆布隆过滤器进行位运算处理,得到第三可逆布隆过滤器;根据所述第三可逆布隆过滤器中各个区格的数值,得到所述第一组数据和所述第二组数据的比较结果。

【技术特征摘要】
2017.06.26 CN 201710494146X1.一种数据保护方法,所述方法用于对任意两组数据进行比较,所述任意两组数据包括第一组数据和第二组数据,其特征在于,包括:分别获取存储第一组数据的第一可逆布隆过滤器和存储第二组数据的第二可逆布隆过滤器;其中,所述第一可逆布隆过滤器和第二可逆布隆过滤器均包括预设数量的区格;将所述第一可逆布隆过滤器和所述第二可逆布隆过滤器进行位运算处理,得到第三可逆布隆过滤器;根据所述第三可逆布隆过滤器中各个区格的数值,得到所述第一组数据和所述第二组数据的比较结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述第一组数据存储至所述第一可逆布隆过滤器和/或将所述第二组数据存储至所述第二可逆布隆过滤器;其中,将数据存储至可逆布隆过滤器进一步包括:初始化一个可逆布隆过滤器;对一组数据中的所有数据依次进行第一哈希运算,根据每个数据的第一哈希运算的结果,将每个数据依次存储至所述可逆布隆过滤器对应的区格。3.根据权利要求1所述的方法,其特征在于,所述区格中包括数据个数、数据值总和及哈希值总和;其中,所述数据个数、数据值总和及哈希值总和的初始值均为0。4.根据权利要求3所述的方法,其特征在于,所述第一哈希运算包括预设数量的第一哈希函数;所述对这组数据中的所有数据依次进行第一哈希运算,根据每个数据的第一哈希运算的结果,将每个数据依次存储至所述可逆布隆过滤器对应的区格进一步包括:对每个所述数据执行预设数量的第一哈希函数,得到该数据对应的预设数量的第一哈希值;根据所述预设数量的第一哈希值,将该数据存储至所述可逆布隆过滤器中所述第一哈希值对应的区格;其中,存储时将区格中数据个数的值加一;将区格中数据值总和更新为区格中原数据值总和与该数据进行按位异或后的数据值总和;将区格中哈希值总和更新为区格中原哈希值总和与该数据进行第二哈希运算得到的第二哈希值进行按位异或后的哈希值总和。5.根据权利要求4所述的方法,其特征在于,所述根据所述预设数量的第一哈希值,将该数据存储至所述可逆布隆过滤器中所述第一哈希值对应的区格进一步包括:将所述预设数量的第一哈希值按照所述可逆布隆过滤器的区格的预设数量进行取余运算,得到对应的余数;根据所述余数...

【专利技术属性】
技术研发人员:汪德嘉郭宇王少凡
申请(专利权)人:江苏通付盾科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1