面向云存储的抗边信道攻击跨用户广义去重方法及装置制造方法及图纸

技术编号:33632473 阅读:18 留言:0更新日期:2022-06-02 01:38
本发明专利技术提出一种基于面向云存储的抗边信道攻击跨用户广义去重方法及装置,其中包括:将待去重文件在字节级分解为基和偏移量,通过连续相同基压缩技术提取初步模板,采用内容分块策略CDC将初步模板分解为可变长数据块,在块级生成相应的基集;使用后缀数组算法对基集进行重复模式消除,获得数据块的最终模板;其中,根据基集的加密哈希值得到标签集;将标签集以及对应的偏移量集作为去重请求上传云服务器,以通过云服务器对基执行源端去重,并对偏移量集执行目标端去重;存储非重复偏移量,将非重复基添加到文件字典中,建立基和偏移量的对应关系。在保证效率的情况下实现了跨用户去重的安全性。去重的安全性。去重的安全性。

【技术实现步骤摘要】
面向云存储的抗边信道攻击跨用户广义去重方法及装置


[0001]本专利技术属于云存储领域。

技术介绍

[0002]在大数据的时代背景下,云存储作为一种新兴技术手段,通过虚拟化技术将多个云服务器组合在一起,用于存储和管理数据
[1]。然而,大量冗余随之产生。根据微软的调查,互联网中近40%的个人数据是重复的,而对于多用户共享数据,这一比例高达68%。这不可避免地给云服务提供商带来了额外的存储和管理开销,同时增加了用户的通信负担,从而极大影响了云存储效率和用户体验感。
[0003]跨用户去重是解决上述问题的有效方法。它通过云端返回确定响应来阻止后续重复数据上传。具体来讲,用户上传数据之前,首先上传对应标签信息,由CSP通过比较查找本地所有用户存储的数据,一旦发现相同副本,则反馈给用户响应阻止数据上传。因此,对于相同文件,云服务商只需保存一个副本。然而,对于低最小熵的敏感数据
[2],确定性响应实际上给攻击者创建了可用来窃取目标文件存在性隐私的边信道。考虑一种模板化的用户文件存储于云端,该文件只包含部分敏感数据,其余内容均为公开数据。例如某公司员工的工资单,包含员工姓名、工号、职位等公开信息以及工资这一敏感信息。如果攻击者想要获得其收入情况,只需按照工资单模板格式生成目标员工的公开信息,同时猜测可能的工资,随后上传生成的包含所有可能工资情况的工资单,并分析去重响应。一旦攻击者发现某一文件的上传被阻断,就可确认该文件中工资猜测正确,目标员工的隐私即被泄露。
[0004]为了解决这一问题,大多数工作致力于生成无差异响应混淆攻击者,即在去重响应中附加随机信息,使得攻击者无法根据不同情况下响应的差异来判断检测文件的真实存在性。例如,如果将云端的去重响应设置为请求文件中非重复块数据,则为了混淆攻击者,可在响应中附加部分重复块信息,使得无论对重复文件还是非重复文件,去重响应都是不可区分的。当敏感信息包含在单个块时,这似乎是可行的。然而,一旦假设不成立,由于CSP不知道敏感块数量,便无法实现完全混淆。即使一些工作试图实现近似混淆,但由于去重响应仍然可以区分,这些方案仍然存在严重的安全问题。特别地,攻击者可以在去重请求中添加一些随机生成的非重复块,和不知道存在状态的敏感块一起发送给CSP,一旦所有敏感块都与目标文件重复,就会产生差异化响应,从而暴露存在性隐私。
[0005]广义去重是解决这一问题的潜在有效方法。借助这个技术,原始数据可分解为基和偏移量,只对包含大量信息的基执行跨用户去重,而对偏移量执行云端去重,即无论是否已经存储于云端,用户都需上传全部偏移量。由于攻击者无法从去重响应中推断出包含基和偏移量的完整数据的存在性隐私,边信道攻击问题得以解决。然而,对于一般化的数据,如何在保证去重效率的情况下可以从相似文件或相似数据块中提取出相同模板开展跨用户去重,仍然是一大挑战。

技术实现思路

[0006]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0007]为此,本专利技术的第一个目的在于提出一种面向云存储的抗边信道攻击跨用户广义去重方法,用于在保证效率的情况下实现跨用户去重的安全性。
[0008]本专利技术的第二个目的在于提出一种面向云存储的抗边信道攻击跨用户广义去重装置。
[0009]为达上述目的,本专利技术第一方面实施例提出了一种面向云存储的抗边信道攻击跨用户广义去重方法,包括:将待去重文件在字节级分解为基和偏移量,通过连续相同基压缩技术提取初步模板,采用内容分块策略CDC将初步模板分解为可变长数据块,在块级生成相应的基集;使用后缀数组算法对基集进行重复模式消除,获得数据块的最终模板;其中,根据基集的加密哈希值得到标签集;将标签集以及对应的偏移量集作为去重请求上传云服务器,以通过云服务器对基执行源端去重,并对偏移量集执行目标端去重;存储非重复偏移量,将非重复基添加到文件字典中,建立基和偏移量的对应关系。
[0010]本专利技术实施例提出的面向云存储的抗边信道攻击跨用户广义去重方法,通过将文件的字节级数据划分为基和偏移量,提取基模板,并分别对模板和偏移量执行跨用户去重和目标端去重来抵抗边信道攻击。具体来说,结合字节级连续相同基压缩技术、基序列的CDC分块技术以及块内基的重复模式消除技术提高识别出的模板的泛化能力,这使得从相似文件或相似块中提取的模板匹配成功的概率大大提高,从而在执行跨用户去重时可以优化去重效率;另一方面,由于基和偏移量分别在不同地点执行去重操作,仅从去重响应中无法推断出完整数据的云端存在性,因此本方案可以解决边信道攻击问题,增强去重安全性。
[0011]另外,根据本专利技术上述实施例的面向云存储的抗边信道攻击跨用户广义去重方法还可以具有以下附加的技术特征:
[0012]进一步地,在本专利技术的一个实施例中,通过连续相同基压缩技术提取初步模板,包括:
[0013]若相邻字节的基一致,则删除冗余基,获得文件压缩后的初步模板。
[0014]进一步地,在本专利技术的一个实施例中,使用后缀数组算法对所述基集进行重复模式消除,获得数据块的最终模板,包括:
[0015]在最终模板提取的过程中,基和偏移量之间的对应关系始终保持在字节级。
[0016]进一步地,在本专利技术的一个实施例中,还包括:通过云端服务器比较标签集与本地存储数据确定请求文件基的存在性。
[0017]进一步地,在本专利技术的一个实施例中,将标签集以及对应的偏移量集作为去重请求上传云服务器之后,还包括:
[0018]若去重请求为新文件,通过云服务器将创建一个新的字典记录其基集。
[0019]为达上述目的,本专利技术第二方面实施例提出了一种面向云存储的抗边信道攻击跨用户广义去重装置,包括:分解模块,用于将待去重文件在字节级分解为基和偏移量,通过连续相同基压缩技术提取初步模板,采用内容分块策略CDC将所述初步模板分解为可变长数据块,在块级生成相应的基集;生成模块,用于使用后缀数组算法对所述基集进行重复模式消除,获得所述数据块的最终模板;其中,根据所述基集的加密哈希值得到标签集;去重模块,用于将标签集以及对应的偏移量集作为去重请求上传云服务器,以通过云服务器对
基执行源端去重,并对偏移量集执行目标端去重;存储模块,用于存储非重复偏移量,将非重复基添加到文件字典中,建立基和偏移量的对应关系。
[0020]进一步地,在本专利技术的一个实施例中,通过连续相同基压缩技术提取初步模板,包括:
[0021]若相邻字节的基一致,则删除冗余基,获得文件压缩后的初步模板。
[0022]进一步地,在本专利技术的一个实施例中,使用后缀数组算法对所述基集进行重复模式消除,获得数据块的最终模板,包括:
[0023]在最终模板提取的过程中,基和偏移量之间的对应关系始终保持在字节级。
[0024]进一步地,在本专利技术的一个实施例中,还包括:通过云端服务器比较标签集与本地存储数据确定请求文件基的存在性。
[0025]进一步地,在本专利技术的一个实施例中,将所述标签集以及对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向云存储的抗边信道攻击跨用户广义去重方法,其特征在于,包括以下步骤:将待去重文件在字节级分解为基和偏移量,通过连续相同基压缩技术提取初步模板,采用内容分块策略CDC将所述初步模板分解可变长数据块,在块级生成相应的基集;使用后缀数组算法对所述基集进行重复模式消除,获得所述数据块的最终模板;其中,根据所述基集的加密哈希值得到标签集;将所述标签集以及对应的偏移量集作为去重请求上传云服务器,以通过所述云服务器对基执行源端去重,并对所述偏移量集执行目标端去重;存储非重复偏移量,将非重复基添加到文件字典中,建立所述基和偏移量的对应关系。2.根据权利要求1所述的方法,其特征在于,所述通过连续相同基压缩技术提取初步模板,包括:若相邻字节的基一致,则删除冗余基,获得文件压缩后的初步模板。3.根据权利要求1所述的方法,其特征在于,所述使用后缀数组算法对所述基集进行重复模式消除,获得所述数据块的最终模板,包括:在最终模板提取的过程中,所述基和偏移量之间的对应关系始终保持在字节级。4.根据权利要求1所述的方法,其特征在于,还包括:通过所述云端服务器比较所述标签集与本地存储数据确定请求文件基的存在性。5.根据权利要求1所述的方法,其特征在于,将所述标签集以及对应的偏移量集作为去重请求上传云服务器之后,还包括:若去重请求为新文件,通过所述云服务器将创建一个新的字典记录其基集。6.一种面向云存储的抗边信道攻击跨用户广...

【专利技术属性】
技术研发人员:唐鑫周艺腾
申请(专利权)人:国际关系学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1