System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种面向可信执行环境的双向增量压缩方法技术_技高网

一种面向可信执行环境的双向增量压缩方法技术

技术编号:40165395 阅读:6 留言:0更新日期:2024-01-26 23:37
本发明专利技术公开了一种面向可信执行环境的双向增量压缩方法,属于安全文件存储技术领域。可信执行环境提供的屏蔽内存空间大小有限且载入增量压缩所需的基础数据块会产生昂贵的环境切换开销,导致增量压缩无法在可信执行环境内高效运行;将一个批次B的n个被存储明文数据块M同时进行处理,在重复数据删除后一次性在系统中查询剩下的q个唯一数据块是否存在相似的基础数据块M’并判断这些基础块的物理分布,如果基于物理分布计算得到的中间参数x小于预设阈值t,则基于已有基础块增量压缩被存储明文块M,否则则基于被存储明文块M增量压缩已有基础块M’。

【技术实现步骤摘要】

本专利技术涉及安全文件存储,尤其涉及一种面向可信执行环境的双向增量压缩方法


技术介绍

1、增量压缩技术通过识别两段相似数据(称为数据块)中的相同部分,只保留其中完整的一个数据块(成为基础块),而部分保留另一个数据块中相较前者的独特部分(称为增量块),以达到节省传输带宽或物理存储空间的目的。为了增量压缩目标数据块,通常要求系统将对应的基础块加载至内存中,再将目标块基于基础块进行编码。

2、支持增量压缩技术的文件系统通常将其作为重复数据删除(简称数据去重)和无损压缩技术以外的补充技术以进一步压缩数据。这类系统的数据压缩流程主要包括如下4个步骤:

3、步骤1,将待存储文件分为若干数据块,通过使用指向已存储数据的指针替换相同的冗余数据块以消除数据块级别的冗余信息(即数据去重);

4、步骤2,对于剩余的唯一数据块,进一步识别相似但不相同的数据块,并使用已有基础块增量压缩待存储数据块;

5、步骤3,对于不存在基础块的唯一数据块,将其作为基础块并使用无损压缩技术进行块内压缩;

6、步骤4,将压缩后的基础块和增量块存储于一种固定大小(称为容器)的数据结构中以便系统存取。

7、可信执行环境(简称tee)是一种保证应用程序和数据安全的软硬件组合技术,它是一个安全的软件环境,能够保证它运行的程序和数据不受恶意操作或篡改,以确保安全运行移动应用和服务。现有的tee技术(如intel sgx、arm trustzone)通过提供加密且受完整性保护的内存区域以实现屏蔽执行环境,并结合硬件保护确保屏蔽执行环境内部数据的机密性和完整性。

8、现有技术(见文献yang z, li j, lee p p c. secure and lightweightdeduplicated storage via shielded deduplication-before-encryption.usenixannual technical conference 2022: 37-52.)将tee技术与重复数据删除和无损压缩相结合,其考虑外包云存储场景,允许第三方云接收来自用户的明文数据,在云中的tee内实现数据去重和加密,同时进一步对唯一块执行无损压缩以降低存储开销,实现了一种安全高效的文件存储系统。

9、尽管如此,现有技术并未考虑将tee技术与增量压缩结合以在保障数据安全性的前提下进一步压缩文件。同时,简单将现有增量压缩技术实现在可信执行环境中存在如下缺陷:

10、(1)有限的屏蔽执行环境空间。增量压缩技术要求系统将基础块读取到内存中以对目标块进行增量编码,在可信执行环境中实现增量压缩将进一步要求系统将基础块加载到可信执行环境内。然而,tee提供的屏蔽执行环境大小往往有限(例如,intel gsx v1仅提供256mib空间),若使用超过环境大小的空间将产生昂贵的分页开销,导致系统无法将大量基础块缓存于tee内;

11、(2)昂贵的上下文切换开销。tee通常提供相关接口(例如intel sgx提供的ecall和ocall)来实现屏蔽执行环境与外部未保护内存之间的交互。有限的屏蔽执行环境空间(即挑战1)迫使系统在增量压缩过程中不断通过接口将基础块加载进入tee内。然而,接口函数涉及昂贵的硬件操作,导致每次调用都会产生显著的上下文切换开销并降低系统效率。

12、其次,现有工作指出(见文献zhang y, xia w, feng d, et al. finesse: fine-grained feature locality based fast resemblance detection forpost-deduplication delta compression. 17th usenix conference on file and storagetechnologies. 2019),通过运用增量压缩技术能够在重复数据删除和无损压缩技术的基础上提高数倍的文件压缩效率,进一步节省存储数据所需的物理空间。现有面向可信执行环境的文件存储系统仅实现了重复数据删除和局部压缩技术,但并未进一步考虑增量压缩技术。


技术实现思路

1、本专利技术的目的在于克服现有技术的不足,提供一种面向可信执行环境的双向增量压缩方法。

2、本专利技术的目的是通过以下技术方案来实现的:一种面向可信执行环境的双向增量压缩方法,用于文件存储系统的双向增量压缩方法,所述的文件存储系统包括:客户端和云端,所述客户端提供被存储文件,对文件进行分块并将n个明文数据块m打包为一个批次b上传至云端;所述云端配置阈值t,部署可信执行环境,计算明文数据块m的特征集合f={f0,f1,f2},执行重复数据删除,增量压缩和无损压缩;所述双向增量压缩方法包括以下步骤:

3、s1:云端配置阈值t,设置特征索引记录唯一块与指纹的映射,设置后向索引记录拟执行后向增量压缩的数据块与对应基础块的映射,设置增量索引记录基础块与基于对应基础块增量压缩的增量块集合的映射;

4、s2:云端为批次b中所有数据块执行数据去重,删除批次b中系统已存储数据块并保留剩余的q个唯一数据块m;

5、s3:云端依次计算剩余的q个唯一数据块m的特征集合{f};

6、s4:云端访问特征索引查找剩余的q个唯一数据块m的基础块,查找方式为:若特征索引中记录的已存数据块m’的特征集合{f’}与{f}存在如下关系:,则认为m’是m的基础块;

7、s5:云端确定剩余的q个唯一数据块中,有p个唯一块存在对应的基础块m’;

8、s6:云端确定p个唯一块对应的基础块m’分别存储于r个不同的容器中;

9、s7:云端对p个存在基础块m’的唯一块执行双向增量压缩,即前向增量压缩和后向增量压缩;

10、s8:云端认定剩余的q-p个唯一块为基础块,即不存在基础块的唯一块为基础块;云端对这些唯一块执行无损压缩同时将块的特征信息更新至特征索引;

11、s9:云端将基础块和增量块保存到容器中并进行持久化存储。

12、优选的,所述的s7包括以下子步骤:

13、s71:计算中间参数x,中间参数x的计算公式为:x = r÷n,其中r为p个唯一块对应的基础块m’分布的容器个数,n为一个批次数据块的数量;

14、s72:如果x>t,其中x为计算得到的中间参数,t为云端预设阈值,则云端基于已有基础块m’增量压缩p个唯一块,即前向增量压缩;并将增量块和基础块信息更新于增量索引中;否则,云端将数据块和对应基础块记录与后向索引中,准备后续执行后向增量压缩;

15、s73:云端读取后向索引,对于后向索引中记录的数据块m和对应的基础块m’,云端无损解压m’,随后云端查询增量索引并加载基于基础块m’被增量压缩的已存储增量块集合{m’’},依次对{m’’}中的增量块基于m’执行增量解压恢复出原始数据;云端基于这p个唯本文档来自技高网...

【技术保护点】

1.一种面向可信执行环境的双向增量压缩方法,其特征在于:用于文件存储系统的双向增量压缩方法,所述的文件存储系统包括:客户端和云端,所述客户端提供被存储文件,对文件进行分块并将n个明文数据块M打包为一个批次B上传至云端;所述云端配置阈值t,部署可信执行环境,计算明文数据块M的特征集合F={f0,f1,f2},执行重复数据删除,增量压缩和无损压缩;所述双向增量压缩方法包括以下步骤:

2.根据权利要求1所述的面向可信执行环境的双向增量压缩方法,其特征在于:所述的S7包括以下子步骤:

3.根据权利要求1或2所述的面向可信执行环境的双向增量压缩方法,其特征在于:所述的S1中,阈值t默认为0.03。

4.根据权利要求1或2所述的面向可信执行环境的双向增量压缩方法,其特征在于:所述的批次B大小默认为128。

5.根据权利要求1或2所述的面向可信执行环境的双向增量压缩方法,其特征在于:将所有后向增量压缩操作放置于离线阶段执行,即非文件存储的关键写入路径执行。

6.根据权利要求1或2所述的面向可信执行环境的双向增量压缩方法,其特征在于:所述客户端有多个。

...

【技术特征摘要】

1.一种面向可信执行环境的双向增量压缩方法,其特征在于:用于文件存储系统的双向增量压缩方法,所述的文件存储系统包括:客户端和云端,所述客户端提供被存储文件,对文件进行分块并将n个明文数据块m打包为一个批次b上传至云端;所述云端配置阈值t,部署可信执行环境,计算明文数据块m的特征集合f={f0,f1,f2},执行重复数据删除,增量压缩和无损压缩;所述双向增量压缩方法包括以下步骤:

2.根据权利要求1所述的面向可信执行环境的双向增量压缩方法,其特征在于:所述的s7包括以下子步骤:

...

【专利技术属性】
技术研发人员:杨劲远吴睿林李经纬吴俊李柏晴李雄张小松
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1