一种基于分布式对象存储系统安全的信息分散方法及系统技术方案

技术编号:27654891 阅读:15 留言:0更新日期:2021-03-12 14:16
本发明专利技术适用于数据信息分发技术改进领域,提供了一种基于分布式对象存储系统安全的信息分散方法,包括S1、通过加盐的方式计算数据块散列值来抵御散列函数的碰撞攻击提升数据的机密性;S2、利用SHA2‑512散列算法提升计算效率,并采用原始数据的散列值替换随机密钥;S3、使得具有相同内容的数据输入经过AONT‑NZZD算法编码后生成的数据块内容完全相同实现数据去重。AONT‑NZZD算法在计算数据块散列值时额外选取数据块的长度作为散列运算的盐值,以抵御攻击者进行散列函数攻击。AONT‑NZZD算法采用了基于二进制移位与异或运算的NZZD码,拥有相对较优的编解码速率。

【技术实现步骤摘要】
一种基于分布式对象存储系统安全的信息分散方法及系统
本专利技术属于数据信息分发技术改进领域,尤其涉及一种基于分布式对象存储系统安全的信息分散方法及系统。
技术介绍
在全球经济高速发展、科技不断创新的今天,云计算、物联网等信息产业蓬勃发展,全球数据量和存储规模呈指数型增长。随着大数据时代的到来,为缓解本地数据存储及维护的成本压力,越来越多的个人及组织将数据从本地迁移到云服务提供商所提供的云存储平台上。在不断增长的互联网数据中,非结构化数据的增长尤为显著。非结构化数据中蕴含着巨大的潜在价值,然而因其存储方式不统一、数据格式众多、业务流程多样、标准化困难、信息量庞大等特点至今没有得到充分的利用和挖掘。如何解决互联网中大规模非结构化数据的存储、管理和分析是云存储系统面临的重大挑战之一。此外,随着网络空间安全问题日益凸显,云存储系统中数据泄漏、数据篡改、数据丢失等事故频发,对个人及云服务提供商造成了难以估量的损失。云存储是在云计算的基础上衍生和发展而来,采用软件定义存储的技术将大量异构的存储设备通过网络整合为一个易于扩展且弹性透明的虚拟化存储资源池,并将其按需分配给授权用户。已授权用户可以通过互联网在云存储平台上完成存储资源的访问和管理,无需考虑数据分布、自动容错、系统可扩展性等复杂的大规模分布式存储系统的技术细节,在提高工作效率的同时降低存储成本。简而言之,云存储是一个以数据存储和管理为核心的云计算系统。云存储具有如下几个特性:1.超大规模。云存储集群的规模庞大,需要管理的节点成千上万,存储的数据量高达PB级别。2.可扩展性。云存储系统能够根据数据规模的变化动态伸缩,并且随着集群规模的增大,系统的整体性能将呈线性增长,同时不需要增加过多的运维成本。3.低成本性。云存储系统的自动容错和负载均衡机制使其可以构建在普通计算机上,不需要采购高性能的专用服务器。此外,云存储的数据中心可以建立在电力资源丰富且温度适宜的地区从而大幅降低能源成本。4.高性能。云存储系统具备优越的数据读写性能,用户拥有着良好的存储体验。5.按需服务、透明服务。云存储为用户提供了统一的存储空间,用户可以按需购买使用。此外,云存储系统为用户提供了统一的存储接口,并且集群存储节点的变化对用户透明。6.高数据安全性。云存储系统能够通过复制策略、纠删码技术、信息分散算法等数据安全存储技术确保用户数据不被丢失、篡改以及泄漏。云存储可以分为文件存储、块存储以及对象存储等三种存储方式。其中文件存储向用户提供了一个网络文件系统(NetworkFileSystem,NFS),用户可以通过NFS、CIFS(CommonInternetFileSystem)等协议进行访问。块存储向用户提供一个虚拟磁盘,用户可以通过iSCSI(SmallComputerSystemInterface)等协议进行访问。对象存储以灵活可定制的对象为存储单元,为用户提供了一个统一的存储空间,用户可以通过对象存储接口进行访问。近年来,基于对象的分布式存储即分布式对象存储系统逐渐成为云上存储的主流解决方案。对象存储最为凸显的优势在于其适用于非结构化数据的存储。互联网中的众多应用需要存储大量的图片、音频、视频等非结构化数据,这类数据通常以对象的形式被组织,且互相之间并没有任何关联。对象存储通过单向散列等索引方法能够直接定位到对象的存储位置,无需进行逐层查找,从而加快系统读写性能。此外对象存储对外提供REST或者SOAP的存储接口,这种基于对象接口的存储方式使得高性能、跨平台、易共享的存储结构成为可能。对象存储通常采用扁平化的数据组织方式,其基本的存储单元是对象。对象一般由对象标识、对象数据、对象属性以及对象元数据等四个部分组成。对象标识用于对象的全局索引,每个对象拥有唯一的对象标识。对象数据可以是图片、音频、视频、文本文件、二进制文件等任意类型。对象属性是用于描述对象自身属性的数据,以键值对(Key-Value,K-V)的形式存储在文件的扩展属性当中。对象元数据包括对象名称、对象标识、对象存储位置等关键信息,通常以结构化的方式集中存放在元数据服务器或者分布式数据库当中。分布式对象存储系统通常将元数据与对象数据分别存储,从而将系统的控制流与数据流分离,使得系统具有高吞吐量以及高可扩展等特性。基于对象的分布式存储架构既具备NAS架构易于数据共享的优势又拥有SAN架构高速直接访问的长处。图1是一个经典的基于对象的分布式存储架构。图1中的分布式对象存储系统由客户端(Client)、对象存储设备(Object-basedStorageDevice,OSD)、元数据服务器(MetadataServer,MDS)等三部分组成。其中客户端为用户提供一个简单易用的存储服务平台,并与元数据服务器及对象存储设备相交互。元数据服务器用于对象元数据的存储和管理,向客户端提供访权限访问控制、对象定位服务等功能。此外,元数据服务器对集群节点起到监控和协调作用,负责系统负载均衡、故障迁移等功能。对象存储设备是该分布式对象存储架构的核心,具有独立的CPU、内存、网络以及存储介质等硬件资源,用于管理及持久化对象。对象存储设备向客户端提供对象读写接口,客户端可以通过对象标识、偏移量完成数据读写。此外,对象存储设备可以利用自身硬件资源优化数据分布,通过数据预取的方式加快对象的读写速率。ZigZag-Decodable码(ZZD码)是一种基于二进制移位和异或运算的最大距离可分码,具有比CRS更为高效的编解码效率,其生成矩阵是一个标准的范德蒙矩阵。ZZD码的编码流程简单,首先将原始数据填充后切分为k个等长的数据块,记作S0,S1,...,Sk-1,然后使用公式1对切分后的数据块进行编码,从而获得m个校验数据块C0,C1,...,Cm-1,其中计算过程中涉及到的加法运算均看作异或运算,SSii→ii*(jj+1)表示将原始数据块SSii向右移动ii*(jj+1)位,并在左侧使用比特“0”进行填充。ZZD码的解码流程相较于传统的RS码及CRS码较为复杂,然而具有更快的解码速率。ZZD码采用了高效的ZigZag解法,其解码的主要过程如下:1.将未丢失的原始数据块中的信息元从校验数据块中消除;2.从校验数据块中寻找并获得原始信息元;3.将已知的原始信息元从校验数据块中消除;4.转到第2步,直到需要的原始信息元被全部解出。ZZD码在迭代获取原始信息元前,需要将未损坏的原始数据块的信息元从校验块中消除。假设有r个原始数据块丢失,此步操作需要选取r个校验数据块,并将(k-r)*L个原始数据块的信息元从中消除,共需要执行(k-r)*r*L次异或运算。ZZD码每次迭代可以获得1个原始信息元,为了从校验数据块中消除1个信息元,需要进行r-1次异或运算。ZZD码需要进行r*L次迭代恢复出r个丢失的原始数据块,因此迭代过程共计使用了(r-1)*r*L次异或运算。综上,ZZD码在解码流程中共使用了(k-r)*r*L+(r-1)*r*L=(本文档来自技高网...

【技术保护点】
1.一种基于分布式对象存储系统安全的信息分散方法,其特征在于,所述基于分布式对象存储系统安全的信息分散方法包括以下步骤:/nS1、通过加盐的方式计算数据块散列值来抵御散列函数的碰撞攻击提升数据的机密性;/nS2、利用SHA2-512散列算法提升计算效率,并采用原始数据的散列值替换随机密钥;/nS3、使得具有相同内容的数据输入经过AONT-NZZD算法编码后生成的数据块内容完全相同实现数据去重。/n

【技术特征摘要】
1.一种基于分布式对象存储系统安全的信息分散方法,其特征在于,所述基于分布式对象存储系统安全的信息分散方法包括以下步骤:
S1、通过加盐的方式计算数据块散列值来抵御散列函数的碰撞攻击提升数据的机密性;
S2、利用SHA2-512散列算法提升计算效率,并采用原始数据的散列值替换随机密钥;
S3、使得具有相同内容的数据输入经过AONT-NZZD算法编码后生成的数据块内容完全相同实现数据去重。


2.根据权利要求1所述的基于分布式对象存储系统安全的信息分散方法,其特征在于,所述S1中包括加密过程,其步骤如下:其中算法的输入为原始数据M,输出数据为AONT包P:
SJIA1、使用公式h=H(M,l)计算出原始数据M的散列值h,其中H是SHA2-512散列算法,l是原始数据M的长度并将其作为盐值添加在M之后;
SJIA2、定义一个生成函数G,且当输入相同时,其输出一定相同;
SJIA3、利用公式Mg=G(h,l)生成数据段Mg,其中l为长度;
SJIA4、利用公式对原始数据M进行加密后获得密文C;
SJIA5、利用公式hc=H(C,l)计算密文C的散列值hc;
SJIA6、利用公式计算数据段Cd并将其添加在密文C后构成AONT包P。


3.根据权利要求2所述的基于分布式对象存储系统安全的信息分散方法,其特征在于,所述S1中还包括解密过程,其步骤如下:其中算法的输入为AONT包P,输出数据为原始数据M:
SJIE1、切分AONT包P并从中获得密文C以及数据段Cd,其中Cd的长度是固定的;
SJIE2、通过公式计算出密文C的散列值hc,并使用公式Mg=G(h,l)、计算出原始数据的散列值h;
SJIE3、获得密文C的长度l,并使用与加密流程中相同的生成函数G通过公式Mg=G(h,l)、h=H(M,l)计算出数据段Mg;
SJIE4、通过公式恢复出原始数据M。


4.根据权利要求1所述的基于分布式对象存储系统安全的信息分散方法,其特征在于,所述步骤S2中包括以下步骤:
S21、输入待分发的原始数据M,使用AONT算法加密生成AONT包P;
S22、使用NZZD码编码生成n个数据块形成序列Vm;
S23、计算每个数据块散列值,其中将该数据块的长度作为盐值添加其后;
S24、输出编码生成的数据块序列Vm及其散列值序列Vh。


5.根据权利要求1所述的基于分布式对象存储系统安全的信息分散方法,其特征在于,所述步骤S3中包括以下步骤:
S31、从不同的存储位置获取足够数量的数据块;
S32、计算出各自的散列值并与元数据服务器中在数据分发阶段计算得到的散列值进行对比以确保数据块的完整性;
S33、丢弃散列值校验失败的数据块并由剩余校验成功的数据块并使用NZZD码解码出AONT包;
S34、利用AONT算法恢复出原始数据。


6.一种基于分布式对象存储系统安全的信息分散系统,其特征在...

【专利技术属性】
技术研发人员:李挥马化军赵天于海洋杨元元王博辉史梦楚谢鑫侯韩旭张华宇陈泽权
申请(专利权)人:佛山赛思禅科技有限公司深圳赛思鹏科技发展有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1