一种分布式数据存储的数据存取方法、信息数据处理终端技术

技术编号:19820624 阅读:22 留言:0更新日期:2018-12-19 14:17
本发明专利技术属于计算机软件技术领域,公开了一种分布式数据存储的数据存取方法、信息数据处理终端,将用户数据分块,接着把这些数据块存放在不同的存储节点中,并满足任意两个数据块的存储距离大于某个给定的值;节点按照单位数据存取时间升序排列,在安全距离的约束下依次选择数据存储节点从而构成最优的K‑距离拓扑子图,在K‑距离拓扑子图上放置数据。由于数据被分散存储在各个地理位置不同的存储节点中,攻击者也无从得知数据的放置位置,保证了用户数据安全。通过Omnet++仿真平台和Matlab仿真平台在不同网络规模的拓扑下对比了K‑DDS算法和其他算法,并且在模拟实际网络Internet2拓扑中验证了算法的有效性。

【技术实现步骤摘要】
一种分布式数据存储的数据存取方法、信息数据处理终端
本专利技术属于计算机软件
,尤其涉及一种分布式数据存储的数据存取方法、信息数据处理终端。
技术介绍
目前,业内常用的现有技术是这样的:随着信息技术的飞速发展,物联网以大规模的信息系统和庞大的数据产生量成为目前最吸引研究者的领域之一。日益增长的数据量对数据存储系统提出了挑战,为了解决传统的数据存储系统可扩展性差,存储效率低下、安全性低等问题;数据存储系统-云存储系统得到了前所未有的发展。云存储是在云计算(cloudcomputing)概念上延伸和发展出来的新的概念,是新兴的网络存储技术;通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。云存储系统可以为用户提供巨大的数据存储空间和便捷的数据管理平台,并且有着花费低,按需使用等优点。对用户来说,数据的存取时间是衡量一个云存储系统服务质量的关键,然而,由于在云存储系统中存储节点在地理位置上分布不均匀,并且存储节点的存储能力,链路带宽等各有差异导致如何加速数据的存取时间对云服务运营商来说仍然是一个难点。随着“云”这个概念被提出之后,安全性就是人们首先关注的要点。安全已经成为处理数据的企业的头号关注问题。对用户来说,数据的机密性关乎自身利益,用户通常会关心云中的数据是否会被恶意泄露。为了解决这类问题,现有技术为用户提供了加密服务,用户可根据安全等级选择不同长度的密钥加密数据。在面对云中存储的庞大数据量时,加密数据会产生较长的加密时间并需要消耗大量的计算资源,而且需要用户自行保管自己的密钥。这些又会增加数据的存取时间,降低服务质量。随着云计算的兴起,云存储系统也得到了国内外许多学者的研究和讨论。现有技术一提出一个集中式的数据放置方法,旨在优化数据存取时间。现有技术二提出一个数据复制方法旨在考虑能量效率和带宽消耗的情况下保证数据可用性。现有技术三提出一个基于图分割的数据复制策略旨在最小化数据存取时间,有着充分的数学理论作为支撑,但图分割只从简单的拓扑层面考虑,并没有综合考虑节点性能和链路性能,所以并不能解决实际问题需求。也有基于遗传算法等智能算法来构建数据放置策略,现有技术四采用遗传算法放置数据,旨在减少数据存取时间和数据存取过程中的带宽消耗,但这种方法存在复杂度较高和局部最优问题,也不是十分适合作为较好的数据放置策略。在考虑云数据存储安全性方面,目前大多采用加密和认证的方法。现有技术五提出一个安全的且可扩展的数据接入控制机制来保证云中数据安全性。现有技术六提出一个多云存储的方法,可以极大的增强数据安全性,但多存储会产生较高的费用。以上方法均采用加密来保证数据安全性,但加密存在计算量过大,并且需要考虑密钥的安全保存等问题。综合来看,现有技术存在的技术缺陷主要是:在选择数据存储节点时,仅仅从拓扑层面考虑了节点的地理位置,并没有综合考虑节点的其他性能信息,比如存储空间,安全性能等。从而当前的数据存储方法并不是一个优秀的方法。本方案与现有方案相比,在数据安全性方面与传统方案相当,但在数据存取时间方面大大小于现有方案,而数据存取时间是衡量一个数据存储策略最重要的指标之一。综上所述,现有技术存在的问题是:现有技术采用加密保证数据安全性,而目前数据存储量通常过大,所以在数据存储时间方面,加密时间过长而导致数据存储和获取时间太长。解决上述技术问题的难度和意义:上述问题为当前数据存储策略面临的普遍问题,解决上述问题可以极大的提高数据存储效率,减少数据存取时间,并保证一定的数据安全性,对用户来说,用户体验将会更好。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种分布式数据存储的数据存取方法、信息数据处理终端。本专利技术是这样实现的,一种分布式数据存储的数据存取方法,所述分布式数据存储的数据存取方法将用户数据分块,接着把这些数据块存放在不同的存储节点中,并满足任意两个数据块的存储距离大于某个给定的值;节点按照单位数据存取时间升序排列,在安全距离的约束下依次选择数据存储节点从而构成最优的K-距离拓扑子图,在K-距离拓扑子图上放置数据。进一步,所述安全距离用K表示,K=0,则表示用户对数据安全性没有要求,将所有数据存储在一个存储节点上;K=1,则表示任意两个数据块的存储距离大于1,存储距离即存储数据块的存储节点之间的最短距离;K=2,则表示任意两个数据块的存储距离大于2;所述安全距离用fs计算,fs表示为:fs=minfk(SDi,SDj),i≠j,i,j=1,2,...,|V|;进一步,所述分布式数据存储的数据存取方法的安全参数的聚合值包括:入侵检测系统能力值、反病毒能力、防火墙能力、认证机制能力;安全参数取值范围为[0,1],存储节点自身保护能力表示为:SPC=I+AN+F+AU;其中,I表示入侵检测系统能力值,AN表示反病毒能力值,F表示防火墙能力,AU表示认证机制能力值。进一步,所述分布式数据存储的数据存取方法的安全距离为K的数据放置策略SD,满足fs>K;据接入节点为A,则对于每个数据存储节点SDi≠0,i=1,2,...,|V|,从节点i到节点A的数据存取速度为:其中,Pi,A为节点i到节点A的最短路径;利用迪杰斯特拉等最短路径算法找出节点间的最短路径;ls,ld为链路l的两个端点;为链路l的带宽;在某一时刻节点A只能传输一个数据块,则对于整个数据D,数据存取时间为:进一步,所述分布式数据存储的数据存取方法的K-距离拓扑子图的图G(V,E)是一个无向连通简单图,存在节点集合并且对于v1≠v2,有dis(v1,v2)≥K,其中dis表示两点之间的最短跳数,则称V′为图G(V,E)的K-距离拓扑子集;给定一个无向图G(V,E),选择一个节点v,寻找与此节点距离为K的节点vj,继续寻找与vj距离为K的节点,不断重复这个步骤直到遍历图G,最后找到的集合K-dis-Set为所求K距离拓扑子集。进一步,所述分布式数据存储的数据存取方法具体包括:(1)在无向图G中,数据接入点为节点A,则对于图中所有节点v,定义节点v到数据接入点A的单位数据存取速度为:Pv,A表示从节点v到节点A的最短路径,表示一段链路的带宽;(2)数据存储节点选择;输入:G(V,E),K,B,A;输出:最优数据存储集合PriSet;fori=1...|V|;根据公式计算endfor;将节点按照USP从大到小排序,排序后的集合为PV;PriSet←PV1;deletePV1fromPV;fori=1...|PV|;dis=dijkstra(A,PVi);ifdis≥K;PriSet←PVi;0deletePVifromPV;1endif;2endfor;3returnPriSet;数据存储节点选择过程:首先按照USP将所有节点从大到小排序,然后采用迪杰斯特拉算法依次选择节点,这样选择出来的节点一定是在保证安全性的前提下数据存取效率最好的节点集合。本专利技术的另一目的在于提供一种应用所述分布式数据存储的数据存取方法的分布式数据存储的数据存取系统,所述分布式数据存储的数据存取系统包括:数据块存放模块,用于将用户数据分块,数据块存放在不同的存储节点中,并且满足任意本文档来自技高网
...

【技术保护点】
1.一种分布式数据存储的数据存取方法,其特征在于,所述分布式数据存储的数据存取方法将用户数据分块,接着把这些数据块存放在不同的存储节点中,并满足任意两个数据块的存储距离大于某个给定的值;节点按照单位数据存取时间升序排列,在安全距离的约束下依次选择数据存储节点从而构成最优的K‑距离拓扑子图,在K‑距离拓扑子图上放置数据。

【技术特征摘要】
1.一种分布式数据存储的数据存取方法,其特征在于,所述分布式数据存储的数据存取方法将用户数据分块,接着把这些数据块存放在不同的存储节点中,并满足任意两个数据块的存储距离大于某个给定的值;节点按照单位数据存取时间升序排列,在安全距离的约束下依次选择数据存储节点从而构成最优的K-距离拓扑子图,在K-距离拓扑子图上放置数据。2.如权利要求1所述的分布式数据存储的数据存取方法,其特征在于,所述安全距离用K表示,K=0,则表示用户对数据安全性没有要求,将所有数据存储在一个存储节点上;K=1,则表示任意两个数据块的存储距离大于1,存储距离即存储数据块的存储节点之间的最短距离;K=2,则表示任意两个数据块的存储距离大于2;所述安全距离用fs计算,fs表示为:fs=minfk(SDi,SDj),i≠j,i,j=1,2,...,|V|;3.如权利要求1所述的分布式数据存储的数据存取方法,其特征在于,所述分布式数据存储的数据存取方法的安全参数的聚合值包括:入侵检测系统能力值、反病毒能力、防火墙能力、认证机制能力;安全参数取值范围为[0,1],存储节点自身保护能力表示为:SPC=I+AN+F+AU;其中,I表示入侵检测系统能力值,AN表示反病毒能力值,F表示防火墙能力,AU表示认证机制能力值。4.如权利要求1所述的分布式数据存储的数据存取方法,其特征在于,所述分布式数据存储的数据存取方法的安全距离为K的数据放置策略SD,满足fs>K;据接入节点为A,则对于每个数据存储节点SDi≠0,i=1,2,...,|V|,从节点i到节点A的数据存取速度为:其中,Pi,A为节点i到节点A的最短路径;利用迪杰斯特拉等最短路径算法找出节点间的最短路径;ls,ld为链路l的两个端点;为链路l的带宽;在某一时刻节点A只能传输一个数据块,则对于整个数据D,数据存取时间为:5.如权利要求1所述的分布式数据存储的数据存取方法,其特征在于,所述分布式数据存储的数据存取方法的K-距离拓扑子图的图G(V,E)是一个无向连通简单图,存在节点集合并且对于v1≠...

【专利技术属性】
技术研发人员:齐小刚胡秋秋刘立芳冯海林胡绍林
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1