远程数据存储位置验证方法技术

技术编号:15899076 阅读:116 留言:0更新日期:2017-07-28 21:42
本发明专利技术公开了一种远程数据存储位置的验证方法,主要解决远程数据定位存在误差较大、成本高及要求网络上时间延迟与地理距离近似为线性关系的问题。实现方案是:利用地标对所有网络节点发送多次探测,收集它们间的时间延迟,计算时间延迟的正态分布概率密度函数并建延迟匹配库;定位时,各地标对目标发送请求,记录目标响应的时间延迟;根据时间延迟计算目标可能所在网络节点的概率;依据概率计算远程数据存储位置验证的结果。本发明专利技术仅用三台地标,实现了城市级别的定位。不仅避免了时间延迟与地理距离的映射,降低了误差,提高定位精度,且所需服务器资源少,并存在评估定位正确率的量化方法。可用于定位云端数据或直接进行IP定位。

【技术实现步骤摘要】
远程数据存储位置验证方法
本专利技术属于云计算
,主要涉及远程数据的定位,具体是一种远程数据存储位置验证方法,可用于验证云端数据的存储位置或定位非本地的数据。
技术介绍
云在过去数年内迅速席卷整个计算机行业的方方面面,存储即服务不仅使得企业将大量数据从线下转移到云端,也令无数个人用户的硬盘成为了具有时代特色的缓存。然而,云的固有问题在于云服务商是否可信以及可靠。虽然云服务商大多为IT界巨头。但是在2009年,谷歌大批用户的文件外泄。同年,亚马逊S3服务两次中断,导致很多依靠其服务的网站瘫痪。事故并没有因抢救后停止,2010年微软的Hotmail错误地删除了1.7万用户数据。紧接着在2011年,亚马逊EC2服务永久丢失了大量用户的数据。用户虽然获得了巨量的存储空间以及较低的管理成本,但代价是失去对数据的直接控制。因此对云的使用而言,迫切需要建立一种能够有效验证云服务商所承诺服务的工程化机制。通过服务水平协议(servicelevelagreement),简称SLA,用户可以在法理上与云服务商达成一致。但SLA并不能保证服务实际的运行状况,商人们有足够的动机为了降低成本而阉割服务。鉴于此,数据持有性证明PDP以及数据可恢复性证明POR应运而生,以验证云端用户数据的完整性。后者POR甚至可以在某种程度上恢复不完整的数据。但仅仅验证数据被完整存储还远远不够,数据丢失的关键在于数据没有合适的冗余。为了应对自然灾害,断电甚至骇客的恶意行为,云服务商会为数据提供备份。然而即便利用PDP或POR能够验证数据的完整性,也无法得知数据是否按照协议要求被备份,更无法得知所备份的数据是否分布于不同的地理位置。验证云端数据存储位置的应用不仅仅限于此,考虑到一些特殊数据,例如一个国家的健康档案。其不仅存储需求大,而且要求能够在全国范围内被正常访问。因此将其托管给商业机构是一个更好的选择。但出于对病人隐私的保护和其它方面的考虑,相关法律会限制其存储的地理位置。如加拿大个人信息保护和电子文档法规定这些数据必须存储于加拿大境内以保证安全,并且任何对该数据的托管都必须满足其存储于加拿大境内的要求。相关机构可以通过验证这些数据的地理位置来判断服务商是否违法。在2011年USENIXHotCloud会议中,会议论文《Apositionpaperondatasovereignty:Theimportanceofgeolocatingdatainthecloud》指出有效验证云端数据的地理位置是一个亟需解决的问题。而要解决的问题主要包含了俩个方面:a)如何验证远端主机完整地存储了目标文件。b)如何定位完整地存储了目标文件的主机。问题的第一个方面目前已有很多良好的解决方案,如PDP以及POR协议。然而,在定位方面。为了提高可靠性,需采用主动测量的方式。而非查询域名注册数据库的办法。因为这些注册信息既有可能过期,也有可能在登记时便是错误位置。所以目前主动测量进行定位的两大问题便是定位精度和定位成本。2011年在ACMworkshoponCloudcomputingsecurityworkshop会议上《Doyouknowwhereyourcloudfilesare》一文采用直接取回远程数据的方式,结合CBG技术给出了理论框架并对亚马逊S3的9个数据中心进行了实验。其结果显示文件基本可以被成功定位,算法能够分辨亚马逊的各个数据中心,但需要使用数十个可控服务器(又称为地标)对目标定位,CBG要求网络的时间延迟与地理距离两者的线性关系较强,因此造成得误差较大,可达到1,000km,无法对城市作有效区分,且成本很高。2012年在ACMWorkshoponCloudcomputingsecurityworkshop会议上《LoSt:LocationBasedStorage》一文提出了构建于POR与CBG之上的验证机制,称为位置验证POL。考虑了敌手攻击,并给出了安全性证明。该技术可以抵御云服务商的欺诈,提高定位结果的真实性。但由于其基于CBG进行定位,依然存在上述缺陷,报告所称平均误差为800km(欧洲)与1,000km(北美)。综上,为了定位远程数据,云服务商的数据中心基本以城市为单位,因此必须实现城市级别的定位。但800~1,000km的定位误差意味着在有些国家内的城市难以区分,在欧洲,甚至无法区分相邻的国家,精度很低。且上述技术使用的服务器需要数十台,定位成本也很高。
技术实现思路
本专利技术的目的在于克服上述现有技术的不足,提出一种精度高,成本低的远程数据存储位置验证方法。本专利技术是一种远程数据存储位置验证方法,其特征在于,包括有如下步骤:(1)计算时间延迟的正态分布概率密度函数:设定某一个远程数据,对其存储位置进行验证,设该远程数据存储位置为目标x,相对于目标x,将定位的范围限制于某一验证区域内。该验证区域内存在地理位置已知的节点,在每个地理位置已知的节点上有可访问的网络节点N,至少存在一台可控服务器L,简称地标,位于验证区域内任意地理位置的已知节点,如果有多个地标,则它们不相互重合。令各地标L对所有地理位置已知的网络节点N发送k次探测,以任意地标Li与任意网络节点Nj为例进行说明,1≤i≤n,1≤j≤m,n为地标总数,m为网络节点总数。计算地标Li对网络节点Nj的k次探测所得时间延迟的平均值μij与时间延迟的标准差σij,可得地标Li与网络节点Nj时间延迟的正态分布概率密度函数fij(x)。(2)计算网络节点间的时间延迟相似度:针对各网络节点,构造各网络节点对各地标的时间延迟平均值向量,其中网络节点Nj针对所有地标的向量为(μ1j,μ2j,…,μij,…,μnj),其中元素μij表示地标Li与网络节点Nj的平均时间延迟。根据该向量,使用闵可夫斯基距离计算网络节点Nj与其它所有网络节点的距离,取它们的最小值,该值称为网络节点Nj的时间延迟相似度μj,1≤i≤n,n为地标总数。(3)计算时间延迟波动:针对各网络节点,构造各网络节点对各地标的时间延迟标准差向量,其中网络节点Nj针对所有地标的向量为(σ1j,σ2j,…,σij,…,σnj),其中σij为地标Li与网络节点Nj之间时间延迟的标准差。根据该向量对网络节点Nj针对所有地标的向量的所有元素求和,并除以地标总数n,得网络节点Nj针对所有地标的时间延迟波动σj,1≤i≤n。(4)建立延迟匹配库:用正态分布概率密度函数fij(x),时间延迟相似度μj和时间延迟波动σj共建延迟匹配库。(5)获取被定位目标x相对于各地标的时间延迟:远程数据存储于目标x,目标x在未确定位置之前,视为一个网络节点。各地标与目标x执行PDP协议,用地标Li进行说明。地标Li向目标x发送挑战并开始计时,目标x在接收到挑战后在响应中添加执行PDP协议所用时间θix,并响应地标Li。若地标Li收到响应,得到从挑战发出到目标x响应的总时间延迟τix,以及目标x所添加执行PDP协议所用时间θix,计算从挑战发出到目标x响应的总时间延迟与执行PDP协议所用时间之差,即τix-θix,得到地标Li与目标x间的时间延迟tix,1≤i≤n,n为地标总数;若地标Li未收到响应,则设置地标Li与目标x间的时间延迟tix=-1。所有地标均执行该本文档来自技高网
...
远程数据存储位置验证方法

【技术保护点】
一种远程数据存储位置验证方法,其特征在于,包括有如下步骤:(1)计算时间延迟的正态分布的概率密度函数:设定某一个远程数据,用户要求对其存储位置进行验证,设该远程数据存储位置为目标x,相对于目标x,将定位的范围限制于某一验证区域内,该验证区域内存在地理位置已知的节点;在每个地理位置已知的节点上有可访问的网络节点N,在所有地理位置已知节点中至少存在一台可控服务器L,简称地标,如果有多个地标,则不相互重合;令各地标L对所有已知网络节点N发送k次探测,以任意地标Li与任意网络节点Nj为例进行说明,1≤i≤n,1≤j≤m,n为地标总数,m为网络节点总数;计算地标Li对网络节点Nj的k次探测所得时间延迟的平均值μij与时间延迟的标准差σij,可得地标Li与网络节点Nj时间延迟的正态分布的概率密度函数fij(x);(2)计算网络节点间的时间延迟相似度:针对各网络节点,构造各网络节点对各地标的时间延迟平均值向量,其中网络节点Nj针对所有地标的向量为(μ1j,μ2j,…,μij,…,μnj),其中元素μij表示地标Li与网络节点Nj的平均时间延迟;使用闵可夫斯基距离计算网络节点Nj与其它所有网络节点的距离,取它们的最小值,该值称为网络节点Nj的时间延迟相似度μj,1≤i≤n,n为地标总数;(3)计算时间延迟波动:针对各网络节点,构造各网络节点对各地标的时间延迟标准差向量,其中网络节点Nj针对所有地标的向量为(σ1j,σ2j,…,σij,…,σnj),其中σij为地标Li与网络节点Nj之间时间延迟的标准差;对网络节点Nj针对所有地标的向量的所有元素求和,并除以地标总数n,得网络节点Nj针对所有地标的时间延迟波动σj,1≤i≤n;(4)建立延迟匹配库:用正态分布概率密度函数fij(x),时间延迟相似度μj和时间延迟波动σj共建延迟匹配库;(5)获取被定位目标x相对于各地标的时间延迟:远程数据存储于目标x,目标x在未确定位置之前,视为一个网络节点;各地标与目标x执行PDP协议,用地标Li进行说明;地标Li向目标x发送挑战并开始计时,目标x在接收到挑战后在响应中添加执行PDP协议所用时间θix,并响应地标Li;若地标Li收到响应,得到从挑战发出到目标x响应的总时间延迟τix,以及目标x所添加执行PDP协议所用时间θix,计算从挑战发出到目标x响应的总时间延迟与执行PDP协议所用时间之差,即τix‑θix,得到地标Li与目标x间的时间延迟tix,1≤i≤n,n为地标总数;所有地标均执行该协议,得到所有地标与目标x的时间延迟;若地标Li未收到响应,则设置地标Li与目标x间的时间延迟tix=‑1;(6)各地标计算目标x位于各网络节点的概率:地标Li将它与目标x间的时间延迟tix代入地标Li与网络节点Nj的正态分布概率密度函数fij(x),得到目标x位于网络节点Nj的概率Pri(x=Nj),1≤i≤n,1≤j≤m,n为地标总数,m为网络节点总数;所有地标对所有网络节点均执行该计算,得到目标x位于各网络节点的概率;(7)计算各地标的候选集合:设候选集合Pi是地标Li定位目标x的中间结果;设置阈值δ,当目标x位于网络节点Nj的概率Pri(x=Nj)大于δ时,将网络节点Nj与该概率Pri(x=Nj)加入地标Li的候选集合Pi,1≤i≤n,1≤j≤m,n为地标总数,m为网络节点总数;所有地标均执行该计算,得到所有地标各自的候选集合;(8)计算所有候选集合中各网络节点的权重:各地标将所有候选集合发送至中央服务器CL,中央服务器CL统计各网络节点在所有候选集合中出现的总次数,记网络节点Nj的权重为Wj;所述中央服务器CL或选择某个地标作为中央服务器CL,或另部署一台普通服务器作为中央服务器CL;(9)计算权重最大网络节点的概率:中央服务器CL选出权重的最大的网络节点;如果权重最大的网络节点有多个,计算目标x位于这些网络节点的最大概率,将上述网络节点及其最大概率加入集合R;(10)得出定位结果:若集合R为空集,则定位失败;否则,集合R不为空集,集合R中概率最大的网络节点Nj为最终定位结果,完成远程数据存储位置验证。...

【技术特征摘要】
1.一种远程数据存储位置验证方法,其特征在于,包括有如下步骤:(1)计算时间延迟的正态分布的概率密度函数:设定某一个远程数据,用户要求对其存储位置进行验证,设该远程数据存储位置为目标x,相对于目标x,将定位的范围限制于某一验证区域内,该验证区域内存在地理位置已知的节点;在每个地理位置已知的节点上有可访问的网络节点N,在所有地理位置已知节点中至少存在一台可控服务器L,简称地标,如果有多个地标,则不相互重合;令各地标L对所有已知网络节点N发送k次探测,以任意地标Li与任意网络节点Nj为例进行说明,1≤i≤n,1≤j≤m,n为地标总数,m为网络节点总数;计算地标Li对网络节点Nj的k次探测所得时间延迟的平均值μij与时间延迟的标准差σij,可得地标Li与网络节点Nj时间延迟的正态分布的概率密度函数fij(x);(2)计算网络节点间的时间延迟相似度:针对各网络节点,构造各网络节点对各地标的时间延迟平均值向量,其中网络节点Nj针对所有地标的向量为(μ1j,μ2j,…,μij,…,μnj),其中元素μij表示地标Li与网络节点Nj的平均时间延迟;使用闵可夫斯基距离计算网络节点Nj与其它所有网络节点的距离,取它们的最小值,该值称为网络节点Nj的时间延迟相似度μj,1≤i≤n,n为地标总数;(3)计算时间延迟波动:针对各网络节点,构造各网络节点对各地标的时间延迟标准差向量,其中网络节点Nj针对所有地标的向量为(σ1j,σ2j,…,σij,…,σnj),其中σij为地标Li与网络节点Nj之间时间延迟的标准差;对网络节点Nj针对所有地标的向量的所有元素求和,并除以地标总数n,得网络节点Nj针对所有地标的时间延迟波动σj,1≤i≤n;(4)建立延迟匹配库:用正态分布概率密度函数fij(x),时间延迟相似度μj和时间延迟波动σj共建延迟匹配库;(5)获取被定位目标x相对于各地标的时间延迟:远程数据存储于目标x,目标x在未确定位置之前,视为一个网络节点;各地标与目标x执行PDP协议,用地标Li进行说明;地标Li向目标x发送挑战并开始计时,目标x在接收到挑战后在响应中添加执行PDP协议所用时间θix,并响应地标Li;若地标Li收到响应,得到从挑战发出到目标x响应的总时间延迟τix,以及目标x所添加执行PDP协议所用时间θix,计算从挑战发出到目标x响应的总时间延迟与执行PDP协议所用时间之差,即τix-θix,得到地标Li与目标x间的时间延迟tix,1≤i≤n,n为地标总数;所有地标均执行该协议,得到所有地标与目标x的时间延迟;若地标Li未收到响应,则设置地标Li与目标x间的时间延迟tix=-1;(6)各地标计算目标x位于各网络节点的概率:地标Li将它与目标x间的时间延迟tix代入地标Li与网络节点Nj的正态分布概率密度函数fij(x),得到目标x位于网络节点Nj的概率Pri(x=Nj),1≤i≤n,1≤j≤m,n为地标总数,m为网络节点总数;所有地标对所有网络节点均执行该计算,得到目标x位于各网络节点的概率;(7)计算各地标的候选集合:设候选集合Pi是地标Li定位目标x的中间结果;设置阈值δ,当目标x位于网络节点Nj的概率Pri(x=Nj)大于δ时,将网络节点Nj与该概率Pri(x=Nj)加入地标Li的候选集合Pi,1≤i≤n,1≤j≤m,n为地标总数,m为网络节点总数;所有地标均执行该计算,得到所有地标各自的候选集合;(8)计算所有候选集合中各网络节点的权重:各地标将所有候选集合发送至中央服务器CL,中央服务器CL统计各网络节点在所有候选集合中出现的总次数,记网络节点Nj的权重为Wj;所述中央服务器CL或选择某个地标作为中央服务器CL,或另部署一台普通服务器作为中央服务器CL;(9)计算权重最大网络节点的概率:中央服务器CL选出权重的最大的网络节点;如果权重最大的网络节点有多个,计算目标x位于这些网络节点的最大概率,将上述网络节点及其最大概率加入集合R;(10)得出定位结果:若集合R为空集,则定位失败;否则,集合R不为空集,集合R中概率最大的网络节点Nj为最终定位结果,完成远程数据存储位置验证。2.根...

【专利技术属性】
技术研发人员:张元轶张俊伟马建峰李晨崔文璇马爽
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1