控制存储系统中区域存储中心间的数据存储的方法和装置制造方法及图纸

技术编号:16508631 阅读:40 留言:0更新日期:2017-11-07 08:39
本发明专利技术提供了一种用于控制通过全球存储系统中的网络可操作地耦合的多个区域存储中心中的数据存储的方法。所述方法包括以下步骤:定义至少一个规则集用于确定所述至少一个数据集的存储位置;通过在全球存储系统运行的一个或多个数据请求实体获取关于所述至少一个数据集的需求的信息;并且根据所述规则集,确定关于在拥有可利用资源的区域存储中心中所述数据集的存储位置的信息,所述可利用资源减少所述数据集在服务至少一个指定的数据请求实体时穿越的总距离,和/或减少所述数据集传递到所述指定的一个数据请求实体的延迟。

【技术实现步骤摘要】
控制存储系统中区域存储中心间的数据存储的方法和装置
技术介绍
本专利技术大体上涉及电气、电子和计算机领域,更具体地,涉及数据存储和分布。随着网络连接和云计算的广泛使用,数据或其它内容不再局限于驻留于本地存储设备上。相反,一个新的趋势(尤其是对于在多个用户之间共享的数据)是利用服务器的大型分布系统,通常被称为内容分发网络(CDN),所述内容分发网络通过互联网部署于全球多个数据中心,用于有效地把内容提供给终端用户。CDN供应目前可以利用的互联网内容的很大一部分,包括网络对象(例如文本、图形、网址和脚本)、可下载的对象(例如媒体文件、软件、文档)、应用程序(例如电子商务、门户网站)、流媒体直播、流媒体点播、社交网络等等。为了使这些提供的内容具有高可用性和高性能,物理数据通常需要在网络内被复制。目前,为有效分配而复制的一些数据由嵌入在互联网中的代理缓存处理。代理缓存将分配例如视频内容到所选区域。在这种情况下,同样一份只读数据(例如视频数据)的多个副本位于分散在世界各地的代理缓存中。每一个代理缓存分配请求的数据到它的区域客户,从而减少网络流量拥塞、延迟和功耗。然而,尽管只读数据的副本一般能够通过世界本文档来自技高网...
控制存储系统中区域存储中心间的数据存储的方法和装置

【技术保护点】
一种用于控制在全球存储系统中通过网络可操作地耦合的多个区域存储中心之间的数据存储的方法,所述方法包括以下步骤:定义至少一个数据集,该数据集包括存储在全球存储系统中的数据的至少一个子集;定义用于确定将所述至少一个数据集存储在什么位置的至少一个规则集;通过在全球存储系统中运行的一个或多个数据请求实体获取关于对所述至少一个数据集的需求的信息;以及根据所述至少一个规则集,确定关于在拥有可利用资源的多个区域存储中心之间用于存储所述至少一个数据集的位置的信息,该位置减少以下至少一个:(i)所述至少一个数据集在服务所述一个或多个数据请求实体中的至少一个时穿越的总距离,以及(ii)所述至少一个数据集传递到所述...

【技术特征摘要】
2012.12.17 US 13/717,2161.一种用于控制在全球存储系统中通过网络可操作地耦合的多个区域存储中心之间的数据存储的方法,所述方法包括以下步骤:定义至少一个数据集,该数据集包括存储在全球存储系统中的数据的至少一个子集;定义用于确定将所述至少一个数据集存储在什么位置的至少一个规则集;通过在全球存储系统中运行的一个或多个数据请求实体获取关于对所述至少一个数据集的需求的信息;以及根据所述至少一个规则集,确定关于在拥有可利用资源的多个区域存储中心之间用于存储所述至少一个数据集的位置的信息,该位置减少以下至少一个:(i)所述至少一个数据集在服务所述一个或多个数据请求实体中的至少一个时穿越的总距离,以及(ii)所述至少一个数据集传递到所述一个或多个数据请求实体中的所述至少一个的延迟,其中确定关于用于存储所述至少一个数据集的位置的信息的步骤包括判断迁移所述至少一个数据集是否值得,以及当判断为迁移不值得时,继续获取关于对所述至少一个数据集的需求的信息的步骤,其中判断迁移所述至少一个数据集是否值得的步骤包括在所述拥有可利用资源的多个区域存储中心之间为所述数据集确定新的位置L^,对于所述多个区域存储中心中每个其他可能的位置L,该位置L^满足以下公式:a1·d(l1,L^)+...+an·d(ln,L^)+b·d(L′,L^)≤a1·d(l1,L)+...+an·d(ln,L)+b·d(L′,L),其中d(lj,lk)是表示任意两个位置lj和lk之间的距离的网络距离函数,a1,...,an代表各个数据传输的数据量,l1,...,ln代表所述至少一个数据集的使用所发生的位置,b代表所述至少一个数据集的大小,L′代表所述多个区域存储中心中的所述至少一个数据集在所述数据集迁移前所在的给定存储中心的位置。2.如权利要求1所述的方法,其中,当判断为迁移值得时,所述方法还包括将所述至少一个数据集迁移到以下位置,该位置被确定以减少在拥有可利用资源的多个区域存储中心之间,所述数据集在服务所述一个或多个数据请求实体中的所述至少一个时所穿越的总距离。3.如权利要求2所述的方法,其中迁移步骤包括确定所述至少一个数据集的传递时间表和传递过程中的至少一个。4.如权利要求1所述的方法,其中,当判断为迁移值得时,所述方法还包括将所述至少一个数据集迁移到以下位置,该位置被确定以减少所述至少一个数据集传递到所述一个或多个数据请求实体中的所述至少一个的延迟。5.如权利要求1所述的方法,其中判断迁移所述至少一个数据集是否值得的步骤根据以下至少一个来执行:(i)关于对所述至少一个数据集的需求的信息;(ii)关于在拥有可利用资源的多个区域存储中心之间用于存储所述至少一个数据集的位置的信息;以及(iii)关于所述至少一个数据集的大小的信息,由此所述判断迁移所述至少一个数据集否值得减少了在拥有可利用资源的多个区域存储中心之间,所述至少一个数据集在服务所述一个或多个数据请求实体中的所述至少一个时所穿越的总距离。6.如权利要求1所述的方法,其中判断迁移是否值得的步骤包括判断所述一个或多个数据请求实体中的所述至少一个的物理位置是否是永久性的。7.如权利要求6所述的方法,其中判断所述至少一个或多个数据请求实体中的所述至少一个的物理位置是否是永久性的步骤根据一个或多个启发法来执行,这些启发法包括以下几者中的至少一个:位置变化的持续时间、与所述一个或多个数据请求实体中的所述至少一个相关联的年龄、出行习惯类别、财富和个人属性,以及所述一个或多个数据请求实体的所述至少一个的当前位置属性。8.如权利要求1所述的方法,其中判断迁移所述至少一个数据集是否值得的步骤包括评估所述多个区域存储中心的至少一个子集的存储容量。9.如权利要求1所述的方法,还包括将所述至少一个数据集迁移到以下位置,该位置被确定以减少在拥有可利用资源的多个区域存储中心之间,所述数据集在服务所述一个或多个数据请求实体中的所述至少一个时所穿越的总距离。10.如权利要求1所述的方法,其中所述至少一个数据集穿越的总距离根据以下至少一者:两个位置之间沿着最短物理网络连接的距离、所述两个位置之间最大网络带宽的倒数、给定观测数据流量的平均带宽的倒数、所述两个位置之间传输的数据包的周转时间、所述两个位置之间的网络成本、延迟、以及所述两个位置之间网络的功耗。11.如权利要求1所述的方法,其中所述至少一个规则集包括用于确定将所述至少一个数据集存储在什么位置的一个或多个优化参数。12.如权利要求1所述的方法,其中所述一个或多个数据请求实体的至少一个子集包括移动实体和移动用户中的至少一个。13.如权利要求1所述的方法,其中关于用于存储所述至少一个数据集的位置的信息是根据以下至少一个获取的:所述一个或多个数据请求实体中的所述至少一个的互联网协议地址、从与所述一个或多个数据请求实体中的所述至少一个相关联的位置监测装置获取的信息、以及从与所述一个或多个数据请求实体中的所述至少一个相关联的位置显示装置所获得的信息。14.如权利要求1所述的方法,还包括在所述至少一个数据集和所述一个或多个数据请求实体中的所述至少一个之间建立关联。15.如权利要求1所述的方法,其中获得关于对所述至少一个数据集的需求的信息的步骤包括关于所述一个或多个数据请求实体中的至少第二个数据请求实体,对所述至少一个或多个数据请求实体中第一个数据请求实体的重要性进行加权。16.如权利要求1所述的方法,还包括:创建所述至少一个数据集的至少一个副本,所述至少一个数据集的所述副本被存储在与所述至少一个数据集不同的存储中心;以及根据所述一个或多个数据请求实体中的所述至少一个相对于所述至少一个数据集和所述至少一个数据集的副本位置的位置,判断以下一者:是否使用所述至少一个数据集、是否使用所述至少一个数据集的副本、以及是否移动所述至少一个数据集和所述至少一个数据集的副本中的至少一个。17.如权利要求1所述的方法,还包括对所述至少一个数据集分配服务质量标签。18.如权利要求17所述的方法,还包括根据分配给所述至少一个数据集的服务质量标签来限制所述至少一个数据集迁移到的位置。19.一种用于控制在全球存储系统中通过网络可操作地耦合的多个区域存储中心之间的数据存储的方法,该方法包括以下步骤:接收对包括存储于全球存储系统中的数据的至少一个子集的至少一个数据集的请求;接收用于确定将所述至少一个数据集存储在什么位置的至少一个规则集;通过在全球存储系统中运行的一个或多个数据请求实体获取关于对所述至少一个数据集的需求的信息;以及根据所述至少一个规则集,确定关于在拥有可利用资源的多个区域存储中心之间用于存储所述至少一个数据集的位置的信息,该位置减少以下至少一个:所述至少一个数据集在服务所述一个或多个数据请求实体中的至少一个时穿越的总距离,以及所述至少一个数据集传递到所述一个或多个数据请求实体中的所述至少一个的延迟,还包括:判断迁移所述至少一个数据集是否值得,并且当判断为迁移不值得时,继续获取关于对所述至少一个数据集的需求的信息,其中判断迁移所述至少一个数据集是否值得的步骤包括在所述拥有可利用资源的多个区域存储中心之间为所述数据集确定新的位置L^,对于所述多个区域存储中心中每个其他可能的位置L,该位置L^满足以下公式:a1·d(l1,L^)+...+an·d(ln,L^)+b·d(L′,L^)≤a1·d(l1,L)+...+an·d(ln,L)+b·d(L′,L),其中d(lj,lk)是表示任意两个位置lj和lk之间的距离的网络距离函数,a1,...,an代表各个数据传输的数据量,l1,...,ln代表所述至少一个数据集的使用所发生的位置,b代表所述至少一个数据集的大小,L′代表所述多个区域存储中心中的所述至少一个数据集在所述数据集迁移前所在的给定存储中心的位置。20.如权利要求19所述的方法,还包括:当判断为迁移值得时,将所述至少一个数据集迁移到以下位置,该位置被确定以减少在拥有可利用资源的多个区域存储中心之间,所述数据集在服务所述一个或多个数据请求实体中的至少一个时所穿越的总距离。21.如权利要求19所述的方法,还包括:将对所述至少一个数据集的请求转换并路由到所述多个区域存储中心中的、其中存储有所述至少一个数据集和所述至少一个数据集的副本中的至少一个的相应的一个存储中心。22.一种用于控制在全球存储系统中通过网络可操作地耦合的多个区域存储中心之间的数据存储的装置,所述装置包括:配置为定义至少一个数据集的模块,该数据集包括存储在全球存储系统中的数据的至少一个子集;配...

【专利技术属性】
技术研发人员:W·R·雷赫尔B·M·普费茨曼K·M·金斯布里L·A·理查德森P·尤巴奈茨W·B·尤埃斯
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1