在分布式对象存储生态系统中的去耦合的内容以及元数据技术方案

技术编号:11796982 阅读:144 留言:0更新日期:2015-07-30 12:14
一种存储系统包括:控制器;存储器;一个或者多个对象,每个对象具有内容数据以及包括系统元数据的元数据;以及策略,其管控一个或者多个对象的内容数据以及元数据从存储系统到外部存储的写入。所述策略包括可配置的准则和规则,所述可配置的准则用于去耦合给定对象的内容数据以及元数据,并且所述规则用于如果对象的内容数据和元数据是去耦合的,则以去耦合的方式在存储系统以及外部存储之间为内容数据和元数据确定存储位置。所述可配置的准则基于对象的元数据的属性。控制器能够操作为针对对象执行策略,并应用所述规则以便为去耦合对象的内容数据和元数据确定存储位置。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】
技术介绍
本专利技术总体上涉及存储系统,并且尤其涉及在分布式对象存储生态系统中用于存储的内容以及元数据的去耦合。随着无结构的非易变的数字内容的增长,越来越难以管理以及定位有关的数字内容。为了寻找有关的内容,关于数字内容的数据(即元数据)正变得比数字内容本身更加重要。对于传统的分布式环境中的对象存储系统(分布式对象存储生态系统),数字内容以及元数据被一起存储在多个位置,以实现灾难恢复以及本地的引用(locality ofreference) ο这是通过利用复制技术(replicat1n technology)来实现的,以确保复制件(拷贝)被分布至远程站点(remote sites)。传统系统的另一个缺点是它们对数据以及元数据应用相同的存储规则。例如,如果对象被存储于低延迟存储系统上的N个复制件中,则所有的N个复制件均包含数据以及元数据,即使在某些位置/应用中可能根本不需要数据部分。因为企业正变得越来越地理性地分散有许多单独的办公室甚至数据中心,为所有的数字内容提供本地的引用所需的复制技术变得更加复杂,并且数字内容的存储需要被增加了所需的本地引用的次数倍。当主要目标是仅仅为元数据具有本地的引用时,这意味着对于元数据的数字内容被不必要地存储在多个位置。数据复制也是非常消耗时间的过程,并且数据以及元数据的复制造成了大量的时间延迟、复制积压(backlog)以及不必要的带宽消耗。
技术实现思路
本专利技术的示例性实施例提供了一种智能对象,其利用用户可定义的规则及其智能来识别在分布式对象存储系统中的哪个对象应当维持非易变的数字内容以及元数据的复制件,以及哪个对象应当仅仅包含元数据,同时仍然维持在整个环境的对数字内容的可访问性、数据保护以及灾难恢复能力。在数字内容被仅仅托管元数据的任意对象存储系统所需的情况下,它可以从其他的对象存储系统取回,就好像本地复制件总是可用一样。通过该方案,远程位置可以托管较小的容量对象存储系统,该对象存储系统将仅仅存储元数据,但提供对在托管在中央数据中心的较大对象存储系统中存储的数字内容以及元数据的集合的完整的访问。该方案用相同的数据访问提供更好的容量利用。内容获取(ingest)可以经由远程位置或者中央数据中心来完成,但当中央数据中心已经存储数字内容时,远程位置将仍然仅仅维持内容的仅元数据视图(view)。值得注意的是,本专利技术并不限制仅元数据的配置在哪里是被允许的。它可以在为之获取内容的系统或者在可能具有向其复制的内容的一些其它系统。本专利技术确保了在生态系统中的某处有至少一个复制件。用于从对象存储系统中的元数据分离数字内容的管理生命周期的方法也可以被用在非复制环境中。元数据将保持在由对象存储系统管理的存储中的活性地驻留,但是基于存储分层策略,数字内容或者内容的额外的复制件也可能被存储在另一个联网的存储设备上。存储在对象存储系统中的或者是在不同的联网的存储系统上的数字内容将仍然由包含对象的元数据的任意对象存储系统通过将对象从其自身(如果驻留的话)或者从其它联网的存储设备取回来进行管理以及可访问。该机制创建智能内容分层,其有助于对象存储系统的数据保护层级、高效更新以及对象的定制元数据和系统的索引,同时还提供压缩和加密移动至网络存储设备的数据的选项。根据本专利技术的一个方面,一种存储系统包括:控制器;存储器;一个或者多个对象,每个对象具有内容数据以及包括系统元数据的元数据;以及策略,其管控一个或者多个对象的内容数据以及元数据从存储系统到外部存储的写入。所述策略包括可配置的准则和规则,所述可配置的准则用于去耦合给定对象的内容数据以及元数据,并且所述规则用于如果对象的内容数据和元数据是去耦合的,则以去耦合的方式在存储系统以及外部存储之间为内容数据和元数据确定存储位置。所述可配置的准则基于对象的元数据的属性。控制器能够操作为对存储系统的一个或者多个对象执行策略,包括基于所述可配置的准则将每个对象的元数据评估为将以去耦合的方式写入的候选对象;并且当对于去耦合对象,内容数据和元数据为去耦合时,应用所述规则以便为去耦合对象的内容数据和元数据确定存储位置。在有些实施例中,所述可配置的准则是基于对象的系统元数据的属性。执行策略包括基于所述可配置的准则将每个对象的系统元数据评估为将以去耦合的方式写入的候选对象。所述控制器能够操作为周期性地运行可调度的服务,以将来自存储系统的对象识别为将以去耦合的方式写入的候选对象,并且对识别的对象执行策略。在具体实施例中,所述控制器能够操作为:当策略的规则确定用于内容数据的存储位置是外部存储时,验证对象被写入外部存储,验证内容数据被存储于外部存储,并且当验证了二者时,从存储系统中移除所述内容数据并且在存储系统中记录所述外部存储是被写入的对象的内容数据的位置;并且当策略的规则确定用于内容数据的存储位置是存储系统时,验证对象将作为仅元数据被写入外部存储,验证对象的内容数据被存储于存储系统,并且当验证了二者时,将对象的元数据写入外部存储,并且将指针发送至外部存储,所述指针指向对象的内容数据在存储系统中的位置。在一些实施例中,当策略的规则确定用于内容数据的存储位置是外部存储时,所述控制器能够操作为:在由策略的规则所指定的第一预设量的时间之后,从存储系统移除所述内容数据,所述第一预设量的时间等于或大于零;并且在从外部存储取回所述内容数据之后,在存储系统中将取回的内容数据保留长达由策略的规则所指定的第二预设量的时间,所述第二预设量的时间等于或者大于零。在具体实施例中,所述外部存储位于另一个存储系统,并且所述存储系统和所述另一个存储系统是联网在一起的多个存储系统的一部分,以便在复制的环境中在存储系统之间复制对象。本专利技术的另一个方面提供了一种用于在存储系统之间管理对象的写入的装置,其中每个对象具有内容数据以及包括系统元数据的元数据。所述装置包括控制器和存储器。所述控制器能够操作为:对源存储系统的一个或多个对象执行策略,所述策略管控一个或者多个对象的内容数据以及元数据从源存储系统至目标存储系统的写入,所述策略包括可配置的准则和规则,所述可配置的准则用于去耦合给定对象的内容数据以及元数据,并且所述规则用于如果对象的内容数据和元数据是去耦合的,则以去耦合的方式在源存储系统和目标存储系统之间为内容数据和元数据确定存储位置,其中所述可配置的准则基于对象的元数据的属性;其中,对一个或多个对象执行策略包括基于所述可配置的准则将每个对象的元数据评估为将以去耦合的方式写入的候选对象;并且当对于去耦合对象,内容数据和元数据为去耦合的时,应用所述规则以为去耦合对象的内容数据和元数据确定存储位置。本专利技术的另一个方面提供了一种管理对象的写入的方法,其中每个对象具有内容数据以及包括系统元数据的元数据。所述方法包括:对存储系统的一个或多个对象执行策略,所述策略管控一个或者多个对象的内容数据以及元数据从存储系统到外部存储的写入,所述策略包括可配置的准则和规则,所述可配置的准则用于去耦合给定对象的内容数据以及元数据,并且所述规则用于如果对象的内容数据和元数据是去耦合的,则以去耦合的方式在存储系统以及外部存储之间为内容数据和元数据确定存储位置,其中所述可配置的准则基于对象的元数据的属性;其中,对一个或者多个对象执行本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/CN104813321.html" title="在分布式对象存储生态系统中的去耦合的内容以及元数据原文来自X技术">在分布式对象存储生态系统中的去耦合的内容以及元数据</a>

【技术保护点】
一种存储系统,包括:控制器;存储器;一个或者多个对象,每个对象具有内容数据以及包括系统元数据的元数据;以及策略,其管控一个或者多个对象的内容数据以及元数据从存储系统到外部存储的写入,所述策略包括可配置的准则和规则,所述可配置的准则用于去耦合给定对象的内容数据以及元数据,并且所述规则用于如果对象的内容数据和元数据是去耦合的,则以去耦合的方式在存储系统以及外部存储之间为内容数据和元数据确定存储位置,其中所述可配置的准则基于对象的元数据的属性;并且其中,所述控制器能够操作为对存储系统的一个或者多个对象执行策略,包括基于所述可配置的准则将每个对象的元数据评估为将以去耦合的方式写入的候选对象;并且当对于去耦合对象,内容数据和元数据为去耦合的时,应用所述规则以针对去耦合对象的内容数据和元数据确定存储位置。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:维塔利·佐罗茨基凯文·斯科特·格里马迪本杰明·伊舍伍德
申请(专利权)人:日立数据系统有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1