【技术实现步骤摘要】
一种面向云存储系统的数据副本数量确定方法
本专利技术涉及信息技术类数据管理应用领域,尤其涉及一种面向云存储系统的数据副本数量的确定方法。
技术介绍
云存储是在云计算概念上延伸和发展出来的一个新概念,通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的系统。云存储通过互联网为多用户提供高性价比的共享存储资源池。用户不需要了解云存储系统的组成,也不需要了解提供存储服务的具体细节,所有设备对于用户均是透明的,任何一个合法用户通过网络都可以连接云存储系统,获得相应的服务。云存储概念一经提出,就得到了产业界及学术界的关注。根据IDC(InternationalDataCorporation,国际数据集团)的数据,2013年云存储服务的增长率超过所有其他类型的云服务。在云存储系统中存储了大量数据及其副本,且数据规模仍在迅速增加,这使得数据副本管理模块是云存储系统中必不可少的组件。高效的数据副本管理方法可以有效地解决系统容错性差、稳定可靠性低以及访问速度慢等问题。目前的数据副本管理方法所要达到的目标包括如何保障系统更高的服务可靠性、数据副本一致性、合理的数据副本数量及均衡的系统负载等问题。其中适当控制数据副本数量尤其必要。数据副本数量过多会造成节点存储资源和网络带宽的浪费,加重系统和网络负担;数量过少则数据的可用性和访问速度得不到保证,容易造成热点问题。合理计算各数据对象所需要的数据副本数量有助于系统的数据副本总数控制。目前的数据副本复制数量的确定一般都采用静态策略,一般都将数 ...
【技术保护点】
一种面向云存储系统的数据副本数量确定方法,包括如下步骤:步骤一:通过归纳云存储系统中数据访问规律将云存储系统中的数据分为Ⅰ型、Ⅱ型、Ⅲ型、Ⅳ型数据,各类型数据初始建立3份副本,并建立相应的数据流行度模型,计算节点热度;步骤二:新数据到达云存储系统一段时间后,根据数据流行度模型提供的数据流行度变化规律,判断数据的类型,计算出下一时期数据副本需求数与当前数据副本数之差Δri;步骤三:当某一类型的数据Δri大于0时,则增加该数据的副本数;当某一类型的数据Δri小于0时,则减少该数据的副本数;当某一类型的数据Δri等于0时,则对该数据的副本数不作调整;步骤四:设定的节点的热度上限阈值,将节点热度达到或超过上限阈值的节点上的最热的数据副本迁移到热度最低且当前不包含该数据副本的节点上,并在节点热度降低到热度上限阈值以下之前,不在该节点上创建新的数据副本。
【技术特征摘要】
1.一种面向云存储系统的数据副本数量确定方法,包括如下步骤:步骤一:通过归纳云存储系统中数据访问规律将云存储系统中的数据分为Ⅰ型、Ⅱ型、Ⅲ型、Ⅳ型数据,Ⅰ型数据——数据及其副本被创建和使用一次或几次后,没有被访问,或访问的次数极少,即流行度初始时较低,随后几乎为零;Ⅱ型数据——数据及其副本被创建后,流行度较高,且维持在一个较平稳区域内,波动很少;Ⅲ型数据——数据及其副本被创建后,流行度迅速攀升,并达到峰值,在后续的一段时间内保持高流行度,然后逐渐衰减;Ⅳ型数据——数据及其副本被创建后,流行度较高,但在不同的时段内受访问用户活动状态的影响,流行度总体呈现持续而稳定的波动性变化;各类型数据初始建立3份副本,并建立相应的数据流行度模型,计算节点热度;节点热度hnode计算方法如下:式中,n为该节点存储的总数据副本数,而dj为节点中的第j个数据副本,a(dj)为数据副本dj在上一个时间周期内的访问次数;步骤二:新数据到达云存储系统一段时间后,根据数据流行度模型提供的数据流行度变化规律,判断数据的类型,计算出下一时期数据副本需求数与当前数据副本数之差Δri;步骤三:当某一类型的数据Δri大于0时,则增加该数据的副本数;当某一类型的数据Δri小于0时,则减少该数据的副本数;当某一类型的数据Δri等于0时,则对该数据的副本数不作调整;步骤四:设定的节点的热度上限阈值,将节点热度达到或超过上限阈值的节点上的最热的数据副本迁移到热度最低且当前不包含该数据副本的节点上,并在节点热度降低到热度上限阈值以下之前,不在该节点上创建新的数据副本。2.根据权利要求1所述的一种面向云存储系统的数据副本数量确定方法,其步骤二中判断数据类型的方法为采用流行度面积与流行度的斜率面积判断当前数据所属数据类型,数据类型的判断如以下步骤:步骤1:计算出当前数据对象流行度面积sp=∫pdt,斜率面积sk=∫kdt;其中p为当前数据对象流行度,sp为当前数据对象流行度面积,t为时间,k为当前数据对象流行度斜率,sk为当前数据对象流行度斜率面积,∫和d为积分运算符号;步骤2:若sp接近于Ⅰ型数据的流行度面积sp1=∫p1dt,其中p1为Ⅰ型数据流行度,sp1为Ⅰ型数据流行度面积,t为时间,由于此时其它类型数据的与流行度面积明显大于Ⅰ型数据,从而可以判断当前数据为Ⅰ型数据,确定该数据对象的数据副本数不用改变,并结束数据类型判断;否则继续步骤3;步骤3:若数据对象流行度斜率面积sk接近于Ⅲ型数据的流行度斜率面积sk3=∫k3dt,其中k3为Ⅲ型数据的流行度斜率,sk3为Ⅲ型数据的流行度斜率面积,t为时间,由于此时Ⅲ型数据的访问增加迅速,即它的流行度斜率面积明显大于其它类型数据,所以该数据对象属于Ⅲ型数据,结束数据类型判断;否则继续步骤4;步骤4:若sp接近于Ⅱ型数据的流行度面积sp2=∫p2dt,其中p2为Ⅱ型数据流行度,sp2为Ⅱ型数据流行度面积,t为时间,且sk接近于Ⅱ型数据的流行度斜率面积sk...
【专利技术属性】
技术研发人员:徐小龙,邹勤文,徐佳,邓艳,王屹进,刘笑笑,李永萍,涂群,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。