基于数据依赖性和访问量的云数据分配存储的优化方法及系统技术方案

技术编号：13062860 阅读：75 留言：0更新日期：2016-03-24 01:39

本发明专利技术公开一种基于数据依赖性和访问量的云数据分配存储的优化方法(1)初始阶段的数据分配，a：原始数据中的固定数据集分配到相应数据中心；计算非固定数据集中每一个数据集与其他数据集之间的相关度；b：依次分配每一个数据集，选择与之相关度最大的数据集；若无法分配则放置等待队列中，等待最后阶段分配；(2)运行阶段，a：根据传输开销将任务调度到传输开销最小的数据中心执行；b：执行完毕后若新产生任务与数据集，则首先更新任务集合，然后根据数据集与数据中心的相关度，选择相关度最大的数据中心放置中间数据集。本发明专利技术还公开一种实现上述方法的系统。采用本发明专利技术不仅考虑数据的访问量而且考虑数据间的依赖性，大大提高了云计算下的访问效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术设及一种基于数据依赖性和访问量云数据分配存储优化方法，特别是设及一种实现上述方法的系统。
技术介绍
随着大数据时代的来临，在许多领域计算的数据量已经从TB级到PB级，而随着云计算的发展，其高效的特点为工作流提供了一个新思路。但是大规模的数据分配也同样存在着许多挑战，不同于传统的分布式网络，云计算采用的是廉价的虚拟化集群，硬件已经不再是数据分配所应该考虑的因素。大规模数据存在着依赖性，同时数据在单位时间的访问量是固定的，但是在各个单位时间的访问量一般是变化的，如果不考虑访问量，可能存在负载不均衡，造成系统瓶颈。因此，云计算动态存储的优化主要是解决数据访问量变化带来的负载不均衡问题，同时利用大规模数据间的依赖性来提高访问效率。目前数据动态分配算法虽然能考虑访问量带来的负载不均衡问题，但是对数据直接的相关性考虑较少，随着数据量的增大，访问效率大大提高，因此在一定程度上还有较大的改进空间。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种基于数据依赖性和访问量云数据分配存储优化方法，能提高访问效率。阳〇化]本专利技术还提供一种基于数据依赖性和访问量云数据分配存储优化系统，能提高访问效率。为了达成上述目的，本专利技术的解决方案是：一种基于数据依赖性和访问量云数据分配存储优化方法，基于数据依赖性的定义：阳00引定义1、数据集D=化Ii= 1，2,. . .，|D| }，其中：d康示第i个数据集，|D|表示数据级个数，Idil表示数据集的大小；di分为固定数据集和非固定数据集；固定数据集为有固定数据中屯...

【技术保护点】
一种基于数据依赖性和访问量云数据分配存储优化方法，其特征在于：基于数据依赖性的定义：定义1、数据集D＝{di|i＝1,2,...,|D|}，其中：di表示第i个数据集，|D|表示数据级个数，|di|表示数据集的大小；di分为固定数据集和非固定数据集；固定数据集为有固定数据中心的数据集，即需要特定方位的数据集；非固定数据集为无固定数据中心的数据集，即不需要特定方位的数据集；定义2、数据中心集合M＝{mi|i＝1,2,...,|M|}，其中：mi表示第i个数据中心，|M|表示数据中心的个数，|mi|表示第i个数据中心存储空间的大小；定义3、count(Ti∩Tj)，其中：Ti和Tj分别表示数据集上的任务集，count(Ti∩Tj)表示数据集Ti和数据集Tj共有的任务数量；定义4、数据依赖性用数据相关度衡量，包括数据集之间的相关度，以及数据集与数据中心的相关度，定义如下：(1)数据集di和dj之间的相关度定义为：dep(i,j)=count(Ti∩Tj)*min{|di|,|dj|},didj∈NFDcount(Ti∩Tj)*|di|,di∈N...

【技术特征摘要】

【专利技术属性】
技术研发人员：周俊，王习庆，闫闯，姚俊峰，苏劲松，陈明，
申请(专利权)人：厦门大学，铜陵有色金属集团股份有限公司金冠铜业分公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人