一种跨数据中心的关联云数据部署方法技术

技术编号：12903187 阅读：79 留言：0更新日期：2016-02-24 12:30

本发明专利技术涉及一种跨数据中心的关联云数据部署方法，首先结合大规模云数据间的关联关系和数据中心的存储空间信息，对云数据进行限定规模的聚类划分，将关联紧密的云数据划分到相同数据子集；然后在数据放置阶段，结合数据集间传输量大小和数据中心间彼此的带宽资源，决定数据集部署位置。有益效果在于：(1)本方法解决了跨数据中心的数据传输影响计算任务执行的难题；(2)本方法在满足数据中心存储能力约束的前提下，将依赖度高的数据尽可能部署到相同或彼此间网络带宽资源充沛的数据中心上。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据中心领域，尤其涉及。
技术介绍
为提高数据密集型计算任务在云平台上的执行效率，制定合理的数据部署策略是管理者所须解决的关键问题之一。当前主流分布式数据管理系统均采用一致性哈希策略对数据进行划分，并基于哈希结果对数据随机部署。该策略忽略了数据间的关联关系，导致大量不必要的数据传输任务。针对科学计算任务的跨数据中心数据部署策略，采用聚类思想将关联紧密的数据划分到相同数据子集，并结合数据中心存储能力对其进行部署。但该策略忽略了数据中心带宽资源的差异，无法降低跨数据中心传输时间开销。采用遗传算法对云数据的跨数据中心部署策略进行优化，但由于结果很大程度上取决于交叉变异参数的选择，导致算法的适用性较差。
技术实现思路
本专利技术为克服上述的不足之处，目的在于提供一种跨数据中心的关联云数据部署方法，从数据部署的角度出发，提出基于数据关联依赖关系的跨数据中心云数据部署算法，在满足数据中心存储能力约束的前提下，将依赖度高的数据尽可能部署到相同或彼此间网络带宽资源充沛的数据中心上。本方法解决了跨数据中心的数据传输影响计算任务执行的难题。本专利技术是通过以下技术方案达到上述目的：一种跨数据中心的关联云数据部署方法，包括如下步骤： (1)基于云数据间的关联关系与数据中心的存储空间信息对云数据进行聚类划分，得到数据子集； (2)结合数据子集之间的传输量大小和数据中心间的带宽资源，完成数据子集的部署。作为优选，所述步骤（1)采用限定规模的云数据划分算法完成聚类划分，得到数据集，步骤如下： (a)依据云数据间关联依赖关...

【技术保护点】
一种跨数据中心的关联云数据部署方法，其特征在于包括如下步骤：(1)基于云数据间的关联关系与数据中心的存储空间信息对云数据进行聚类划分，得到数据子集；(2)结合数据子集之间的传输量大小和数据中心间的带宽资源，完成数据子集的部署。

【技术特征摘要】

【专利技术属性】
技术研发人员：周天和，卢晓飞，蔡荣，张元元，徐赟，
申请(专利权)人：杭州天宽科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人