一种面向云数据中心的任务与数据联合部署方法技术

技术编号：14770602 阅读：48 留言：0更新日期：2017-03-08 14:30

本发明专利技术提出了一种面向云数据中心的任务与数据联合部署方法，该方法包括步骤：(1)系统环境配置分析，分析系统配置条件下任务及数据部署的难易程度，根据分析结果选择最优化部署策略或启发式部署策略；(2)最优化部署策略，在可以实现最优部署的情况下，实施最佳联合部署；(3)启发式部署策略，在不能保证最优的情况下，采取一种基于数据流行度的联合部署策略。本发明专利技术旨在最小化周期性任务的完成时间，以为基于数据分析的决策支持提供依据。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据中心和云计算
，尤其是一种面向云数据中心的任务与数据联合部署方法。
技术介绍
调度问题是一项传统的研究课题，在多个研究领域皆有需求。在云计算与数据中心研究领域，针对大数据分析这一问题，一种常规的方法是采用基于MapReduce架构的Hadoop系统。Hadoop系统提供了三种默认任务调度方法，但并不具备通用性，在较多情况下表现出来的性能并不令人满意，这主要表现在无法满足任务执行的数据本地化方面，从而导致任务执行时间过长。因此，针对默认任务调度方法的不足，基于任务调度的动态性需求，研究者提出了一类延时任务调度策略，通过延缓任务的调度来保障任务执行时的数据本地化。然而，该方法在处理实时任务调度时无法保证一定的效率与公平性，且未考虑数据部署的可行性。针对周期性数据分析任务，延时类调度策略显然不合适，而Hadoop系统默认的调度方法也无法利用该类任务的特征，提高任务处理效率；此外，大部分研究仍未能将任务调度与数据部署相结合，未充分利用任务执行时的数据特征。
技术实现思路
专利技术目的：为解决上述技术问题，满足对周期性数据分析任务的客观需求，本专利技术提出一种面向云数据中心的任务与数据联合部署方法，该策略在保证100％数据本地化的同时，能最小化数据分析任务的执行时间。技术方案：为实现上述技术效果，本专利技术提出的技术方案为：一种面向云数据中心的任务与数据联合部署方法，包括步骤：(1)获取系统参数，包括：数据块的数量K、数据中心的物理机数量N和每个物理机的内存槽数量M，M＞K/N，且将系统所要完成的任务分为K组任务流，并为每组任务流分配一个数据块...
一种面向云数据中心的任务与数据联合部署方法

【技术保护点】
一种面向云数据中心的任务与数据联合部署方法，其特征在于包括步骤：(1)获取系统参数，包括：数据块的数量K、数据中心的物理机数量N和每个物理机的内存槽数量M，M＞K/N，且将系统所要完成的任务分为K组任务流，并为每组任务流分配一个数据块；定义变量其中，di表示第i组任务流中的任务数；(2)根据系统参数配置判断是否能实现最优部署，若能实现最优部署，则执行步骤(3)；否则，执行步骤(4)；(3)执行最优部署策略，包括步骤：(3‑1)定义j表示迭代次数，初始化j＝1；将各组任务流按照度数升序排列，形成待选择队列Q1；(3‑2)从Q1中选择x组任务流形成待部署队列I，I满足：x≤M且SUMI≥AVGSUMI表示待部署队列I中所有任务流的度数和值；将I中的任务流从Q1中删除；(3‑3)判断选出的待部署队列I是否满足：SUMI＝AVG；若满足，则将待部署队列I中的任务流通过对应的数据块部署在物理机j上，转入步骤(3‑5)；若不满足，则转入步骤(3‑4)；(3‑4)将I中度数值最大的任务流切分为两份：A和B，使任务流A与I中剩余x‑1个任务流的度数和值等于AVG；将任务流A与剩余x‑1个任务流通过对应...

【技术特征摘要】
1.一种面向云数据中心的任务与数据联合部署方法，其特征在于包括步骤：(1)获取系统参数，包括：数据块的数量K、数据中心的物理机数量N和每个物理机的内存槽数量M，M＞K/N，且将系统所要完成的任务分为K组任务流，并为每组任务流分配一个数据块；定义变量其中，di表示第i组任务流中的任务数；(2)根据系统参数配置判断是否能实现最优部署，若能实现最优部署，则执行步骤(3)；否则，执行步骤(4)；(3)执行最优部署策略，包括步骤：(3-1)定义j表示迭代次数，初始化j＝1；将各组任务流按照度数升序排列，形成待选择队列Q1；(3-2)从Q1中选择x组任务流形成待部署队列I，I满足：x≤M且SUMI≥AVGSUMI表示待部署队列I中所有任务流的度数和值；将I中的任务流从Q1中删除；(3-3)判断选出的待部署队列I是否满足：SUMI＝AVG；若满足，则将待部署队列I中的任务流通过对应的数据块部署在物理机j上，转入步骤(3-5)；若不满足，则转入步骤(3-4)；(3-4)将I中度数值最大的任务流切分为两份：A和B，使任务流A与I中剩余x-1个任务流的度数和值等于AVG；将任务流A与剩余x-1个任务流通过对应的数据块部署在物理机j上；将B作为新的任务流归入Q1中并对Q1中的各组任务流按照度数重新升序排序，任务流B仍对应切分前的数据块；转入步骤(3-5)；(3-5)设Q1中任务流为y组，判断是否满足：y＞M，若满足，则令j＝j+1，返回步骤(3-2)；若不满足，则转入步骤(3-6)；(3-6)判断是否满足y＝M；若y＝M，则转入步骤(3-7)；否则转...

【专利技术属性】
技术研发人员：李鑫，秦小麟，
申请(专利权)人：南京航空航天大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人