一种基于可靠性驱动的云资源容错调度方法技术

技术编号：8022277 阅读：206 留言：0更新日期：2012-11-29 04:31

一种基于可靠性驱动的云资源容错调度方法，包括以下步骤：1）初始化；2）计算DAG中的每个任务i的bl(i)和初始化tl(i)＝0；3）将开始任务插入α中；4）开始调度，按如下步骤进行操作，直至所有的任务都调度完成，具体包含如下步骤：4.1）调度时的初始化；4.2）在每个处理机Pj上，寻找任务i的合适处理机；4.3）如果任务i没有可行的处理机，则调度失败；4.4）将处理机分配给任务i；4.5）将任务i的空闲后续放入到α中；4.6）更新U；5）调度结束，调度成功。本发明专利技术通过有效的容错调度提高了系统的服务质量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及资源的容错调度技术，具体是。
技术介绍
云计算因具有超大规模、高可靠性、高可扩展性、按需服务、极其廉价等特点受到了广大的关注。其中云计算一个非常重要特点就是高可靠性。可是，云计算系统使用的大规模资源具有高度动态性和异构性，资源环境所固有的不可靠状态，使得云计算平台较传统的计算平台出现大规模资源失败的可能性大大增加。这种大规模的资源失败包括了硬件故障、软件错误以及其他的失败源。所以，云计算中一个很大的挑战是从大规模分布式系统中去容忍或者消除错误。那么，研究具有容错机制和失败容忍能力的可靠云计算服务调度策略，对切实提高云计算服务的服务质量具有重要意义。基于云计算系统的实时容错调度算法的研究仍处在一个起步阶段。由于云计算系统中大规模资源失败，特别是多处理机同时发生故障的情况更是常有发生，因此如何在保证云计算系统的可靠性同时，又能保证系统实时性，进而提高系统的服务质量是调度算法需要考虑的问题。目前，处理多处理机发生故障的情况下的算法主要是考虑执行时间、通信时间、时间复杂度等某个方面，但是高可靠性和通信时间最小化方面的研究却涉及很少。现有的方法有FTBAR、FTSA、CAFT、MC-FTSA。FTBAR 是基于主动复制(Active Replication)策略的List启发式调度算法，它允许一个任务的N+1个副本调度到不同处理机，并且可以并行执行以容忍至多N个处理机失败，但是分配任务的大量副本过程中导致了大量的通信和提高了时间复杂度。为了解决大量通信的问题，FTSA提出了一个全新的数据结构来解决任务映射到的处理机间的通信关系尽量达到一对一通信，从...

【技术保护点】
一种基于可靠性驱动的云资源容错调度方法，其特征在于：包括以下步骤：1）初始化，包含如下过程：1.1）将系统支持的最大处理机失败的数量赋值给ε；1.2）确定系统的处理机集P={P1,P2,…,Pm}，任务的计算时间用ε:V×P→R来模拟，ε(i,Pj),1≤j≤m表示系统中每个任务在每个处理机上的执行时间；任务间的通信时间用W(i,j)=v(i,j)×d(Pk,Pb)来表示，其中，任务i映射到处理机Pk上，任务j映射到处理机Pb上，d(Pk,Pb)表示发送单位长度数据所需的时间；如果任务部署到同一个处理机上，则通信时间为零；1.3）初始化调度任务集合未调度任务集合U=V，设S是调度任务集合，U是未调度任务集合，一旦一个任务i∈S调度到处理机Pj上，则会得到它的开始时和完成时间利用无回路有向图DAG来模拟任务模型中的任务以及它们之间的关系，用T=(V,E)表示，其中V是一个节点集合对应所有非周期、非抢占性的实时任务；E是一个边集合对应所有任务之间的优先关系以及任务之间的通信；对于一个任务i，Sdp(i)表示任务i的直接前续集合，Sds(i)表示任务i的直接后续集合；v(i,j)表示任务i发...

【技术特征摘要】

【专利技术属性】
技术研发人员：张芮，琚春华，陈沛帅，
申请(专利权)人：浙江工商大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人