具有可控冗余度的虚拟机并行分配方法组成比例

技术编号:17488670 阅读:83 留言:0更新日期:2018-03-17 12:15
本发明专利技术公开了一种具有可控冗余度的虚拟机并行分配方法,所述方法包括以下步骤:获取要分配的网络的拓扑图;设定阈值并根据其将拓扑图进行变换;在变换后的拓扑图中判断在此阈值内是否存在规模多于数据结点的能够互相通讯的虚拟机;根据不同的冗余要求删除数量不等的通讯延迟较大的虚拟机;然后再对虚拟机与数据进行二分图的匹配。

A parallel allocation method for virtual machines with controllable redundancy

The invention discloses a parallel virtual machine allocation method has controllable redundancy, the method comprises the following steps: obtaining the distribution network topology; set the threshold according to the transform topological graph; judging whether there is more than the size of the virtual machine data nodes can communicate with each other on the threshold in topological graph after transformation; according to the different requirements of different number of redundant communication delay delete virtual machine greatly; and then the virtual machine and the data matching two graphs.

【技术实现步骤摘要】
具有可控冗余度的虚拟机并行分配方法
本申请涉及云计算
,其尤其指一种具有可控冗余度的虚拟机并行分配方法。
技术介绍
虚拟化的概念:随着数据密集型应用程序越来越多地转向云计算系统,虚拟化技术正在成为云数据中心资源共享的重要关注点。作为一种虚拟计算资源池,云计算可以提供冗余的虚拟机资源。利用这些资源提供连续,高稳定性和高可靠性的服务。通常情况下,云计算数据中心将有大量的租户服务程序正在运行,一旦数据中心出现物理问题,这将导致大量用户的服务中断,这将给租户带来巨大损失数据中心拓扑结构:当前数据中心的拓扑结构通常为三层架构,例如Fat-Tree,VL2和BCube,这种三层架构遵循了一般的网络结构并给予了扩展。这三层架构的最底层是接入层,服务器正是连接着接入层的交换机。汇聚层连接着接入层,核心层为最顶层并连接着核心层,数据中心内的数据节点和计算节点分布在服务器中,数据节点可以存放待处理的数据,而计算节点可以处理相应的数据,计算节点可由虚拟机组成。用户可以将自己需要处理的数据存储在数据中心的数据节点上等待请求的虚拟机来处理。图1中的矩阵表示Fat-Tree结构中任意两个服务器之间进行通讯所经过的交换机数量。虚拟分配:虚拟机(VM)是一种逻辑机器,具有与实际主机几乎相同的架构,操作系统可以在其上运行。在现代虚拟化云计算中心,大数据被分割并存储在数据节点上。因此,如果没有为所有数据节点中的最大访问延迟设置限制,则可能会长时间处理由大数据组成的任务。为这些数据节点分配VM以最小化最大访问延迟称为虚拟机分配(VMA)。由于数据中心内可利用的虚拟机多于数据结点,并且要求处理数据结点的虚拟机互相通讯,这对虚拟机之间通讯的要求比较严格。由于虚拟机之间两两通讯,所以虚拟机之间的通讯模型所构成的图是一个完全图。原有方法提出的启发式算法为用贪心算法为数据结点寻找虚拟机的候选团并结合匈牙利算法为数据结点分配虚拟机。文章中使用的贪心法能够找到极大团,虽然有一定的容错性能,但是冗余的虚拟机个数随着阈值的增大是成指数增长的,不具有实际应用价值。在Tree,VL2,Fat-Tree和BCube四种网络结构中的实验结果更是鲜明的证实了这一观点,找到的极大团一般都是包括所有虚拟机,这不仅增加了虚拟机与数据节点的匹配时间,还降低了该方法的容错性能。
技术实现思路
本专利技术通过将虚拟机分配的VM选择问题模型化为在延迟图上找到冗余组,其中图形的节点是VM和DN,边缘是VM之间或虚拟机与DN之间的访问延迟。然后,我们提出了具有可控冗余度的虚拟机的容错算法。寻找冗余团(算法1)寻找冗余团需经过两个步骤:第一步:删除给予的完全图中权值大于阈值的边。第二步:在得到的子图上对于不同的阈值,并行同步寻找冗余团。为数据节点分配虚拟机(算法2):为得到的合适的虚拟机团分配所要计算的数据点:利用Hopcroft-Karp算法来解决二分图匹配问题。本专利技术使用DN表示数据节点,VN表示虚拟机。我们遵循已有研究中的基本假设:1.一个DN被一个VM处理。若一个DN需要k(k>1)个VM处理,则把DN复制k-1份存储在另外k-1个DN上。2.通讯延迟满足三角不等式。两个结点间的通讯延迟受它们通讯所经过的交换机数目支配。在数据中心的许多网络结构中,如Fat-Tree,VL2和Tree等,交换机数目遵循三角不等式原则,所以假设一个数据中心内通讯延迟满足三角不等式是合理的给定一个图G=(D∪V,E1∪E2),D表示数据中心内数据结点的集合,V表示数据中心中可利用的虚拟机的集合,设eij∈E1(i∈D,j∈V)为连接DN与VM的边,即任意虚拟机与数据节点之间的通讯。e’ij∈E2(i,j∈V)为连接两个VM之间的边,即任意两个虚拟机之间的通讯。设dij∈R+(R+为正实数域)(i∈D,j∈V)为DN与VM之间的通讯延迟,d’ij∈R+(i,j∈V)为两个VM之间的通讯延迟。我们的目标是最小化最大通讯延迟,即最小化虚拟机之间的通讯延迟和虚拟机与数据节点之间的通讯延迟的最大者。定义1.冗余度是指用来处理数据节点的虚拟机的个数与数据节点个数之差与数据节点个数的比值,即:本专利技术冗余度用τ表示。其中冗余团是指在一定阈值下找到可以处理数据节点的团,其中虚拟机的个数大于待处理的数据节点。我们称公式中分子为虚拟机冗余个数,用s表示。定义2.最大通讯延迟是指在考虑冗余度的情况下数据结点与冗余团中处理此数据结点的虚拟机,以及冗余团中所有处理数据结点的虚拟机之间所有通讯延迟的最大者,记作d,即:其中xij为1表示用第j个VM处理第i个DN,为0表示第j个VM不处理第i个DN,dijxij表示虚拟机和虚拟机所处理的数据结点之间的通讯延迟,表示处理数据结点的虚拟机之间的通讯延迟,任何一种通讯延迟过大都会影响最大通讯延迟。由于每一个DN与处理此DN的VM之间的通讯延迟不大于最大通讯延迟,即:xij(d-dij)≥0对于每个数据结点,必存在一个虚拟机来处理,而对于每个虚拟机,它可以处理数据结点,也可以不处理数据结点,即每个VM至多分配给一个DN,即:加入了对虚拟机之间的通讯延迟的考虑,所以最大通讯延迟大于或等于处理DN的虚拟机之间的通讯延迟,即:。用于DN的FTVMA的问题被规划为以下混合整数规划问题。minnimized本专利技术相对于现有技术的优点及效果:本专利技术提出的方法关注VMA问题的容错技术工作,提出了VMA的容错算法,称为FVMA,以最大限度地减少最大访问延迟。所提出的FVMA最初选择在一定阈值下相互通信的一组VM。然后,它构建了一个有效的算法,以在该阈值下找到由VM组成的冗余队列。之后,FVMA标记冗余队列作为故障情况的备份,并采用Hopcroft-Karp算法在冗余队列中分配虚拟机。附图说明图1为Fat-tree结构图。图2为具有3个DAs和5个VMs的虚拟机分配问题示例图。图3为VM通讯构成的完全图。具体实施例寻找冗余团在本专利技术中,所有分配的VM之间以及VM和DN之间的访问延迟都将在我们提出的算法FVAM中考虑。如果访问延迟可以被某个阈值限制,则彼此通信的虚拟机的数量大于此阈值下冗余需求的数量。我们称虚拟机的大小满足阈值下限的DN。设X是G中边缘的权重集合。我们遍历E1和E2,然后将具有不同权重的边放入X中。之后,我们对X中的元素进行排序,并将Max作为最大元素。给定一个图设阈值为t(t∈Z)。通过删除大于阈值t的边,我们将完全图G1转换为G’1,在G’1中的完全子图内的虚拟机之间互相通讯,其通讯延迟肯定不超过t。具体转换为:先将G1复制给G’1,再将图G’1中不大于t的边的权值设为1(将边的权值设为1不影响完全子图的寻找,并且可以避免通讯延迟为0在二分图匹配时被当做无边处理的情况发生),大于t的边的权值设为0,相当于只保留G’1中权值不大于t的边。当t为Max时,G1中所有的边都会被保留,G’1仍然是一个完全图,其最大完全子图为|V|阶完全子图;当t小于Max时,转换后的G’1不再是一个完全图。要使最大通讯延迟不超过t,只能将完全子图中的虚拟机分配给数据结点。首先根据图中所有边的权值确定阈值的取值集合Z,将Z中元素升序排列后依次设为阈值;其次在阈值取不同的值时,对于所有情况本文档来自技高网
...
具有可控冗余度的虚拟机并行分配方法

【技术保护点】
一种具有可控冗余度的虚拟机并行分配方法,其特征在于,所述方法包括以下步骤:获取要分配的网络的拓扑图;设定阈值并根据其将拓扑图进行变换;在变换后的拓扑图中判断在此阈值内是否存在多于所述网络的数据结点的数量的能够互相通讯的虚拟机;根据预设的冗余要求删除数量不等的通讯延迟较大的虚拟机;然后再对虚拟机与数据节点进行二分图的匹配,实现所述虚拟机并行分配。

【技术特征摘要】
1.一种具有可控冗余度的虚拟机并行分配方法,其特征在于,所述方法包括以下步骤:获取要分配的网络的拓扑图;设定阈值并根据其将拓扑图进行变换;在变换后的拓扑图中判断在此阈值内是否存在多于所述网络的数据结点的数量的能够互相通讯的虚拟机;根据预设的冗余要求删除数量不等的通讯延迟较大的虚拟机;然后再对虚拟机与数据节点进行二分图的匹配,实现所述虚拟机并行分配。2.如权利要求1所述的并行分配方法,其特征在于,获取的拓扑图为G=(D∪V,E1∪E2),D表示数据中心内数据...

【专利技术属性】
技术研发人员:武继刚贺子楠姜文超王勇
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1