当前位置: 首页 > 专利查询>浙江大学专利>正文

一种数据中心网络中大象流识别及调度方法技术

技术编号:35786392 阅读:20 留言:0更新日期:2022-12-01 14:33
本发明专利技术提出一种数据中心网络中大象流识别及调度方法,采用带内网络遥测技术对数据平面网络状态信息进行收集,提出一种基于带内网络遥测的大象流检测方法以及基于蚁群算法的流量调度方法。第一步,当新的流到达边缘交换机时,计算队列长度累积速率,并判断是否超过设定的阈值,当未超过阈值时,执行等价多路径的调度方法进行调度转发。超过阈值时,判断为疑似大象流,采用C4.5决策树分类算法进一步判断所述流是否为真正大象流,未被判定为真正大象流的疑似大象流,仍旧执行等价多路径的调度方法进行调度转发。找出真正的大象流后,通过改进的蚁群算法,找出大象流调度的最优路径。找出大象流调度的最优路径。

【技术实现步骤摘要】
一种数据中心网络中大象流识别及调度方法


[0001]本专利技术涉及流量调度领域,尤其涉及一种数据中心网络中大象流识别及调度方法。

技术介绍

[0002]数据中心网络中承载的业务种类繁,业务流的分布具有突发性和不均匀性,这就会导致数据中心网络中的带宽等资源无法按需分配,从而产生网络拥塞,降低网络性能。此外,用户对数据中心所提供的服务也有着较高的质量要求。解决这些问题就需要对网络流的调度方法进行一定的优化,通过对业务流进行合理的调度,一方面提高链路带宽的利用率,缓解网络拥塞,提高网络性能;另一方面为业务提供充足的带宽等网络资源的支持,从而满足用户对高服务质量的需求。
[0003]数据中心网络的流量通常被分为两种类型,即大象流和老鼠流。大象流传输字节数大,大速率,持续时间长,对带宽要求较高。老鼠流传属字节数较小,小速率,持续时间较短,对时延敏感。在实际的数据中心网络流量中,大象流数目不多(约10%),却占用了80%的流量,老鼠流数目较多(约90%),却仅占据了20%的流量。
[0004]传统的大流检测方法多采用抽样的方式,周期性的获取流信息,会导致检测延迟以及网络的开销大。传统的数据采集方式主要采用“拉模式”获取数据,即发送请求来获取设备上的数据,限制了可以监控的网络设备数量,且无法快速获取数据。当前数据中心网络广泛利用等价多路径路由(Equal

Cost Multi

Path Routing,ECMP)算法进行流量的调度。研究表明,ECMP算法可以有效的调度老鼠流,但是对于持续时间长,数据量大的大象流,ECMP可能会将多条大象流调度到同一链路上,造成数据流的碰撞和网络拥塞,使得网络负载不均衡。

技术实现思路

[0005]本专利技术的目的在于针对现有技术的不足,提供了一种数据中心网络中大象流识别及调度方法。
[0006]本专利技术的目的是通过以下技术方案来实现的:一种数据中心网络中大象流识别及调度方法,包括以下步骤:
[0007]步骤(1):当数据中心网络中新的流到达边缘交换机时,计算所述流的队列长度累积速率,判断所述流的队列长度累积速率是否超过阈值;若所述流的队列长度累积速率超过阈值,则判断所述流是疑似大象流,反之判断所述流不是疑似大象流;当判断结果不是疑似大象流时,通过等价多路径的调度方法将所述流转发至目的主机,完成数据流的调度转发;
[0008]步骤(2):当步骤(1)的判断结果是疑似大象流,采用C4.5决策树分类算法进一步判断所述流是否为真正大象流;当判断结果是真正大象流时,使用改进的蚂蚁算法获得最优路径,通过最优路径将所述流转发至目的主机,完成数据流的调度转发;当判断结果不是
真正大象流时,通过等价多路径的调度方法将所述流转发至目的主机,完成数据流的调度转发。
[0009]进一步地,当数据中心网络中新的流到达边缘交换机时,通过带内网络遥测技术采集每个数据包到达边缘交换机时队列的长度和时间;并通过所述流的第1个数据包到达边缘交换机时队列的长度和时间以及第n个数据包到达边缘交换机时队列的长度和时间求得队列长度累积速率r;
[0010]所述队列长度累积速率r的计算公式为:
[0011][0012]其中,L1、T1分别为所述流的第1个数据包到达边缘交换机时队列的长度和时间;L
n
、T
n
分别为所述流的第n个数据包到达边缘交换机时队列的长度和时间;n的取值范围根据用户实际的组网环境及业务需求而定;
[0013]所述流包括N个报头五元组一致的数据包,N>n;
[0014]判断所述流的队列长度累积速率r是否超过设定的阈值R;若所述流的队列长度累积速率r超过设定的阈值R,则判断所述流是疑似大象流;反之,判断所述流不是疑似大象流;当判断结果不是疑似大象流时,通过等价多路径的调度方法将所述流转发至目的主机,完成数据流的调度转发。
[0015]进一步地,所述采用C4.5决策树分类算法进一步判断所述流是否为真正大象流,具体包括以下子步骤:
[0016](a1)解析已经被判断为真正大象流的流的每一个数据包得到每一个数据包的5个特征,作为样本的属性,形成一个决策树训练集;所述5个特征包括数据包到达时间间隔、端口利用率、端口丢包率、数据包在交换机的时延以及队列拥塞度;
[0017](a2)使用c4.5决策树分类算法对样本训练集进行训练学习,通过计算信息增益率,选择最优的分裂属性,构建决策树模型;
[0018](a3)通过步骤(a2)中生成的决策树模型对步骤(1)判断为疑似大象流的流进行进一步判断,判断所述流是否为真正大象流。
[0019]进一步地,所述改进的蚂蚁算法,具体包括以下子步骤:
[0020](b1)初始化整个网络拓扑为一个无向图G=(V,E),其中V表示网络中交换机的集合,E代表网络的链路集合,令m=0;
[0021](b2)每个蚂蚁以信息素转移概率访问下一跳,直到所有蚂蚁到达目的主机;
[0022](b3)根据蚂蚁产生的信息素,对路径上的信息素值进行全局更新;
[0023](b4)判断迭代次数m是否大于等于迭代数M,如果大于等于则输出最优路径,否则m=m+1,返回步骤(b2)。
[0024]进一步地,步骤(b2)中所述信息素转移概率表示为:
[0025][0026]其中,表示t时刻处于位置i的蚂蚁k选择位置j的概率,v表示处于位置i的蚂
蚁可选的下一跳的集合;τ
ij
(t)表示t时刻位置i与位置j之间的信息素浓度,表示t时刻位置i与位置j之间的第一启发函数,表示t时刻处于位置i与位置j之间的第二启发函数;τ
in
(t)表示t时刻位置i与位置n之间的信息素浓度,表示t时刻位置i与位置n之间的第一启发函数,表示t时刻位置i与位置n之间的第二启发函数;α为信息素浓度的权值,β为第一启发函数的权值,γ为第二启发函数的权值。
[0027]进一步地,所述第一启发函数为:
[0028][0029]其中,load
ij
(t)为t时刻位置i和位置j之间的链路负载;B为位置i和位置j之间的链路带宽;
[0030]所述第二启发函数为:
[0031][0032]其中,Cost
ij
(t)为t时刻位置i和位置j之间的传输代价;
[0033]Cost
ij
=w1*delay
ij
+w2*loss
ij
+w3*FlowNum
ij

[0034]其中,w1+w2+w3=1;delay
ij
表示位置i和位置j之间的链路延迟,loss
ij
表示位置i和位置j之间的链路丢包率,FlowNum
ij
表示位置i和位置j之间的链路正在传输的流的数量。
[0035]进一步地,步骤(b本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据中心网络中大象流识别及调度方法,其特征在于,包括以下步骤:步骤(1):当数据中心网络中新的流到达边缘交换机时,计算所述流的队列长度累积速率,判断所述流的队列长度累积速率是否超过阈值;若所述流的队列长度累积速率超过阈值,则判断所述流是疑似大象流,反之判断所述流不是疑似大象流;当判断结果不是疑似大象流时,通过等价多路径的调度方法将所述流转发至目的主机,完成数据流的调度转发;步骤(2):当步骤(1)的判断结果是疑似大象流,采用C4.5决策树分类算法进一步判断所述流是否为真正大象流;当判断结果是真正大象流时,使用改进的蚂蚁算法获得最优路径,通过最优路径将所述流转发至目的主机,完成数据流的调度转发;当判断结果不是真正大象流时,通过等价多路径的调度方法将所述流转发至目的主机,完成数据流的调度转发。2.根据权利要求1所述的一种数据中心网络中大象流识别及调度方法,其特征在于,所述步骤(1)具体为:当数据中心网络中新的流到达边缘交换机时,通过带内网络遥测技术采集每个数据包到达边缘交换机时队列的长度和时间;并通过所述流的第1个数据包到达边缘交换机时队列的长度和时间以及第n个数据包到达边缘交换机时队列的长度和时间求得队列长度累积速率r;所述队列长度累积速率r的计算公式为:其中,L1、T1分别为所述流的第1个数据包到达边缘交换机时队列的长度和时间;L
n
、T
n
分别为所述流的第n个数据包到达边缘交换机时队列的长度和时间;n的取值范围根据用户实际的组网环境及业务需求而定;所述流包括N个报头五元组一致的数据包,N>n;判断所述流的队列长度累积速率r是否超过设定的阈值R;若所述流的队列长度累积速率r超过设定的阈值R,则判断所述流是疑似大象流;反之,判断所述流不是疑似大象流;当判断结果不是疑似大象流时,通过等价多路径的调度方法将所述流转发至目的主机,完成数据流的调度转发。3.根据权利要求1所述的一种数据中心网络中大象流识别及调度方法,其特征在于,所述采用C4.5决策树分类算法进一步判断所述流是否为真正大象流,具体包括以下子步骤:(a1)解析已经被判断为真正大象流的流的每一个数据包得到每一个数据包的5个特征,作为样本的属性,形成一个决策树训练集;所述5个特征包括数据包到达时间间隔、端口利用率、端口丢包率、数据包在交换机的时延以及队列拥塞度;(a2)使用c4.5决策树分类算法对样本训练集进行训练学习,通过计算信息增益率,选择最优的分裂属性,构建决策树模型;(a3)通过步骤(a2)中生成的决策树模型对步骤(1)判断为疑似大象流的流进行进一步判断,判断所述流是否为真正大象流。4.根据权利要求1所述的一种数据中心网络中大象流识别及调度方法,其特征在于,所述改进的蚂蚁算法,具体包括以下子步骤:(b1)初始化整个网络拓扑为一个无向图G=(V,E),其中V表示网络中交换机的集合,E代表网络的链路集合,令m=0;
(b...

【专利技术属性】
技术研发人员:王鹏吴春明张栋林建洪
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1