【技术实现步骤摘要】
大数据流量的优先级分类方法、调度方法和装置
本专利技术涉及计算机领域,特别涉及一种大数据流量的优先级分类方法、调度方法和装置。
技术介绍
近年来,大数据处理架构,如Map-Reduce、Dryad、Spark、分布式存储等被广泛应用在数据中心,这些应用在运行时产生的大量网络流量给数据中心的网络带来了巨大的挑战。数据中心网络从拓扑设计、路由设计、传输优化等各方面进行了改进,使得数据网络的实时带宽和延时能满足应用需求。在数据中心传输优化方面的改进包括:根据数据流的特性进行分类,如PDQ(ProductDataQuality)或pFabric,然后采用SJF(ShortestJobFirst)策略,让小的数据流获得更多的带宽,从而,对减少数据流完成时间(FCT),进而减小应用延迟。然而,在数据中心,数据传输不可能仅仅通过一条流来完成,由于存在数据依赖,通常包含一组并行的数据流,当这一组数据流都传输完成,应用才可以进行下一步。因此,在这种场景下,仅仅进行流级别的优化是不够的,需要进行数据流组级别的优化。针对这个现象,美国加州伯克利大学提出了大数据流量(Coflow)的概念,以一个整体去调度一组上下文相关的数据流。目前已存在对Coflow进行优化的方法,如Varys使用SEBF(Smallest-Effective-Bottleneck-First)对Coflow的优先级进行优化,然后使用MADD(Minimum-Allocation-for-Desired-Duration)确定Coflow的带宽。但是,Varys需要预先知道Coflow的流大小、宽度、源地址等信 ...
【技术保护点】
1.一种大数据流量的优先级分类方法,应用于数据中心,所述数据中心网络包括m个入端口和n个出端口,其特征在于,所述方法包括以下步骤:步骤10:更新所述数据中心的大数据流量Coflow有序变量F,所述F包括所述数据中心正在传输的Coflow和待传输的Coflow,令k为所述F中Coflow的序号,k=1,2…K;步骤11:计算所述F中每个Coflow在所述m个入端口和n个出端口中已传输流量,查找所述每个Coflow在m个入端口和n个出端口中已传输流量的最小值并记为lk,k=1,2…K;步骤12:更新优先权指标ψk,k=1,2…K,所述ψk与所述lk成正比,所述ψk与wk成反比,所述wk为所述F中序号为k的Coflow的权重;步骤13:对所述ψk进行非递减排列得到ω,所述ω中第一项的ψk对应的序号为k的Coflow优先级最高,以后优先级逐项递减。
【技术特征摘要】
1.一种大数据流量的优先级分类方法,应用于数据中心,所述数据中心网络包括m个入端口和n个出端口,其特征在于,所述方法包括以下步骤:步骤10:更新所述数据中心的大数据流量Coflow有序变量F,所述F包括所述数据中心正在传输的Coflow和待传输的Coflow,令k为所述F中Coflow的序号,k=1,2…K;步骤11:计算所述F中每个Coflow在所述m个入端口和n个出端口中已传输流量,查找所述每个Coflow在m个入端口和n个出端口中已传输流量的最小值并记为lk,k=1,2…K;步骤12:更新优先权指标ψk,k=1,2…K,所述ψk与所述lk成正比,所述ψk与wk成反比,所述wk为所述F中序号为k的Coflow的权重;步骤13:对所述ψk进行非递减排列得到ω,所述ω中第一项的ψk对应的序号为k的Coflow优先级最高,以后优先级逐项递减。2.根据权利要求1所述的方法,其特征在于,所述ψk=lk/wk。3.根据权利要求1所述的方法,其特征在于,所述步骤13还包括:顺次逐项提取所述ω中ψk对应的Coflow序号k得到优先级次序R。4.一种大数据流量的调度方法,应用于数据中心,所述数据中心网络包括m个入端口和n个出端口,其特征在于,所述方法包括以下步骤:步骤20:更新所述数据中心的大数据流量Coflow有序变量F,所述F包括所述数据中心正在传输的Coflow和待传输的Coflow,令k为所述F中Coflow的序号,k=1,2…K;步骤21:计算所述F中每个Coflow在所述m个入端口和n个出端口中已传输流量,查找所述每个Coflow在m个入端口和n个出端口中已传输流量的最小值并记为lk,k=1,2…K;步骤22:更新优先权指标ψk,k=1,2…K,所述ψk与所述lk成正比,所述ψk与wk成反比,所述wk为所述F中序号为k的Coflow的权重;步骤23:对所述ψk进行非递减排列得到ω,顺次逐项提取所述ω中ψk对应的Coflow序号k得到优先级次序R;步骤24:按所述优先级次序R依次查看每条Coflow中是否存在未分配带宽的流量1≤i≤m,1≤j≤n,1≤k≤K,其中,或i表示序号为R(k)的Coflow流量的入端口序号,j表示序号为R(k)的Coflow流量的出端口序号,如果是,则执行步骤25;步骤25:查找当前所述m个入端口和n个出端口的剩余带宽中的最小值,记为r;步骤26:将入端口序号为i的端口和出端口序号为j的端口的剩余带宽中的r带宽分配给所述更新入端口序号为i的端口和出端口序号为j的端口的剩余带宽,返回步骤24。5.根据权利要求4所述的方法,其特征在于,所述ψk=lk/wk。6.一种大数据流量的优先级分类装置,应用于数据中心,所述数据中心网...
【专利技术属性】
技术研发人员:施新刚,张晗,尹霞,王之梁,李亚慧,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。