一种AI智算中心的网络拥塞调度方法及系统技术方案

技术编号:42247809 阅读:19 留言:0更新日期:2024-08-02 13:57
本发明专利技术涉及AI智算中心的网络以及网络拥塞控制技术领域,具体为一种基于P4可编程交换机的主动队列管理算法,包括以下步骤:步骤1:复制报文并区分业务报文和控制报文,步骤2:选择队列,步骤3:更新队列长度的与计算平均队列长度,步骤4:通过平均队列长度匹配丢弃概率,步骤5:在入口管道存储丢弃概率,步骤6:区分准入流量和非准入流量,步骤7:对非准入流量按照概率丢弃,本发明专利技术将队列管理的拥塞检测和反馈机制解耦,通过复制产生控制报文,由业务报文实现拥塞检测,由控制报文实现反馈丢弃概率的问题,既保障了业务报文的正常转发,又实现了细粒度的反馈。

【技术实现步骤摘要】

本专利技术涉及可编程网络以及网络拥塞控制,具体为一种ai智算中心的网络拥塞调度方法及系统。


技术介绍

1、p4可编程交换机常用于数据中心网络中,为端到端数据传输提供了冗余路径。p4可编程交换机的转发模式是流水线模式,数据包需要依次经过该交换机的入口管道、流量管理器和出口管道。然而,排队时延需要数据包在出口管道才能获取,而数据包需要在入口管道设置转发端口后才能在流量管理器中排队,需要额外的反馈机制才能传递队列信息。此外,p4可编程交换机的链路速率最高支持100gbps甚至400gbps,而每个端口的默认缓冲区容量不足2mb,意味着从拥塞发生到满队列只需0.15毫秒,这无疑增加了有效管理队列的挑战性。因此,在p4可编程交换机中部署合适的队列管理算法,对实时且有效的拥塞控制具有重要意义。

2、与此有关中国专利cn202210380163.1公开了一种增强red稳定性的主动式队列管理算法,以及有关会议论文《tofino+p4:a strong compound for aqm on high-speednetworks?》和《ired:improvin本文档来自技高网...

【技术保护点】

1.一种AI智算中心的网络拥塞调度方法及系统,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种AI智算中心的网络拥塞调度方法及系统,其特征在于,所述步骤3中,avgQ为队列的指数加权移动平均(EWMA),记作平均队列长度,则avgQ_now为当前的平均队列长度,avgQ_last为上一次测得的平均队列长度,ω为权重,Q为数据包的瞬时队列长度,为便于阐述,令A为(1-ω)×avgQ_last,B为ω×Q。

3.根据权利要求2所述的一种AI智算中心的网络拥塞调度方法及系统,其特征在于,所述步骤4中,avgQ为上一步得到的平均队列长度,min_th和max_th...

【技术特征摘要】

1.一种ai智算中心的网络拥塞调度方法及系统,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种ai智算中心的网络拥塞调度方法及系统,其特征在于,所述步骤3中,avgq为队列的指数加权移动平均(ewma),记作平均队列长度,则avgq_now为当前的平均队列长度,avgq_last为上一次测得的平均队列长度,ω为权重,q为数据包的瞬时队列长度,为便于阐述,令a为(1-ω)×avgq_last,b为ω×q。

3.根据权利要求2所述的一种ai智算中心的网络拥塞调度方法及系统,其特征在于,所述步骤4中,avgq为上一步得到的平均队列长度,min_th和max_th是预定义的最小队列长度阈值和最大队列长度阈值,p(avgq)是平均队列长度为avgq时的丢弃概率,pmax是达到最大队列长度阈值时的丢弃概率。

4.根据权利要求3所述的一种ai智算中心的网络拥塞调度方法及系统,其特征在于,所述步骤6中,若pkt_len<=pbs,则将pbs减去pkt_len,该业务报文被判定为准入流量,直接进入流量管理器;

5.根据权利要求4所述的一种ai智算中心的网络拥塞调度方法及系统,其特征在于,所述步骤7中,若rnd<=drop_prob,则将该报文丢弃;

6.根据权利...

【专利技术属性】
技术研发人员:聂伟
申请(专利权)人:苏州智算科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1