当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于预测的交换机PFC控制方法及控制系统技术方案

技术编号:17784022 阅读:72 留言:0更新日期:2018-04-22 15:20
本发明专利技术提供了一种基于预测的交换机PFC控制方法及控制系统。所述基于预测的交换机PFC控制方法包括如下步骤:监测交换机端口的出队列,判断出队列的长度是否超过阈值,如果出队列的长度超过阈值,预测交换机需要发送PFC暂停报文;如果预测交换机需要发送PFC暂停报文,预测需要向哪些端口发送PFC暂停报文,输出应发送PFC暂停报文的“入口端号+优先级”集合,记作集合S;在所述集合S中,分别对每个“入口端号+优先级”计算PFC暂停时间;根据PFC暂停时间构建并输出“入口端号+优先级+暂停时间”集合,记作集合T,交换机遍历所述集合T,将每一“入口端号+优先级+暂停时间”中的优先级和暂停时间填入到PFC暂停报文中,并通过端口发送出去。

【技术实现步骤摘要】
一种基于预测的交换机PFC控制方法及控制系统
本专利技术属于涉及一种基于预测的交换机PFC控制方法及控制系统。
技术介绍
远程直接内存访问(RDMA,RemoteDirectMemoryAccess)是一个相对比较成熟的技术,在高性能计算领域已经广泛应用。由于RDMA低时延,高带宽和低CPU占用率的特性,近些年数据中心也开始采用RDMA技术加速业务的网络传输速度。高性能计算领域中广泛应用的RDMA技术方案是InfiniBand,目前数据中心中流行的方案是RoCEv2(RDMAOverConvergedEthernetv2),其将InfiniBand的网络层和链路层协议替换为以太网对应的协议,InfiniBand的传输层和RDMA应用API保持不变,旧有的RDMA代码可以方便地移植到RoCEv2环境中。与传统的TCP/IP网络不同,RDMA技术要求网络是无损的,即网络传输中不允许出现因交换机缓冲溢出而丢包。以太网协议中,目前使用基于优先级的流控(PFC,Priority-basedFlowControl)协议保证网络是无损的。PFC是一个逐跳起作用的二层网络协议,交换机会检测每个端口每个优先级的入队列长度,在长度超过设定的阈值Xoff后,交换机会通过该端口向上游端口发送PFC暂停报文,上游端口收到该报文后立刻停止发送该优先级的数据;当入队列长度低于设定的阈值Xon后,交换机可以向上游端口发送PFC恢复报文,上游端口收到恢复报文后,立刻恢复数据发送。PFC是暂停端口中某个优先级的数据发送,而不是端口的数据发送。但是,PFC的引入会导致以下问题:由于PFC的流控粒度是针对优先级的,这是一个比较粗的控制粒度(交换机每个端口只支持8个优先级),PFC会导致流的不公平和队头阻塞(Head-of-lineblocking)等问题。为解决此问题,目前主流的方法是采用DCQCN(DataCenterQCN)拥塞控制机制。DCQCN采用RED-ECN(RandomEarlyDetection-ExplicitCongestionNotification)作为拥塞信号产生方式,即交换机出队列长度在超过阈值后,交换机根据队列长度按照一定的概率对报文打上ECN拥塞标志,队列长度越长,打标的概率越大。接收方在收到带有ECN标记的报文后,会产生信令报文CNP(CongestionNotificationPacket)通知数据发送方降速。发送方如果在一段时间内没有继续收到CNP报文,则开始主动恢复发送速度。DCQCN作为端到端拥塞控制机制,从拥塞信号产生,到接收端相应拥塞信号,再到源端收到CNP报文降速,要经历一个往返时延(RTT,RoundTripTime),在某些场景下,DCQCN的收敛速度会比较慢,尤其是incast情形(多台主机同时向一台主机发送数据)。收敛速度变慢会影响交换机端口的出队列拥塞程度增加,从而导致流经该出端口的报文时延变长。在时延敏感的应用中,这样的情况是几乎不能忍受的。
技术实现思路
本专利技术的目的在于针对现有技术的缺陷,提供一种基于预测的交换机PFC控制方法及控制系统,通过实时监控气象文件数据源,自动形成解析任务,通过适配器调用分布式解析组件,从而达到文件高时效、高质量入库功能,进而高效准确的进行风能资源的评估。本专利技术的技术方案如下:一种基于预测的交换机PFC控制方法包括如下步骤:一、监测交换机每个端口的每个出队列,判断出队列的长度是否超过阈值,二、如果所述出队列的长度超过阈值,则预测交换机是否需要发送PFC暂停报文;三、如果预测到交换机需要发送PFC暂停报文,则预测需要向哪些端口发送PFC暂停报文,并根据端口号和报文的优先级信息输出应发送PFC暂停报文的“入口端号+优先级”集合,记作集合S;四、在所述集合S中,分别对对集合S内每个“入口端号+优先级”元素计算PFC暂停时间;五、根据计算得到的PFC暂停时间构建并输出“入口端号+优先级+暂停时间”集合,记作集合T,交换机遍历所述集合T,将集合T内每一“入口端号+优先级+暂停时间”元素中的优先级和暂停时间填入到PFC暂停报文中,并通过对应的端口发送出去。优选地,在步骤二中,如果所述出队列的长度超过阈值,则,统计交换机所有端口所有入队列的速度总和Incrementtotal,通过公式预测交换机缓冲空间的耗尽时间是否小于设定阈值,如果交换机缓冲空间的耗尽时间小于设定阈值,则预测交换机需要发送PFC暂停报文;反之,则预测交换机不需要发送PFC暂停报文。优选地,具体包括如下步骤:将出队列中的报文按照“入口端号+优先级”的来源方式统计;随机选择出队列中的报文,找到该报文所属的入口端号和优先级,如果入口端号对应的优先级队列的实时接收的增长速率大于设定阈值,则将该所述入口端号加入到待暂停集合中,输出应发送PFC暂停报文的“入口端号+优先级”集合,记作集合S。优选地,在步骤四中,遍历集合S,分别对每一个“入口端号+优先级”按照公式:计算得到暂停时间time[port][priority]。优选地,交换机每个端口的每个优先级均设置速率计数器,用于实时显示当前优先级的入队列长度变化速率。一种基于预测的交换机PFC控制系统包括:拥塞监测模块,监测交换机每个端口的每个出队列,判断出队列的长度是否超过阈值,PFC暂停报文预测模块,用于在接收到实时拥塞监测模块传递的拥塞信号后,预测交换机是否需要发送PFC暂停报文;端口选择模块,用于在接收到实时PFC暂停报文预测模块的预测结果后,预测需要向哪些端口发送PFC暂停报文,并输出应发送PFC暂停报文的“入口端号+优先级”集合,并记作集合S;PFC暂停时间计算模块,用于分别对所述集合S中每个“入口端号+优先级”计算PFC最优暂停时间,PFC暂停报文发送模块,用于将所述PFC暂停时间计算模块得到的最优暂停时间添加到集合S中输出“入口端号+优先级+暂停时间”集合,并记作集合T,交换机遍历所述集合T,将每一“入口端号+优先级+暂停时间”中的优先级和暂停时间填入到PFC暂停报文中,并通过对应的端口发送出去。优选地,如果所述出队列的长度超过阈值,则,所述PFC暂停报文预测模块统计交换机所有端口所有入队列的速度总和Incrementtotal,并通过公式预测交换机缓冲空间的耗尽时间是否小于设定阈值,如果交换机缓冲空间的耗尽时间小于设定阈值,则预测交换机需要发送PFC暂停报文;反之,则预测交换机不需要发送PFC暂停报文,其中,switch_spaceleft为交换机剩余缓冲空间,Incrementtotal代表交换机缓冲空间的消耗速度。优选地,所述端口选择模块将出队列中的报文按照“入口端号+优先级”的来源方式统计,并随机选择出队列中的报文,找到该报文所属的入口端号和优先级,如果入口端号对应的优先级队列的实时接收的增长速率大于设定阈值,则将该所述入口端号加入到待暂停集合中,输出基于“入口端号+优先级”的待暂停集合,记作集合S。优选地,所述PFC暂停时间计算模块遍历集合S,分别对每一个“入口端号+优先级”按照公式:计算得到暂停时间time[port][priority]其中,packets[port][priority]为每个端口每个优先级的报文数量,incr本文档来自技高网
...
一种基于预测的交换机PFC控制方法及控制系统

【技术保护点】
一种基于预测的交换机PFC控制方法,其特征在于:包括如下步骤:一、监测交换机每个端口的每个出队列,判断出队列的长度是否超过阈值;二、如果所述出队列的长度超过阈值,则预测交换机是否需要发送PFC暂停报文;三、如果预测到交换机需要发送PFC暂停报文,则预测需要向哪些端口发送PFC暂停报文,并根据端口号和报文的优先级信息输出应发送PFC暂停报文的“入口端号+优先级”集合,记作集合S;四、在所述集合S中,分别对集合S内每个“入口端号+优先级”元素计算PFC暂停时间;五、根据计算得到的PFC暂停时间构建并输出“入口端号+优先级+暂停时间”集合,记作集合T,交换机遍历所述集合T,将集合T内每一“入口端号+优先级+暂停时间”元素中的优先级和暂停时间填入到PFC暂停报文中,并通过对应的端口发送出去。

【技术特征摘要】
1.一种基于预测的交换机PFC控制方法,其特征在于:包括如下步骤:一、监测交换机每个端口的每个出队列,判断出队列的长度是否超过阈值;二、如果所述出队列的长度超过阈值,则预测交换机是否需要发送PFC暂停报文;三、如果预测到交换机需要发送PFC暂停报文,则预测需要向哪些端口发送PFC暂停报文,并根据端口号和报文的优先级信息输出应发送PFC暂停报文的“入口端号+优先级”集合,记作集合S;四、在所述集合S中,分别对集合S内每个“入口端号+优先级”元素计算PFC暂停时间;五、根据计算得到的PFC暂停时间构建并输出“入口端号+优先级+暂停时间”集合,记作集合T,交换机遍历所述集合T,将集合T内每一“入口端号+优先级+暂停时间”元素中的优先级和暂停时间填入到PFC暂停报文中,并通过对应的端口发送出去。2.根据权利要求1所述的一种基于预测的交换机PFC控制方法,其特征在于:在步骤二中,如果所述出队列的长度超过阈值,则,统计交换机所有端口所有入队列的速度总和Incrementtotal,通过公式预测交换机缓冲空间的耗尽时间是否小于设定阈值,如果交换机缓冲空间的耗尽时间小于设定阈值,则预测交换机需要发送PFC暂停报文;反之,则预测交换机不需要发送PFC暂停报文;其中,switch_spaceleft为交换机剩余缓冲空间,Incrementtotal代表交换机缓冲空间的消耗速度。3.根据权利要求1所述的一种基于预测的交换机PFC控制方法,其特征在于:在步骤三中,具体包括如下步骤:将出队列中的报文按照“入口端号+优先级”的来源方式统计;随机选择出队列中的报文,找到该报文所属的入口端号和优先级,如果入口端号对应的优先级队列的实时接收的增长速率大于设定阈值,则将该所述入口端号加入到待暂停集合中,输出应发送PFC暂停报文的“入口端号+优先级”集合,记作集合S。4.根据权利要求1所述的一种基于预测的交换机PFC控制方法,其特征在于:在步骤四中,遍历集合S,分别对每一个“入口端号+优先级”按照公式:计算得到暂停时间time[port][priority],其中,packets[port][priority]为每个端口每个优先级的报文数量,increment[port][priority]为每个端口每个优先级入队列增长速率,Transmissionspeed表示出队列对应端口的线速度。5.根据权利要求1所述的一种基于预测的交换机PFC控制方法,其特征在于:交换机每个端口的每个优先级均设置速率计数器,用于实时显示当前优先级的入队列...

【专利技术属性】
技术研发人员:杨杰李波田臣王炜
申请(专利权)人:南京大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1