当前位置: 首页 > 专利查询>同济大学专利>正文

针对超大规模片上网络容忍众故障的确定性路径路由方法技术

技术编号:21777348 阅读:25 留言:0更新日期:2019-08-03 23:14
本发明专利技术涉及一种针对超大规模片上网络容忍众故障的确定性路径路由方法,该方法在片上网络的每个交换机上维护一路由表,各交换机基于该路由表进行在线路由,所述路由表离线生成,生成过程包括:基于Tarjan算法计算片上网络的最大强连通分量,删除故障节点及故障链路,利用广度优先遍历策略遍历片上网络剩余节点及链路,生成路由表。与现有技术相比,本发明专利技术不仅能够容忍多种故障的影响,而且能够最大化重构NoC中的可用节点,在平均延迟,吞吐量和能量消耗方面的性能也优于现有解决方案。

Deterministic path routing method for crowd-tolerant fault in ultra-large scale network-on-chip

【技术实现步骤摘要】
针对超大规模片上网络容忍众故障的确定性路径路由方法
本专利技术属于片上网络的架构设计和路由
,涉及一种超大规模片上网络的路由方法,尤其是涉及一种针对超大规模片上网络容忍众故障的确定性路径路由方法。
技术介绍
凭借强大的并行通信能力,大规模片上网络已经成为超级计算机中最有前途的结构。而晶圆级NoC(NetworkOnChip,片上网络)可以将芯片之间的大量并行通信移动到芯片内部,这减少了传输延迟,从而显着提高了计算性能。同时,由于将单个芯片作为小型超级计算机,这种结构可以让超级计算机更加节省能量。因此,开发晶圆级NoC成为进一步提高超级计算机性能的有效措施。确保高产量是开发晶圆级NoC的关键问题。大规模晶圆级NoC将遇到许多故障问题,因为芯片上的故障概率与芯片的尺寸成比例。如果在NoC中的任何地方出现故障时直接丢弃每个故障的晶片级NoC,则产量将非常低,并且生产成本不切实际地高。保持晶圆级NoC的高产量的可行解决方案是在晶圆上实现更多的处理路由器(即节点),只要芯片上可用节点的数量超过设计要求,就将故障芯片视为良好的芯片。幸运的是,NoC通信结构支持此解决方案,因为它为节点间通信提供了自然的许多备用路径。我们需要的是一种路由算法,以容忍在晶圆级NoC的制造和操作阶段可能发生的潜在的许多故障。片上网络系统主要由以下部分组成:网络接口、处理单元、路由器和互连网络,由于其自身元器件的电气特性而极大地增加了产生故障的可能性。因此,片上网络需要具备有强大的容错能力,容错相关技术是片上网络的重要支撑技术之一。由于在NoC中,路由可能会产生循环依赖以致导致发生路由死锁,使路由的数据包处在无限等待下一跳缓存区处于空闲状态,这会导致路由的数据包无法到达目的地,因此,如何避免死锁也是容错路由算法一个很重要的研究内容。由于可以使用无故障的链路来替换故障连链路或者是绕过故障节点,因此,容错路由算法可以为NoC提供一定的容错能力。其次,在NoC中,如果某一个节点同一时刻接收或者传递过多的数据包,就会导致缓存区一直处于忙碌状态,没有空闲的缓存区,这会导致需要路由到这一节点的数据包处于等待状态,会导致局部的路由拥塞,增加了路由的延迟从而使NoC的性能降低。因此容错路由算法也需要很好地解决路由拥塞,才能使算法在容错的同时具备较高的性能。在NoC的容错路由算法领域,已经有很多的研究成果,但是大部分都没有考虑NoC中可能存在的众多故障。基于Turnmodel理论提出了几种容错路由算法,这些路由算法不依赖于虚拟通道,并且可以又很有的避免死锁的效果,但是这些路由算法由于严格遵守了禁止转向的规则,从而导致严格禁用了指定的路由转向,这会导致有一些路由因为这些规则不能发生,会造成一定程度的丢包现象。HamFA算法是一种简单可行的路由算法,它可以容忍链路故障。该算法为NoC的每个节点分配HamFAID。然后,它根据这些HamFAID将网络划分为两个子通道:升序通道和降序通道。该算法还设置从当前节点到北邻居(或南邻居)节点的链路作为快速链路。路由器更倾向于通过快速链路发送数据包。当故障出现在快速链路上时,路由器使用上行路径(或下行路径)。因此,该算法通常容忍单个故障的影响。但是,当快速路径与下行(或上升)路径重合,并且故障刚好出现在相应的链路上时,该算法将无法容忍这样的故障。ZoneDefense算法是一种能够容忍多故障的强大的路由算法,但是其只针对节点故障。该算法首先根据现有故障节点确定不安全节点。然后,它设置几个矩形区域以覆盖所有不安全的节点,这样的区域称为不安全区域。之后,该算法提出Lchains(或Fchains)来围绕这些区域。最后,即使出现多个故障节点,该算法也可以通过Lchains(或Fchains)发送数据包并绕过这些故障区域,从而实现容忍多个故障节点。但是,该算法牺牲了包含在不安全区域中的所有原始无故障节点。因此,该算法不适用于具有众多故障的NoC,因为它几乎不能确保NoC具有足够的可用节点以满足设计要求。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种针对超大规模片上网络容忍众故障的确定性路径路由方法。本专利技术的目的可以通过以下技术方案来实现:一种针对超大规模片上网络容忍众故障的确定性路径路由方法,其特征在于,该方法在片上网络的每个交换机上维护一路由表,各交换机基于该路由表进行在线路由,所述路由表离线生成,生成过程包括:基于Tarjan算法计算片上网络的最大强连通分量,删除故障节点及故障链路,利用广度优先遍历策略遍历片上网络剩余节点及链路,生成路由表。进一步地,将片上网络视为一个有向图生成路由表,每一个节点对应所述有向图中的一个节点,每一条链路对应所述有向图中的一个有向边,节点的标签按照从下到上、从左到右的顺序依次排序。进一步地,在片上网络在线检测到故障时,路由表离线更新,实现路由表的动态重配置。进一步地,利用所述广度优先遍历策略生成路由表时:A)忽略已经遍历过的已经在路由树中的邻居节点;B)选择邻居节点作为孩子节点时,优先选择标签值最小的节点。进一步地,利用所述广度优先遍历策略生成路由表时,仅获取可达邻居节点。进一步地,在发生故障时,基于Turnmodel理论对片上网络的节点及链路进行预处理后,生成所述路由表。进一步地,所述预处理包括:P1)当片上网络的西或南边界出现故障链路时,将该故障链路相对反向链路设置为故障链路,并将故障链路称为弃用链路;P2)当垂直或水平方向的弃用链路的东邻居或北邻居链路出现故障时,将故障链路设置为弃用链路;P3)当节点的西向和南向链路均为非弃用链路,而西输出链路和南输出链路均为故障链路时,将该节点设置为已弃用节点;在片上网络中删除弃用链路和已弃用节点后,利用广度优先遍历策略进行遍历,生成路由表。进一步地,基于Turnmodel理论生成路由表时,R1)若当前节点的西链路和其西邻节点的北链路均为非弃用链路,而当前节点的西输出链路或其西邻节点的北输出链路有故障,则以当前节点及其正东侧所有节点的北输出链路均为故障链路为基础,计算当前节点的西侧区域内节点的路由方向;R2)若当前节点的南链路和其南邻节点的东链路均为非弃用链路,而当前节点的南输出链路或其南邻节点的东输出链路有故障,则以当前节点正东侧所有节点的南输出链路均为故障链路为基础,计算当前节点的南侧区域内节点的路由方向。与现有技术相比,本专利技术具有以如下有益效果:1、本专利技术方法利用广度优先遍历策略生成路由表,不仅可以容忍许多故障,还可以能尽量选择最短的路由路径,确保交换机在一个周期内具有较小的单跳延迟;2、本专利技术使用Tarjan算法进行动态重新配置,在重新配置后最大化NoC上的可用节点;3、本专利技术基于Turnmodel理论设置了弃用链路/节点,可以在不适用虚拟信道的情况下实现NoC的无死锁通信;4、本专利技术在平均延迟,吞吐量和能量消耗方面的性能也优于现有解决方案。附图说明图1为本专利技术的总体设计示意图;图2为本专利技术路由表的结构示意图;图3为动态重配置实例示意图;图4为无故障时NoC中可能产生的路由转向,其中,(4a)为所有可能转向,(4b)为顺时针环,(4c)为逆时针环;图5为有故障时NoC中可能产生的死锁,其中,(5a)为故障导致不本文档来自技高网
...

【技术保护点】
1.一种针对超大规模片上网络容忍众故障的确定性路径路由方法,其特征在于,该方法在片上网络的每个交换机上维护一路由表,各交换机基于该路由表进行在线路由,所述路由表离线生成,生成过程包括:基于Tarjan算法计算片上网络的最大强连通分量,删除故障节点及故障链路,利用广度优先遍历策略遍历片上网络剩余节点及链路,生成路由表。

【技术特征摘要】
1.一种针对超大规模片上网络容忍众故障的确定性路径路由方法,其特征在于,该方法在片上网络的每个交换机上维护一路由表,各交换机基于该路由表进行在线路由,所述路由表离线生成,生成过程包括:基于Tarjan算法计算片上网络的最大强连通分量,删除故障节点及故障链路,利用广度优先遍历策略遍历片上网络剩余节点及链路,生成路由表。2.根据权利要求1所述的针对超大规模片上网络容忍众故障的确定性路径路由方法,其特征在于,将片上网络视为一个有向图生成路由表,每一个节点对应所述有向图中的一个节点,每一条链路对应所述有向图中的一个有向边,节点的标签按照从下到上、从左到右的顺序依次排序。3.根据权利要求1所述的针对超大规模片上网络容忍众故障的确定性路径路由方法,其特征在于,在片上网络在线检测到故障时,路由表离线更新,实现路由表的动态重配置。4.根据权利要求1所述的针对超大规模片上网络容忍众故障的确定性路径路由方法,其特征在于,利用所述广度优先遍历策略生成路由表时:A)忽略已经遍历过的已经在路由树中的邻居节点;B)选择邻居节点作为孩子节点时,优先选择标签值最小的节点。5.根据权利要求1所述的针对超大规模片上网络容忍众故障的确定性路径路由方法,其特征在于,利用所述广度优先遍历策略生成路由表时,仅获取可达邻居节点。6.根据权利要求1所述的针对超大规模片上网络容忍众故障的确定性路径...

【专利技术属性】
技术研发人员:张颖陈中胜季鹏飞江建慧
申请(专利权)人:同济大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1