【技术实现步骤摘要】
一种fabric实现结构和方法
本专利技术属于数据传送领域,具体涉及一种fabric实现结构和方法。
技术介绍
超算芯片中,运算单元离数据存储必然有比较远的距离,数据传送是芯片中的难点之一,为每个单元配备单独总线,显得太浪费,尤其是功耗;共享总线则带来绕线和带宽的问题。所以在平衡带宽和功耗的之间,找到合适的方法尤为重要。
技术实现思路
本专利技术针对现有技术中的不足,提供一种fabric实现结构和方法。为实现上述目的,本专利技术采用以下技术方案:一种fabric实现结构,其特征在于,包括:最后一级缓存LLC0和LLC1、数据使用端C0~Cn-1、写请求仲裁器WRA0和WRA1、读请求仲裁器RDA0和RDA1、数据存放寄存器Rs0和Rs1;最后一级缓存LLC0和LLC1之间共享两条总线B0和B1,总线B0同时用于读最后一级缓存LLC1和写最后一级缓存LLC0,总线B1同时用于读最后一级缓存LLC0和写最后一级缓存LLC1,总线B0和B1分别对应于数据存放寄存器Rs0和Rs1,每个数据存放寄存 ...
【技术保护点】
1.一种fabric实现结构,其特征在于,包括:最后一级缓存LLC0和LLC1、数据使用端C0~Cn-1、写请求仲裁器WRA0和WRA1、读请求仲裁器RDA0和RDA1、数据存放寄存器Rs0和Rs1;最后一级缓存LLC0和LLC1之间共享两条总线B0和B1,总线B0同时用于读最后一级缓存LLC1和写最后一级缓存LLC0,总线B1同时用于读最后一级缓存LLC0和写最后一级缓存LLC1,总线B0和B1分别对应于数据存放寄存器Rs0和Rs1,每个数据存放寄存器都包括节点D0~Dn-1,数据流在各节点上每个时钟周期往前滚动一次;写请求仲裁器WRA0和读请求仲裁器RDA0之间通讯,用 ...
【技术特征摘要】
1.一种fabric实现结构,其特征在于,包括:最后一级缓存LLC0和LLC1、数据使用端C0~Cn-1、写请求仲裁器WRA0和WRA1、读请求仲裁器RDA0和RDA1、数据存放寄存器Rs0和Rs1;最后一级缓存LLC0和LLC1之间共享两条总线B0和B1,总线B0同时用于读最后一级缓存LLC1和写最后一级缓存LLC0,总线B1同时用于读最后一级缓存LLC0和写最后一级缓存LLC1,总线B0和B1分别对应于数据存放寄存器Rs0和Rs1,每个数据存放寄存器都包括节点D0~Dn-1,数据流在各节点上每个时钟周期往前滚动一次;写请求仲裁器WRA0和读请求仲裁器RDA0之间通讯,用于保证读写在总线B0上不冲突;写请求仲裁器WRA1和读请求仲裁器RDA1之间通讯,用于保证读写在总线B1上不冲突;数据使用端C0~Cn-1根据需要将数据请求发送到各总线上,用于传送数据到节点以及获取各节点的数据。
2.如权利要求1所述的一种fabric实现结构,其特征在于:数据使用端C0~Cn-1的数量可扩展,每个数据使用端平均享受1/n总线带宽。
3.如权利要求1所述的一种fabric实现结构,其特征在于:数据使用端C0~Cn-1可关闭其中任意m个,m<n,总线效率不降低,剩余数据使用端平均享受1/(n-m)总线带宽。
4.一种如权利要求1~3中任一所述的fabric实现结构的实现方法,其特征在于,包括:
对于总线B0,所有读最后一级缓存LLC1的请求进入读请求仲裁器RDA0,所有写最后一级缓存LLC0的请求进入写请求仲裁器WRA0;读请求仲裁器RDA0记录仲裁历史,根据仲裁历史和当前请求派发仲裁结果,同时对最后一级缓存LL...
【专利技术属性】
技术研发人员:王永流,邹云晓,李先彧,
申请(专利权)人:南京天数智芯科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。