一种fabric实现结构和方法技术

技术编号：23084887 阅读：88 留言：0更新日期：2020-01-11 01:05

一种fabric实现结构和方法，在不降低性能的前提下，采用读写共享同一条总线，有效的减少了绕线的数量。两个LLC之间共享两条总线，一条是LLC1读/LLC0写，另一条是LLC0读/LLC1写，数据使用端Cx根据需要把数据请求分别发到两条总线上。例如，LLC1读出的数据被Cx取走，此时总线出现一个空洞，Cx或者之后的数据请求端发送写LLC0的请求，正好填补这个空洞，使总线的利用率得到保证。本发明专利技术的数据总线共享，没有额外的浪费；数据之间的仲裁比较简单，避免数据大量集中竞争总线，带来布局布线问题；各个数据请求端使用率可以通过仲裁器控制，可以全部平均或者局部平均，甚至某个独享，且不影响效率。

A fabric implementation structure and method

全部详细技术资料下载

【技术实现步骤摘要】
一种fabric实现结构和方法
本专利技术属于数据传送领域，具体涉及一种fabric实现结构和方法。
技术介绍
超算芯片中，运算单元离数据存储必然有比较远的距离，数据传送是芯片中的难点之一，为每个单元配备单独总线，显得太浪费，尤其是功耗；共享总线则带来绕线和带宽的问题。所以在平衡带宽和功耗的之间，找到合适的方法尤为重要。
技术实现思路
本专利技术针对现有技术中的不足，提供一种fabric实现结构和方法。为实现上述目的，本专利技术采用以下技术方案：一种fabric实现结构，其特征在于，包括：最后一级缓存LLC0和LLC1、数据使用端C0～Cn-1、写请求仲裁器WRA0和WRA1、读请求仲裁器RDA0和RDA1、数据存放寄存器Rs0和Rs1；最后一级缓存LLC0和LLC1之间共享两条总线B0和B1，总线B0同时用于读最后一级缓存LLC1和写最后一级缓存LLC0，总线B1同时用于读最后一级缓存LLC0和写最后一级缓存LLC1，总线B0和B1分别对应于数据存放寄存器Rs0和Rs1，每个数据存放寄存...

【技术保护点】
1.一种fabric实现结构，其特征在于，包括：最后一级缓存LLC0和LLC1、数据使用端C0～Cn-1、写请求仲裁器WRA0和WRA1、读请求仲裁器RDA0和RDA1、数据存放寄存器Rs0和Rs1；最后一级缓存LLC0和LLC1之间共享两条总线B0和B1，总线B0同时用于读最后一级缓存LLC1和写最后一级缓存LLC0，总线B1同时用于读最后一级缓存LLC0和写最后一级缓存LLC1，总线B0和B1分别对应于数据存放寄存器Rs0和Rs1，每个数据存放寄存器都包括节点D0～Dn-1，数据流在各节点上每个时钟周期往前滚动一次；写请求仲裁器WRA0和读请求仲裁器RDA0之间通讯，用于保证读写在总线B0...

【技术特征摘要】
1.一种fabric实现结构，其特征在于，包括：最后一级缓存LLC0和LLC1、数据使用端C0～Cn-1、写请求仲裁器WRA0和WRA1、读请求仲裁器RDA0和RDA1、数据存放寄存器Rs0和Rs1；最后一级缓存LLC0和LLC1之间共享两条总线B0和B1，总线B0同时用于读最后一级缓存LLC1和写最后一级缓存LLC0，总线B1同时用于读最后一级缓存LLC0和写最后一级缓存LLC1，总线B0和B1分别对应于数据存放寄存器Rs0和Rs1，每个数据存放寄存器都包括节点D0～Dn-1，数据流在各节点上每个时钟周期往前滚动一次；写请求仲裁器WRA0和读请求仲裁器RDA0之间通讯，用于保证读写在总线B0上不冲突；写请求仲裁器WRA1和读请求仲裁器RDA1之间通讯，用于保证读写在总线B1上不冲突；数据使用端C0～Cn-1根据需要将数据请求发送到各总线上，用于传送数据到节点以及获取各节点的数据。

2.如权利要求1所述的一种fabric实现结构，其特征在于：数据使用端C0～Cn-1的数量可扩展，每个数据使用端平均享受1/n总线带宽。

3.如权利要求1所述的一种fabric实现结构，其特征在于：数据使用端C0～Cn-1可关闭其中任意m个，m<n，总线效率不降低，剩余数据使用端平均享受1/(n-m)总线带宽。

4.一种如权利要求1～3中任一所述的fabric实现结构的实现方法，其特征在于，包括：
对于总线B0，所有读最后一级缓存LLC1的请求进入读请求仲裁器RDA0，所有写最后一级缓存LLC0的请求进入写请求仲裁器WRA0；读请求仲裁器RDA0记录仲裁历史，根据仲裁历史和当前请求派发仲裁结果，同时对最后一级缓存LL...

【专利技术属性】
技术研发人员：王永流，邹云晓，李先彧，
申请(专利权)人：南京天数智芯科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人