【技术实现步骤摘要】
片上数据交换的滚轮仲裁方法及电路
[0001]本专利技术涉及芯片设计、片上网络、片上系统、和计算机体系结构领域,尤其是一种片上数据交换网络的滚轮调度方法和电路实现。此种方法可以提高片上数据交换效率和速度,特别适合人工智能和大数据处理芯片,尤其是SIMT架构的芯片。
技术介绍
[0002]机器学习、科学计算和图形渲染需要巨大的计算能力,一般由大型芯片(如GPU、TPU、APU等)提供这样的算力,来实现高度复杂的机器学习任务和图形处理任务。用机器学习来做识别需要巨大的深度(Deep Learning)网络和海量的图像数据,训练过程非常耗时;一个三维应用或游戏场景中,若采用递归光追踪(Recursive Ray
‑
Tracing)渲染,且场景复杂,则需要做海量运算,也需要传递海量数据。这就要求极高的计算性能,也因此需要极宽的数据交换带宽来支持这样的需求。高性能的片上交换器就成了AI和GPU芯片的重要组成部件。
[0003]对于AI和图形计算这类特定场景,片上缓存和数据交换的仲裁方法非常重要。效率低的仲裁( ...
【技术保护点】
【技术特征摘要】
1.一种片上数据交换的滚轮仲裁方法,基于N输入端口N输出端口的的NxN交叉网络,一个输入端口对应的所有输出端口为一行,一个输出端口对应的所有输入端口为一列,每个输入输出交换点为一个传输对;其特征在于它包括以下步骤:S1、确定优先仲裁排列W
VOQ
={VOQ[0,a],VOQ[1,b],VOQ[2,c],
…
,VOQ[N
‑
1,x]},a、b、c
…
x∈[0,N
‑
1]且互不相同;优先仲裁排列W
VOQ
中的N个元素表示N个预期传输对,其中:VOQ[0,a]表示预期输入端口为PI0,预期输出端口为PO a的预期传输对;非优先仲裁排列W
VOQ
中的传输对为非预期传输对;S2、判断排列中各预期传输对是否有传输需求,是则确定为实际传输对,确定的实际传输对即可进行数据传输;S3、对于非预期传输对的交换点,首先进行每个输出端口的列仲裁或所处输入端口的列仲裁,获取可能的实际传输对;再针对可能的实际传输对进行行仲裁或列仲裁,选择优先级高的非预期传输对作为实际传输对;S4、步骤S3轮询完毕后,满足一定条件时,优先仲裁排列W
VOQ
滚动获得新的仲裁排列W'
VOQ
;否则滚轮保持不动;S5、循环进行S2
‑
S4。2.根据权利要求1所述的方法,其特征在于S1中,确定优先仲裁排列W
VOQ
={VOQ[0,0],VOQ[1,1],VOQ[2,2],
…
,VOQ[N
‑
1,N
‑
1]}。3.根据权利要求1所述的方法,其特征在于S2和S3中,对于burst传输应用,在确定为实际传输对前,需要确认该传输对上没有未完成的传输。4.根据权利要求1所述的方法,其特征在于S2和S3中,确定为实际传输对后,对实际传输对所处的行和列进行清除,不再参与下次传输需求仲裁。5.根据权利要求1所述的方法,其特征在于S4中,所述滚动条件为每...
【专利技术属性】
技术研发人员:王东辉,赵鹏,常亮,桑永奇,李甲,姚飞,
申请(专利权)人:海飞科南京信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。