分形计算装置、方法、集成电路及板卡制造方法及图纸

技术编号:26173059 阅读:27 留言:0更新日期:2020-10-31 13:53
本公开涉及分形计算装置、方法、集成电路及板卡,其中本公开的分形计算装置包括在集成电路装置中,该集成电路装置包括通用互联接口和其他处理装置。计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。集成电路装置还可以包括存储装置,存储装置分别与计算装置和其他处理装置连接,用于计算装置和其他处理装置的数据存储。

Fractal computing device, method, integrated circuit and board

【技术实现步骤摘要】
分形计算装置、方法、集成电路及板卡
本公开一般地涉及神经网络领域。更具体地,本公开涉及分形计算装置、方法、集成电路及板卡。
技术介绍
机器学习技术已经大量应用于新兴商业,像是图像识别、文本识别、语音识别、面部识别视频分析、广告推荐和游戏等领域。近年来,许多不同规模的专用机器学习计算装置已部署在各种的嵌入式设备、服务器和数据中心中,人们的生活早已离不开机器学习技术。大多数的机器学习计算装置持续专注于优化性能,光是2012年到2018年间,其功效增长了逾1200倍。虽然机器学习计算装置的能效一直在快速增长,但是编程效率的发展有限,阻碍了机器学习技术的普及化。即使现有的计算装置具有很高的峰值性能,但精简的硬件控制管理和软件堆栈对于机器学习计算装置的实际性能仍然至关重要。不仅如此,现有的机器学习计算装置的异构性、并行性和分层特性也影响了编程效率。因此,一种同构、串行的分层结构、具有相同的指令集的机器学习计算装置是迫切需要的。
技术实现思路
为了至少部分地解决
技术介绍
中提到的技术问题,本公开的方案提供了一种分形计算装置本文档来自技高网...

【技术保护点】
1.一种根据输入指令计算数据的计算单元,所述计算单元分为M阶段的流水线,包括:/n串行分解器,将所述输入指令分解为N个串行指令,并生成反映所述N个串行指令间的依赖关系的中间数据;以及/n本地存储器,包括:/n静态内存段,用以存储所述中间数据;以及/n循环内存段,用以存储执行所述N个串行指令所需的子数据,及所述子数据在M阶段的流水线中计算所产生的各阶段数据;/n其中,所述子数据为所述数据的一部分。/n

【技术特征摘要】
20190427 CN 2019103470270;20190621 CN 2019105447261.一种根据输入指令计算数据的计算单元,所述计算单元分为M阶段的流水线,包括:
串行分解器,将所述输入指令分解为N个串行指令,并生成反映所述N个串行指令间的依赖关系的中间数据;以及
本地存储器,包括:
静态内存段,用以存储所述中间数据;以及
循环内存段,用以存储执行所述N个串行指令所需的子数据,及所述子数据在M阶段的流水线中计算所产生的各阶段数据;
其中,所述子数据为所述数据的一部分。


2.根据权利要求1所述的计算单元,其中所述循环内存段分为N子内存块,每子内存块存储执行特定串行指令所需的特定子数据,及所述特定子数据在M阶段的流水线中所产生的各阶段数据。


3.根据权利要求2所述的计算单元,还包括:
降层译码器,用于指派所述特定子数据的本地地址。


4.根据权利要求3所述的计算单元,还包括:
直接存储器存取,用于根据所述本地地址,依次在每子内存块和上层存储器之间进行数据交换。


5.根据权利要求3所述的计算单元,还包括:
分形功能单元,用以根据所述本地地址,依次下发所述特定串行指令的任务,并将下层计算单元的计算结果存储至同一个子内存块。


6.根据权利要求3所述的计算单元,还包括:
本地功能单元,用以根据所述本地地址,依次执行所述特定串行指令的本地任务。


7.根据权利要求1所述的计算单元,其中所述中间数据是依序从所述静态内存段的两端往中间存储。


8.根据权利要求1所述的计算单元,其中M为5,所述流水线包括:
指令译码阶段,用于将所述输入指令译码成本地指令、分形指令及直接存储器存取指令;
数据加载阶段,用于根据所述直接存储器存取指令,将所述特定子数据自上层存储器加载至所述特定子内存块;
操作执行阶段,用于根据所述分形指令,下发所述任务,以产生所述计算结果;
操作归约阶段,用于根据所述本地指令,对所述计算结果进行归约;以及
数据写回阶段,将归约后的计算结果写回所述上层存储器。
其中,每阶段对应一个阶段。


9.根据权利要求8所述的分形计算装置,其中N为3,所述N个串行指令同时分别在所述数据加载阶段、操作执行阶段及操作归约阶段中操作。


10.根据权利要求8所述的计算单元,还包括张量置换表,用于存储所述特定子数据在上层存储器及所述本地地址的地址对照表。


11.一种集成电路装置,包括根据权利要求1-10的任意一项所述的分形计算装置。


12.一种板卡,包括根据权利要求12所述的集成电路装置。


13.一种分形计算装置,其特征在于,所述分形计算装置包括多层运算节点,每一个运算节点包括内存组件、处理器以及下一层运算节点,所述内存组件包括静态内存段和循环内存段,处理器用于对任意一个运算节点的输入指令进行分解得到多个子指令;
如果所述多个子指令之间存在共用操作数,则所述处理器在所述静态内存段中为所述共用操作数分配内存空间,在所述循环内存段中为所述多个子指令的其他操作数分配内存空间;
其中,所述共用操作数为:所述任意一个运算节点中的下一层运算节点执行所述多个子指令时都要使用的操作数,所述其他操作数为:所述多个子指令的操作数中除了所述共用操作数以外的操作数。


14.根据权利要求13所述的分形计算装置,其特征在于,所述处理...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:中科寒武纪科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1