【技术实现步骤摘要】
分形计算装置、方法、集成电路及板卡
本公开一般地涉及神经网络领域。更具体地,本公开涉及分形计算装置、方法、集成电路及板卡。
技术介绍
机器学习技术已经大量应用于新兴商业,像是图像识别、文本识别、语音识别、面部识别视频分析、广告推荐和游戏等领域。近年来,许多不同规模的专用机器学习计算装置已部署在各种的嵌入式设备、服务器和数据中心中,人们的生活早已离不开机器学习技术。大多数的机器学习计算装置持续专注于优化性能,光是2012年到2018年间,其功效增长了逾1200倍。虽然机器学习计算装置的能效一直在快速增长,但是编程效率的发展有限,阻碍了机器学习技术的普及化。即使现有的计算装置具有很高的峰值性能,但精简的硬件控制管理和软件堆栈对于机器学习计算装置的实际性能仍然至关重要。不仅如此,现有的机器学习计算装置的异构性、并行性和分层特性也影响了编程效率。因此,一种同构、串行的分层结构、具有相同的指令集的机器学习计算装置是迫切需要的。
技术实现思路
为了至少部分地解决
技术介绍
中提到的技术问题,本公开的方案提 ...
【技术保护点】
1.一种根据输入指令计算数据的分形计算装置,包括多层计算单元,每层计算单元包括:/n指令译码模块,用于将所述输入指令译码成本地指令、分形指令及直接存储器存取指令;/n数据加载模块,用于根据所述直接存储器存取指令,将所述数据的子数据自上层存储器加载至本地存储器;/n操作执行模块,用于根据所述分形指令,执行所述子数据对应的任务,以产生计算结果;/n操作归约模块,用于根据所述本地指令,对所述计算结果进行归约;以及/n数据写回模块,将归约后的计算结果写回所述上层存储器。/n
【技术特征摘要】
20190427 CN 2019103470270;20190621 CN 2019105447261.一种根据输入指令计算数据的分形计算装置,包括多层计算单元,每层计算单元包括:
指令译码模块,用于将所述输入指令译码成本地指令、分形指令及直接存储器存取指令;
数据加载模块,用于根据所述直接存储器存取指令,将所述数据的子数据自上层存储器加载至本地存储器;
操作执行模块,用于根据所述分形指令,执行所述子数据对应的任务,以产生计算结果;
操作归约模块,用于根据所述本地指令,对所述计算结果进行归约;以及
数据写回模块,将归约后的计算结果写回所述上层存储器。
2.根据权利要求1所述的分形计算装置,其中所述每层计算单元为五级的流水线,每级对应一个模块,同时间各模块响应不同输入指令运作。
3.根据权利要求2所述的分形计算装置,其中所述子数据在下层计算单元的流水线中计算。
4.根据权利要求2所述的分形计算装置,其中所述指令译码模块包括:
降层译码器,用于根据所述输入指令,产生下层指令及所述直接存储器存取指令;以及
并行分解器,用于将所述下层指令并行分解为所述本地指令及所述分形指令。
5.根据权利要求4所述的分形计算装置,其中所述输入指令包括操作数,所述降层译码器根据不同输入指令间的操作数的依赖度来运行所述流水线。
6.根据权利要求5所述的分形计算装置,其中所述降层译码器判断所述依赖度是否为写后读关系,如是,则暂停运行所述流水线,直到所述写后读关系结束。
7.根据权利要求5所述的分形计算装置,其中所述降层译码器检查所述操作数的存储要求,生成指向所述本地存储器的所述直接存储器存取指令。
8.根据权利要求7所述的分形计算装置,其中所述数据加载模块包括直接存储器存取控制器,用于根据所述直接存储器存取指令,在所述本地存储器和所述上层存储器之间进行数据交换。
9.根据权利要求8所述的分形计算装置,其中所述降层译码器将所述子数据在所述本地存储器的本地地址绑定至所述下层指令的操作数中。
10.根据权利要求8所述的分形计算装置,其中所述并行分解器根据所述下层指令的操作数将所述本地地址绑定至所述分形指令的操作数中。
11.根据权利要求9或10所述的分形计算装置,其中每层计算单元还包括张量置换表,用于存储所述子数据在所述上层存储器及所述本地存储器的地址对照表,所述降层译码器根据所述张量置换表查找所述本地地址。
12.根据权利要求1所述的分形计算装置,其中所述数据加载模块还包括直接存储器存取,所述操作执行模块包括多个分形功能单元,所述直接存储器存取将存储在所述本地存储器的所述子数据发送给所述多个分形功能单元,以执行所述任务。
13.根据权利要求12所述的分形计算装置,其中所述指令译码模块还包括归约控制器,所述操作归约模块包括本地功能单元,所述归约控制器发送所述本地指令至所述本地功能单元以执行归约,所述直接存储器存取将所述计算结果存储至所述本地存储器。
14.一种集成电路装置,包括根据权利要求1-13的任意一项所述的分形计算装置。
15.一种板卡,包括根据权利要求14所述的集成电路装置。
16.一种分形计算装置,其特征在于,所述运算装置包括多层计算单元,每一个计算单元包括处理器以及下一层计算单元;
对于任意一个计算单元,所述...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:中科寒武纪科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。