【技术实现步骤摘要】
分形计算装置、方法、集成电路及板卡
本公开一般地涉及神经网络领域。更具体地,本公开涉及分形计算装置、方法、集成电路及板卡。
技术介绍
机器学习技术已经大量应用于新兴商业,像是图像识别、文本识别、语音识别、面部识别视频分析、广告推荐和游戏等领域。近年来,许多不同规模的专用机器学习计算装置已部署在各种的嵌入式设备、服务器和数据中心中,人们的生活早已离不开机器学习技术。大多数的机器学习计算装置持续专注于优化性能,光是2012年到2018年间,其功效增长了逾1200倍。虽然机器学习计算装置的能效一直在快速增长,但是编程效率的发展有限,阻碍了机器学习技术的普及化。即使现有的计算装置具有很高的峰值性能,但精简的硬件控制管理和软件堆栈对于机器学习计算装置的实际性能仍然至关重要。不仅如此,现有的机器学习计算装置的异构性、并行性和分层特性也影响了编程效率。因此,一种同构、串行的分层结构、具有相同的指令集的机器学习计算装置是迫切需要的。
技术实现思路
为了至少部分地解决
技术介绍
中提到的技术问题,本公开的方案提 ...
【技术保护点】
1.一种根据指令执行特定操作的分形计算装置,包括:/n多个中层计算单元,每个中层计算单元包括:/n控制器,用以分解所述指令成多个分形指令,其中每个分形指令执行所述特定操作;以及/n多个分形功能单元,每个分形功能单元分别发送所述多个分形指令其中之一至下一层的中层计算单元;以及/n叶计算单元,包括:/n控制器,用以分解所述分形指令为本地指令;以及/n功能单元,用以执行所述本地指令。/n
【技术特征摘要】
20190427 CN 2019103470270;20190621 CN 2019105447261.一种根据指令执行特定操作的分形计算装置,包括:
多个中层计算单元,每个中层计算单元包括:
控制器,用以分解所述指令成多个分形指令,其中每个分形指令执行所述特定操作;以及
多个分形功能单元,每个分形功能单元分别发送所述多个分形指令其中之一至下一层的中层计算单元;以及
叶计算单元,包括:
控制器,用以分解所述分形指令为本地指令;以及
功能单元,用以执行所述本地指令。
2.根据权利要求1所述的分形计算装置,其中所述中层计算单元的控制器包括译码器,所述译码器包括:
并行分解栈,用以暂存下层指令;
串行分解栈,用以暂存所述指令;以及
译码控制器,连接至所述串行分解栈及所述并行分解栈;
其中,当所述译码控制器与所述并行分解栈电性相通时,所述译码控制器自所述并行分解栈取出所述下层指令分解成所述分形指令;当所述译码控制器与所述串行分解栈电性相通时,所述译码控制器自所述串行分解栈取出所述指令分解成串行子指令。
3.根据权利要求2所述的分形计算装置,其中所述译码器还包括:
复用器,连接至所述并行分解栈及所述串行分解栈,用以选择所述指令及所述下层指令其中之一输入至所述译码控制器。
4.根据权利要求3所述的分形计算装置,其中所述并行分解栈电性连接至所述译码控制器的优先级高于所述串行分解栈电性连接至所述译码控制器的优先级。
5.根据权利要求2所述的分形计算装置,其中所述译码器还包括:
解复用器,连接至所述译码控制器;
其中,当所述译码控制器与所述并行分解栈电性相通时,所述译码控制器连接至所述多个分形功能单元。
6.根据权利要求5所述的分形计算装置,其中所述中层计算单元的控制器还包括子指令队列,当所述译码控制器与所述串行分解栈电性相通时,所述译码控制器发送所述串行子指令至所述子指令队列。
7.根据权利要求6所述的分形计算装置,其中所述中层计算单元的控制器还包括降层译码器,用以自子指令队列依序获取多个串行子指令,产生所述下层指令。
8.根据权利要求2所述的分形计算装置,其中所述特定操作是针对数据进行计算,所述译码控制器根据中枢值(pivotvalue)对所述数据进行分解。
9.根据权利要求8所述的分形计算装置,其中所述数据为N维度,所述译码控制器提供N...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:中科寒武纪科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。