【技术实现步骤摘要】
分形计算装置、方法、集成电路及板卡
本公开一般地涉及神经网络领域。更具体地,本公开涉及分形计算装置、方法、集成电路及板卡。
技术介绍
机器学习技术已经大量应用于新兴商业,像是图像识别、文本识别、语音识别、面部识别视频分析、广告推荐和游戏等领域。近年来,许多不同规模的专用机器学习计算装置已部署在各种的嵌入式设备、服务器和数据中心中,人们的生活早已离不开机器学习技术。大多数的机器学习计算装置持续专注于优化性能,光是2012年到2018年间,其功效增长了逾1200倍。虽然机器学习计算装置的能效一直在快速增长,但是编程效率的发展有限,阻碍了机器学习技术的普及化。即使现有的计算装置具有很高的峰值性能,但精简的硬件控制管理和软件堆栈对于机器学习计算装置的实际性能仍然至关重要。不仅如此,现有的机器学习计算装置的异构性、并行性和分层特性也影响了编程效率。因此,一种同构、串行的分层结构、具有相同的指令集的机器学习计算装置是迫切需要的。
技术实现思路
为了至少部分地解决
技术介绍
中提到的技术问题,本公开的方案提 ...
【技术保护点】
1.一种分形计算装置,包括多层计算单元,每层计算单元包括:/n功能单元,用以执行任务;以及/n存储器,用以存储与所述任务相关的数据。/n
【技术特征摘要】
20190427 CN 2019103470270;20190621 CN 2019105447261.一种分形计算装置,包括多层计算单元,每层计算单元包括:
功能单元,用以执行任务;以及
存储器,用以存储与所述任务相关的数据。
2.根据权利要求1所述的分形计算装置,其中所述多层计算单元包括根计算单元,为最顶层计算单元,所述根计算单元的功能单元用以下发所述任务。
3.根据权利要求2所述的分形计算装置,其中所述多层计算单元还包括中层计算单元,所述中层计算单元的功能单元包括:
多个分形功能单元,用以下发所述任务中的子任务,并接收所述子任务的计算结果;以及
本地功能单元,用以执行所述任务中的本地任务;
其中,所述本地任务包括归约所有的所述计算结果。
4.根据权利要求3所述的分形计算装置,其中所述多层计算单元还包括叶计算单元,为最底层计算单元,所述叶计算单元的功能单元包括加速器,用以计算所述子任务,以获得所述计算结果。
5.根据权利要求4所述的分形计算装置,其中所述每层计算单元还包括控制器,用以指派所述任务或所述子任务给所述功能单元。
6.根据权利要求5所述的分形计算装置...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:中科寒武纪科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。