分形计算装置、方法、集成电路及板卡制造方法及图纸

技术编号:26173057 阅读:28 留言:0更新日期:2020-10-31 13:53
本公开涉及分形计算装置、方法、集成电路及板卡,其中本公开的分形计算装置包括在集成电路装置中,该集成电路装置包括通用互联接口和其他处理装置。计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。集成电路装置还可以包括存储装置,存储装置分别与计算装置和其他处理装置连接,用于计算装置和其他处理装置的数据存储。

【技术实现步骤摘要】
分形计算装置、方法、集成电路及板卡
本公开一般地涉及神经网络领域。更具体地,本公开涉及分形计算装置、方法、集成电路及板卡。
技术介绍
机器学习技术已经大量应用于新兴商业,像是图像识别、文本识别、语音识别、面部识别视频分析、广告推荐和游戏等领域。近年来,许多不同规模的专用机器学习计算装置已部署在各种的嵌入式设备、服务器和数据中心中,人们的生活早已离不开机器学习技术。大多数的机器学习计算装置持续专注于优化性能,光是2012年到2018年间,其功效增长了逾1200倍。虽然机器学习计算装置的能效一直在快速增长,但是编程效率的发展有限,阻碍了机器学习技术的普及化。即使现有的计算装置具有很高的峰值性能,但精简的硬件控制管理和软件堆栈对于机器学习计算装置的实际性能仍然至关重要。不仅如此,现有的机器学习计算装置的异构性、并行性和分层特性也影响了编程效率。因此,一种同构、串行的分层结构、具有相同的指令集的机器学习计算装置是迫切需要的。
技术实现思路
为了至少部分地解决
技术介绍
中提到的技术问题,本公开的方案提供了一种分形计算装置本文档来自技高网...

【技术保护点】
1.一种根据指令对输入数据执行神经网络计算的方法,包括:/n将所述指令分为多个分形指令;/n将所述输入数据拆分为多个分形数据,每个分形数据对应一个分形指令;/n建立分形可重配指令集的多个本地指令;/n拆解每个分形指令为有序集合,所述有序集合由所述多个本地指令至少其中之一依序排列而成;/n对所述分形数据执行相对应分形指令的有序集合内的本地指令以产生中间数据;以及/n归约所述中间数据以完成所述神经网络计算。/n

【技术特征摘要】
20190427 CN 2019103470270;20190621 CN 2019105447261.一种根据指令对输入数据执行神经网络计算的方法,包括:
将所述指令分为多个分形指令;
将所述输入数据拆分为多个分形数据,每个分形数据对应一个分形指令;
建立分形可重配指令集的多个本地指令;
拆解每个分形指令为有序集合,所述有序集合由所述多个本地指令至少其中之一依序排列而成;
对所述分形数据执行相对应分形指令的有序集合内的本地指令以产生中间数据;以及
归约所述中间数据以完成所述神经网络计算。


2.根据权利要求1所述的方法,其中所述分形可重配指令集包括数据搬迁类别,所述数据搬迁类别包括以下本地指令:显示张量搬移(tmove)。


3.根据权利要求1所述的方法,其中所述分形可重配指令集包括计算类别,所述计算类别包括以下本地指令:逐元素非线性变换(veltw)、向量加法(vadd)、纯量加法(sadd)、混合加法(vsadd)、水平最大化(hmax)及矩阵相乘(mmul)。


4.根据权利要求1所述的方法,其中所述分形可重配指令集包括逻辑类别,所述逻辑类别包括以下本地指令:异或(vxor,sxor)及大于比较(vgt,sgt)。


5.根据权利要求1所述的方法,其中所述分形可重配指令集包括杂项类别,所述杂项类别包括以下本地指令:随机生成向量(vrng)、种类计数(vpopcnt)及合并有序数列(vmerge)。


6.根...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:中科寒武纪科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1