【技术实现步骤摘要】
计算神经网络的装置、板卡、方法及可读存储介质
[0001]本专利技术一般地涉及神经网络领域。更具体地,本专利技术涉及计算神经网络的装置、板卡、方法及可读存储介质。
技术介绍
[0002]神经网络是按照一定规则连接起来的多个神经元系统,大致上是由以下四种层结构所组成:输入层、卷积层(convolution layer)、池化层(pooling layer)、全连接层(fully connected layer)。
[0003]输入层是自输入数据中截取部分信息,转化成特征矩阵方式呈现,其中载有对应该部分信息的特征。卷积层配置成接收来自输入层的特征矩阵,通过卷积操作对输入数据进行特征抽取。卷积层在实际运用时可以建制多层卷积层。池化层配置成对数据的某一个区域用一个值代替,这值通常是该区域所有数值里的最大值或平均值。通过池化,在不至于损失过多信息的前提下,可以缩减模型大小、提高计算速度。全连接层在整个卷积神经网络中起到分类器的作用,相当于特征空间变换,把前面所有有用的信息提取整合,基于不同的分类做信息比对,借以判断输入数据是否 ...
【技术保护点】
【技术特征摘要】
1.一种利用计算装置计算神经网络的方法,所述计算装置连接至片外内存,所述片外内存载有片上单元图及相对应的权值,所述计算装置包括多个集群,每个集群包括共享存储单元及多个处理器核,所述方法包括:将所述片上单元图及所述权值中的第i个子权值自所述片外内存载入至所述共享存储单元中;其中,i取值为正整数;将所述片上单元图中的第i个子图及所述第i个子权值自所述共享存储单元中广播至所述多个处理器核至少其中之一,其中所述第i个子权值对应所述第i个子图;根据所述第i个子图及所述第i个子权值,计算第i个中间结果;将所述权值中的第i+1个子权值自所述片外内存载入至所述共享存储单元中;将所述片上单元图中的第i+1个子图自所述共享存储单元中广播至所述多个处理器核至少其中之一,其中所述第i+1个子权值对应所述第i+1个子图;以及将所述第i+1个子权值自所述共享存储单元中广播至所述多个处理器核至少其中之一。2.根据权利要求1所述的方法,其中在计算第i个中间结果的同时,同步执行所述载入所述第i+1个子权值的步骤。3.根据权利要求2所述的方法,其中所述权值包括多个子权值,所述方法还包括:识别所述多个子权值中存储空间的最大者;以及根据所述多个子权值中存储空间的最大者,决定在所述共享存储单元中的权值存储空间的大小。4.根据权利要求3所述的方法,其中所述第i+1个子权值在所述权值存储空间内覆盖所述第i个子权值。5.根据权利要求1所述的方法,其中所述载入所述片上单元图及所述第i个子权值的步骤与所述载入第i+1个子权值的步骤同步执行。6.根据权利要求5所述的方法,其中所述共享存储单元中的权值存储空间包括第一存储空间及第二存储空间,所述方法还包括:存储所述第i个子权值至所述第一存储空间;以及存储所述第i+1个子权值至所述第二存储空间。7.根据权利要求1
‑
6任一项所述的方法,其中所述广播所述第i+1个子权值的步骤与所述计算步骤同步执行。8.根据权利要求7所述的方法,其中每个处理器核包括权值存储单元,所述权值存储单元包括第一存储空间及第二存储空间,所述方法还包括:存储所述第i个子权值至所述第一存储空间;以及存储所述第i+1个子权值至所述第二存储空间。9.根据权利要求1
‑
6任一项所述的方法,其中所述广播所述第i+1个子权值的步骤在所述计算步骤后执行。10.根据权利要求9所述的方法,其中每个处理器核包括权值存储单元,所述方法还包括:存储所述第i个子权值至所述权值存储单元;以及存储所述第i+1个子权值至所述权值存储单元,以覆盖所述第i个子权值。
11.一种计算装置,连接至片外内存,所述片外内存载有片上单元图及相对应的权值,所述计算装置包括多个集群,每个集群包括:共享存储单元;直接内存访问模块,用以:将所述片上单元图及所述...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:中科寒武纪科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。