【技术实现步骤摘要】
卷积处理单元、神经网络处理器、电子设备及卷积运算方法
本申请涉及电子
,特别涉及一种卷积处理单元、神经网络处理器、电子设备及卷积运算方法。
技术介绍
卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习(deeplearning)的代表算法之一。在卷积神经网络中,卷积运算是卷积神经网络中最主要的计算,卷积运算的效率直接影响卷积神经网络的效率。相关技术中,卷积神经网络中的卷积运算效率不够高。
技术实现思路
本申请实施例提供一种卷积处理单元、神经网络处理器、电子设备及卷积运算方法,可以提高卷积神经网络中卷积运算的效率。本申请实施例公开一种卷积处理单元,所述卷积处理单元用于:根据卷积核对输入数据进行一次取窗操作,得到第一窗体区域,所述第一窗体区域沿深度方向包括第一数量层的第一深度数据;获取多个卷积核,所述多个卷积核沿深度方向包括第一数量层的第二深 ...
【技术保护点】
1.一种卷积处理单元,其特征在于,所述卷积处理单元用于:/n根据卷积核对输入数据进行一次取窗操作,得到第一窗体区域,所述第一窗体区域沿深度方向包括第一数量层的第一深度数据;/n获取多个卷积核,所述多个卷积核沿深度方向包括第一数量层的第二深度数据;以及/n将一层的所述第一深度数据与所述多个卷积核同一层的所述第二深度数据进行乘累加运算,得到第一运算数据。/n
【技术特征摘要】
1.一种卷积处理单元,其特征在于,所述卷积处理单元用于:
根据卷积核对输入数据进行一次取窗操作,得到第一窗体区域,所述第一窗体区域沿深度方向包括第一数量层的第一深度数据;
获取多个卷积核,所述多个卷积核沿深度方向包括第一数量层的第二深度数据;以及
将一层的所述第一深度数据与所述多个卷积核同一层的所述第二深度数据进行乘累加运算,得到第一运算数据。
2.根据权利要求1所述的卷积处理单元,其特征在于,所述卷积处理单元还用于将多层的所述第一深度数据对应的多个所述第一运算数据累加得到目标运算数据。
3.根据权利要求2所述的卷积处理单元,其特征在于,所述输出数据的深度和所述卷积核的深度均为C,所述卷积核的数量为K,所述卷积处理单元包括乘累加阵列,所述乘累加阵列进行乘累加的长度为L;所述卷积处理单元还用于:
将所述输入数据在深度方向上划分为C/L层第一深度数据,以及将多个所述卷积核在深度方向上划分为C/L层第二深度数据;
将第i层所述第一深度数据与K个所述卷积核的第i层所述第二深度数据进行乘累加运算,得到K个第一中间数据;以及
递增i,得到新的K个第一中间数据,并累加之前得到的K个第一中间数据,并得到K个目标运算数据,其中,i从1递增到C/L。
4.根据权利要求2所述的卷积处理单元,其特征在于,所述输出数据的深度和所述卷积核的深度均为C,所述卷积核的数量为K,所述卷积处理单元包括乘累加阵列,所述累加阵列并行计算的单元数为M;所述卷积处理单元还用于:
将多个所述卷积核划分为K/M个卷积核组;
将第i层所述第一深度数据与第f组中所有所述卷积核的第i层所述第二深度数据进行乘累加运算,得到M个第一中间数据;
递增i,得到新的M个第一中间数据,并累加之前得到的M个第一中间数据,并得到M个第二中间数据,其中,i从1递增到C;以及
递增f,得到新的M个第二中间数据,其中,f从1递增到K/M,得到K个目标运算数据。
5.根据权利要求2所述的卷积处理单元,其特征在于,所述输出数据的深度和所述卷积核的深度为C,所述卷积核的数量为K,所述卷积处理单元包括乘累加阵列,所述乘累加阵列为L×M,其中L为进行乘累加运算的长度,M为并行进行乘累加运算的单元数;所述卷积处理单元还用于:
将所述输入数据在深度方向上划分为C/L层第一深度数据;
将多个所述卷积核在深度方向上划分为C/L层第二深度数据;
将多个所述卷积核还划分为K/M个卷积核组;
将第i层所述第一深度数据与第f组中所有所...
【专利技术属性】
技术研发人员:方攀,陈岩,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。