卷积计算方法、协处理器技术

技术编号:40077077 阅读:18 留言:0更新日期:2024-01-17 01:36
本发明专利技术实施例提供了一种卷积计算方法、协处理器,包括:三级存储模块,包括SRAM子模块、全局缓存子模块和局部缓存子模块,其中,SRAM子模块用于储存输入数据及卷积计算过程中的特征值数据,全局缓存子模块用于预取输入数据,局部缓存子模块用于暂存卷积计算过程中累加的中间数据,本发明专利技术解决了相关技术中SRAM访存功耗大、卷积计算效率低的问题。

【技术实现步骤摘要】

本专利技术实施例涉及神经网络计算,具体而言,涉及一种卷积计算方法、协处理器


技术介绍

1、近年来有很多卷积神经网络(convolutional neural network,cnn)专用加速芯片被提出,它们虽然有利用cnn的并行特性来加速计算,利用cnn的数据复用特性来降低访存次数进而降低访存功耗,但是没有进一步考虑二值权重卷积神经网络(binary-weightconvolutional neural network,bwcnn)本身的一些特性来设计相应的协处理器架构和计算模式。

2、现有的协处理器架构主要关注片外动态随机存储器(dynamic random accessmemory,dram)访问功耗,采用片上sram缓存一部分在卷积过程中需要被反复读取使用的数据,以减少对片外dram的访问,降低访存功耗。但是对于bwcnn,因为权重位宽只有1bit,很多物联网或嵌入式应用也会将网络中间层的特征值数据量化为8bit、4bit、2bit甚至1bit,这就使得很多模型的推理完全采用片上静态随机存储器(static random access 本文档来自技高网...

【技术保护点】

1.一种协处理器,其特征在于,用于二值权重卷积神经网络BWCNN,包括:

2.根据权利要求1所述的协处理器,其特征在于,还包括:

3.根据权利要求2所述的协处理器,其特征在于,还包括:

4.根据权利要求3所述的协处理器,其特征在于,还包括:

5.根据权利要求2所述的协处理器,其特征在于,所述全局缓存子模块进一步包括:

6.根据权利要求5所述的协处理器,其特征在于,所述二维PE阵列进一步包括:

7.根据权利要求1所述的协处理器,其特征在于,还包括:

8.一种卷积计算方法,其特征在于,用于二值权重卷积神经网络...

【技术特征摘要】

1.一种协处理器,其特征在于,用于二值权重卷积神经网络bwcnn,包括:

2.根据权利要求1所述的协处理器,其特征在于,还包括:

3.根据权利要求2所述的协处理器,其特征在于,还包括:

4.根据权利要求3所述的协处理器,其特征在于,还包括:

5.根据权利要求2所述的协处理器,其特征在于,所述全局缓存子模块进一步包括:

6.根据权利要求5所述的协处理器,其特征在于,所述二维pe阵列进一步包括:

7.根据权利要求1所述的协处理器,其特征在于,还包括:

8.一种卷积计算方法,其特征在于,用于二值权重卷积神经网络bwcnn协处理器,包括:

9.根据权利要求8所述的方法,其特征在于,所述将从bwcnn协处理器的特征图静态随机存储器sram中预取的特征图块数据储存至所述bwcnn协处理器的全局缓存子模块的输入缓存单元,将从所述bwcnn协处理器的卷积核sram中预取的卷积核权重数据储存至所述全局缓存子模块的卷积核缓存单元之后,还包括:

10.根据权利要求9所述的方法,其特征在于,所述二维pe阵列在列方向上进行输出图的不同行的并行...

【专利技术属性】
技术研发人员:王涛
申请(专利权)人:深圳市中兴微电子技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1