【技术实现步骤摘要】
一种适用于二值卷积神经网络计算的存内计算装置
本专利技术属于集成电路
,具体涉及一种适用于二值卷积神经网络计算的存内计算装置。
技术介绍
当今,得益于深度卷积神经网络的不断发展,其被广泛应用于图像分类、自动驾驶、目标识别与跟踪、语音识别等各个领域中。为了追求更高的精度,深度卷积网络层数、宽度不断增加,与之增大的计算量与数据存储量使其不适合与计算资源、电源容量有限的终端计算设备上。为上述深度卷积神经网络算法与硬件实现的冲突,各种量化方法应运而生。低精度、甚至二值卷积神经网络在各个领域应用中可以达到接近于高精度卷积神经网络的性能。在二值卷积神经网络中,权重以及输入、输出特征值均被量化为1位,用-1或1表示两种不同的状态。如此,复杂的乘法运算便被简单的异或运算替代。传统的硬件计算平台,如CPU/GPU仍采用计算单元与存储单元分立的冯诺依曼结构。存储单元与计算单元之间需要频繁的、大量的数据交互。如此,不仅降低了计算速度,更使功耗浪费在了数据搬运的过程中。为了解决存算分立带来的问题,本专利技术将异 ...
【技术保护点】
1.一种适用于二值卷积神经网络计算的存内计算装置,其特征在于,包括:/n一个存内计算阵列,用于计算二值卷积神经网络中权重与输入特征值之间的异或运算;/n一个多输入加法树,用于求和不同输入通道内的异或结果;/n一个累加器组与中间结果存储单元,用于累加并更新同一卷积核内的中间结果;/n一个后处理量化单元,用于将高位宽的累加结果量化为一位输出特征值;/n一个控制单元,用于控制计算流程和数据流向;/n所述存内计算阵列是有多个输入特征值存储计算向量与多个权重存储计算向量组成的二维阵列;所述控制单元用于控制存内计算阵列任意两行实现异或运算,计算的结果经过累加、量化后得到一个输出通道的输出特征值。/n
【技术特征摘要】
1.一种适用于二值卷积神经网络计算的存内计算装置,其特征在于,包括:
一个存内计算阵列,用于计算二值卷积神经网络中权重与输入特征值之间的异或运算;
一个多输入加法树,用于求和不同输入通道内的异或结果;
一个累加器组与中间结果存储单元,用于累加并更新同一卷积核内的中间结果;
一个后处理量化单元,用于将高位宽的累加结果量化为一位输出特征值;
一个控制单元,用于控制计算流程和数据流向;
所述存内计算阵列是有多个输入特征值存储计算向量与多个权重存储计算向量组成的二维阵列;所述控制单元用于控制存内计算阵列任意两行实现异或运算,计算的结果经过累加、量化后得到一个输出通道的输出特征值。
2.根据权利要求1所述的适用于二值卷积神经网络计算的存内计算装置,其特征在于,所述存内计算阵列中,由一个权重存储单元、一个特征值存储单元和一个异或计算电路构成一个异或存储计算单元;多个异或存储计算单元连接至同一权重字线、特征字线、异或字线以及异或位线上构成存内计算阵列中的一个存储计算行;
权重根据输入通道、输出通道索引存储于不同存储计算...
【专利技术属性】
技术研发人员:刘诗玮,陈迟晓,张怡云,史传进,
申请(专利权)人:复旦大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。