一种位宽可编程的整型存内计算结构制造技术

技术编号:40182994 阅读:14 留言:0更新日期:2024-01-26 23:48
本发明专利技术公开一种位宽可编程的整型存内计算结构,包括:存储单元,用于存储整型的权重W数据,存储单元与四个MAC array连接,每个MAC array接收256*4的权重W及特征图XIN的输入;四个MAC array通过三个加法器依次进行累加,其中,MAC array2~MAC array4通过三个选择器分别与对应的加三个法器连接,最后一个加法器与移位累加单元连接;MAC array2、MAC array3、MAC array4通过三个选择分别与三个移位累加单元1连接;MAC array3、MAC array4通过两个选择器与加法器连接,加法器连接移位累加单元2连接;根据实际需求灵活选择输入特征图的位宽(4b/8b/12b/16b)和权重的位宽(4b/8b/12b/16b),不必因为有不同的计算要求而重新设计存内计算模块,节省了大量的存储硬件和计算功耗,缩短了设计周期。

【技术实现步骤摘要】

本专利技术属于存内计算,更具体地,本专利技术涉及一种位宽可编程的整型存内计算结构


技术介绍

1、基于sram的存内计算技术,可以减少数据在处理器和内存存储器之间的频繁传输,从而提高系统性能,降低功耗和成本,大幅提升芯片算力和能效比,该存内计算技术也正被用于神经网络中的算力芯片采用。

2、大多数的存内计算只支持特定的输入特征图和权重的位宽(bit width)的整型运算,例如有的只支持输入特征图为8b和权重为8b,或者是输入特征图为8b和权重为12b。

3、现有的存内计算不能灵活选择输入特征图和权重的位宽,如果输入特征图的位宽或者权重的位宽稍有变动,只能重新设计一个新的存内计算模块,需要大量的存储硬件和计算功耗,使得成本提高,设计周期变长。


技术实现思路

1、本专利技术提供一种位宽可编程的整型存内计算结构,旨在改善上述问题。

2、本专利技术是这样实现的,一种位宽可编程的整型存内计算结构,所述存内结算结构包括:

3、存储单元,用于存储整型的权重w数据,存储单元与四本文档来自技高网...

【技术保护点】

1.一种位宽可编程的整型存内计算结构,其特征在于,所述存内结算结构包括:

2.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,权重数据为256*4bits、256*8bits、256*12bits或者是256*16bits,特征图XIN的数据位宽与权重W相同。

3.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,每个MAC array由256个乘法器组成及一个加法树组成。

4.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,带符号的权重,符号位位于权重W的最高位。

5.如权利要求1所述宽可编程的整型存内计算结构,其特...

【技术特征摘要】

1.一种位宽可编程的整型存内计算结构,其特征在于,所述存内结算结构包括:

2.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,权重数据为256*4bits、256*8bits、256*12bits或者是256*16bits,特征图xin的数据位宽与权重w相同。

3.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,每个mac array由256个乘法器组成及一个加法树组成。

4.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,带符号的权重,符号位位于权重w的最高位。

5.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,移位累加单元、三个移位累加单元1或移位累加单元2由一个移位器和一个累加器组成。

6.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,在权重w和图像特征xin为256*16bits时,存内计算结构的...

【专利技术属性】
技术研发人员:谭静荣杨帆胡健胡俊奎
申请(专利权)人:上海砺群科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1