一种位宽可编程的整型存内计算结构制造技术

技术编号：40182994 阅读：14 留言：0更新日期：2024-01-26 23:48

本发明专利技术公开一种位宽可编程的整型存内计算结构，包括：存储单元，用于存储整型的权重W数据，存储单元与四个MAC array连接，每个MAC array接收256*4的权重W及特征图XIN的输入；四个MAC array通过三个加法器依次进行累加，其中，MAC array2～MAC array4通过三个选择器分别与对应的加三个法器连接，最后一个加法器与移位累加单元连接；MAC array2、MAC array3、MAC array4通过三个选择分别与三个移位累加单元1连接；MAC array3、MAC array4通过两个选择器与加法器连接，加法器连接移位累加单元2连接；根据实际需求灵活选择输入特征图的位宽(4b/8b/12b/16b)和权重的位宽(4b/8b/12b/16b)，不必因为有不同的计算要求而重新设计存内计算模块,节省了大量的存储硬件和计算功耗,缩短了设计周期。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于存内计算，更具体地，本专利技术涉及一种位宽可编程的整型存内计算结构。

技术介绍

1、基于sram的存内计算技术，可以减少数据在处理器和内存存储器之间的频繁传输，从而提高系统性能，降低功耗和成本,大幅提升芯片算力和能效比，该存内计算技术也正被用于神经网络中的算力芯片采用。

2、大多数的存内计算只支持特定的输入特征图和权重的位宽(bit width)的整型运算，例如有的只支持输入特征图为8b和权重为8b，或者是输入特征图为8b和权重为12b。

3、现有的存内计算不能灵活选择输入特征图和权重的位宽，如果输入特征图的位宽或者权重的位宽稍有变动，只能重新设计一个新的存内计算模块，需要大量的存储硬件和计算功耗，使得成本提高，设计周期变长。

技术实现思路

1、本专利技术提供一种位宽可编程的整型存内计算结构，旨在改善上述问题。

2、本专利技术是这样实现的，一种位宽可编程的整型存内计算结构，所述存内结算结构包括：

3、存储单元，用于存储整型的权重...

【技术保护点】

1.一种位宽可编程的整型存内计算结构，其特征在于，所述存内结算结构包括：

2.如权利要求1所述宽可编程的整型存内计算结构，其特征在于，权重数据为256*4bits、256*8bits、256*12bits或者是256*16bits，特征图XIN的数据位宽与权重W相同。

3.如权利要求1所述宽可编程的整型存内计算结构，其特征在于，每个MAC array由256个乘法器组成及一个加法树组成。

4.如权利要求1所述宽可编程的整型存内计算结构，其特征在于，带符号的权重，符号位位于权重W的最高位。

5.如权利要求1所述宽可编程的整型存内计算结构，其特...

【技术特征摘要】

1.一种位宽可编程的整型存内计算结构，其特征在于，所述存内结算结构包括：

2.如权利要求1所述宽可编程的整型存内计算结构，其特征在于，权重数据为256*4bits、256*8bits、256*12bits或者是256*16bits，特征图xin的数据位宽与权重w相同。

3.如权利要求1所述宽可编程的整型存内计算结构，其特征在于，每个mac array由256个乘法器组成及一个加法树组成。

4.如权利要求1所述宽可编程的整型存内计算结构，其特征在于，带符号的权重，符号位位于权重w的最高位。

5.如权利要求1所述宽可编程的整型存内计算结构，其特征在于，移位累加单元、三个移位累加单元1或移位累加单元2由一个移位器和一个累加器组成。

6.如权利要求1所述宽可编程的整型存内计算结构，其特征在于，在权重w和图像特征xin为256*16bits时，存内计算结构的...

【专利技术属性】
技术研发人员：谭静荣，杨帆，胡健，胡俊奎，
申请(专利权)人：上海砺群科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人