【技术实现步骤摘要】
本专利技术属于存内计算,更具体地,本专利技术涉及一种位宽可编程的整型存内计算结构。
技术介绍
1、基于sram的存内计算技术,可以减少数据在处理器和内存存储器之间的频繁传输,从而提高系统性能,降低功耗和成本,大幅提升芯片算力和能效比,该存内计算技术也正被用于神经网络中的算力芯片采用。
2、大多数的存内计算只支持特定的输入特征图和权重的位宽(bit width)的整型运算,例如有的只支持输入特征图为8b和权重为8b,或者是输入特征图为8b和权重为12b。
3、现有的存内计算不能灵活选择输入特征图和权重的位宽,如果输入特征图的位宽或者权重的位宽稍有变动,只能重新设计一个新的存内计算模块,需要大量的存储硬件和计算功耗,使得成本提高,设计周期变长。
技术实现思路
1、本专利技术提供一种位宽可编程的整型存内计算结构,旨在改善上述问题。
2、本专利技术是这样实现的,一种位宽可编程的整型存内计算结构,所述存内结算结构包括:
3、存储单元,用于存储整型的权重
...【技术保护点】
1.一种位宽可编程的整型存内计算结构,其特征在于,所述存内结算结构包括:
2.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,权重数据为256*4bits、256*8bits、256*12bits或者是256*16bits,特征图XIN的数据位宽与权重W相同。
3.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,每个MAC array由256个乘法器组成及一个加法树组成。
4.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,带符号的权重,符号位位于权重W的最高位。
5.如权利要求1所述宽可编程的整
...【技术特征摘要】
1.一种位宽可编程的整型存内计算结构,其特征在于,所述存内结算结构包括:
2.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,权重数据为256*4bits、256*8bits、256*12bits或者是256*16bits,特征图xin的数据位宽与权重w相同。
3.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,每个mac array由256个乘法器组成及一个加法树组成。
4.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,带符号的权重,符号位位于权重w的最高位。
5.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,移位累加单元、三个移位累加单元1或移位累加单元2由一个移位器和一个累加器组成。
6.如权利要求1所述宽可编程的整型存内计算结构,其特征在于,在权重w和图像特征xin为256*16bits时,存内计算结构的...
【专利技术属性】
技术研发人员:谭静荣,杨帆,胡健,胡俊奎,
申请(专利权)人:上海砺群科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。