子单元、MAC阵列、位宽可重构的模数混合存内计算模组制造技术

技术编号：24945246 阅读：32 留言：0更新日期：2020-07-17 22:40

本发明专利技术涉及一种模数混合存内计算的子单元，用于1位乘法计算，仅需要9个晶体管，在此基础上，提出多个子单元共用计算电容器、晶体管以组成1个计算单元，使得平均下来子单元的晶体管数量逼近8个，进而提出一种MAC阵列，用于乘加计算，包含多个计算单元，每个单元内的子单元以时分复用的方式被激活。进一步地，提出MAC阵列的差分体系，提高计算的容错能力。进一步地，提出一种用于内存内模数混合运算模组，对MAC阵列的并行模拟输出数字化并进行其它数字域的运算。所述运算模组中的模数转换模块充分利用MAC阵列的电容器，既能减少运算模组的面积，又能降低运算误差。进一步地，提出一种充分利用数据稀疏性来节省模数转换模块能耗的方法。

全部详细技术资料下载

【技术实现步骤摘要】
子单元、MAC阵列、位宽可重构的模数混合存内计算模组
本专利技术涉及一种模数混合存内计算领域，并且更具体地，涉及一种子单元、MAC阵列、位宽可重构的模数混合存内计算模组。
技术介绍
目前，现有移动和物联网之类的新兴边缘应用要求高能效和高单位面积的运算速率。高能效意味着更长的电池寿命，而高单位面积的运算速率意味着在指定的运算速率下减小面积，进而降低成本。如今，深度神经网络（DeepNeuralNetwork，DNN）中的前馈推理计算以乘法累加(Multiply-And-Accumulate，MAC)计算为主导，需要MAC计算的高能效和低面积的实现，同时减少待处理数据的搬运量。传统数字集成电路实现MAC有抗噪声能力强、精度高、扩展性好、设计方法成熟等优点，但是数字电路占用的芯片面积大、功耗大，难以实现高能效的大规模神经网络。并且传统数字电路采用的冯诺依曼结构带来的存储器和中央运算单元之间的数据交换瓶颈在DNN应用中的大规模数据搬运下会严重限制运算能效和运算速度。模拟电路实现MAC具有结构简单、功耗较低的优点，所以模拟和模数混合信号计算具有实现高能效的潜力。而为了打破冯诺依曼架构的瓶颈，近年来成为研究热点的存内计算从本质上无法以纯数字电路的形式实现，需要模拟电路的辅助。同时由于DNN对包括电路噪声造成的计算错误的承受能力较高，DNN专用集成电路（ASIC）正重新引起关注。论文“Amixed-signalbinarizedconvolutional-neural-networkacceleratorintegrati...

【技术保护点】
1.一种内存内模数混合计算子单元，进行1位乘法计算，其特征在于，包括：一个传统6TSRAM单元、一个互补传输门、一个第一N型MOS管、一个计算电容器；/n所述传统6T SRAM单元由MOS管M1、M2、M3、M4、M5、M6组成，其中MOS管M1、M2组成的CMOS反相器与MOS管M3、M4组成CMOS反相器交叉耦合，所述交叉耦合的两个CMOS反相器存储1位的过滤器参数，M5、M6为用于所述过滤器参数读写的位线的控制开关；/n所述传统6T SRAM单元中M1、M2组成的CMOS反相器输出端连接互补传输门的输入端，互补传输门的输出端连接第一N型MOS管漏极；/n所述第一N型MOS管源极接地，漏极连接计算电容器的底板；/n所述互补传输门的N型MOS管栅极连接输入信号，P型MOS管栅极连接互补输入信号且与第一N型MOS管栅极输入信号在运算时电平相同；/n所述输入信号与过滤器参数的乘法结果存储为计算电容器底板的电压，多个子单元用于组成一个计算单元，同一所述计算单元内的每一个子单元共用同一所述第一N型MOS管、计算电容器。/n

【技术特征摘要】
1.一种内存内模数混合计算子单元，进行1位乘法计算，其特征在于，包括：一个传统6TSRAM单元、一个互补传输门、一个第一N型MOS管、一个计算电容器；
所述传统6TSRAM单元由MOS管M1、M2、M3、M4、M5、M6组成，其中MOS管M1、M2组成的CMOS反相器与MOS管M3、M4组成CMOS反相器交叉耦合，所述交叉耦合的两个CMOS反相器存储1位的过滤器参数，M5、M6为用于所述过滤器参数读写的位线的控制开关；
所述传统6TSRAM单元中M1、M2组成的CMOS反相器输出端连接互补传输门的输入端，互补传输门的输出端连接第一N型MOS管漏极；
所述第一N型MOS管源极接地，漏极连接计算电容器的底板；
所述互补传输门的N型MOS管栅极连接输入信号，P型MOS管栅极连接互补输入信号且与第一N型MOS管栅极输入信号在运算时电平相同；
所述输入信号与过滤器参数的乘法结果存储为计算电容器底板的电压，多个子单元用于组成一个计算单元，同一所述计算单元内的每一个子单元共用同一所述第一N型MOS管、计算电容器。

2.如权利要求1所述的子单元，其特征在于，所述计算单元内的子单元以时分复用的方式被激活，同一计算单元内的某时刻处于工作状态的子单元的互补传输门的P型MOS管栅极的互补输入信号与第一N型MOS管栅极连接的信号电平相同。

3.一种包括权利要求2所述子单元的MAC阵列，进行乘加运算，其特征在于，包括多个计算单元，每一计算单元内的所有子单元的互补传输门的输出端连接同一个计算电容器的底板，同一列的所有计算单元内的计算电容器顶板连接同一累加总线，每一累加总线的电压对应MAC阵列中每一列乘法计算结果的累加和。

4.如权利要求3所述的MAC阵列，其特征在于，MAC阵列还包括差分互补传输门、差分计算电容器和第一P型MOS管；所述MAC阵列的每一计算单元内，每个传统6TSRAM单元中M3、M4组成的CMOS反相器的输出端分别连接一个差分互补传输门的输入端，所有M3、M4组成的CMOS反相器所连接的差分互补传输门的输出端连接同一第一P型MOS管漏极；所述第一P型MOS管漏极连接差分计算电容器的底板，源极接VDD；差分乘法结果存储为差分计算电容器底板的电压，同一列每一差分单元的计算电容器的顶板连接同一差分累加总线。

5.如权利要求3所述的MAC阵列，其特征在于，MAC阵列还包括第一CMOS反相器和差分计算电容器；组成MAC阵列的每一个计算单元内所有互补传输门的输出端连接同一第一CMOS反相器的输入端，第一CMOS反相器的输出端连接一个差分计算电容器底板；差分乘法结果存储为差分计算电容器底板的电压，同一列的所有差分计算电容器顶板连接同一差分累加总线。

6.一种位宽可重构的模数混合内存内计算的运算模组，其特征在于，包括：如权利要求3至5中任一项所...

【专利技术属性】
技术研发人员：杨闵昊，刘洪杰，阿隆索·莫尔加多，尼尔·韦伯，克里斯蒂安·恩茨，
申请(专利权)人：深圳市九天睿芯科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人