【技术实现步骤摘要】
具有同时数据加载和计算能力的存算一体结构和加载方法
[0001]本专利技术涉及存内计算
,尤其涉及一种具有同时数据加载和计算能力的存算一体结构和加载方法
。
技术介绍
[0002]近年来,神经网络快速发展并取得巨大成功,随之而来的是计算需求的指数增长
。
然而,受限于处理模块和存储模块之间频繁的数据搬移,计算性能的进一步提升面临瓶颈
。
因有望打破这一瓶颈,存算一体技术受到学术界和产业界的广泛关注
。
[0003]存算一体即将存储模块和计算模块融为一体,以减少或消除两者之间频繁的数据搬移过程
。
由于在神经网络中,乘加
(multiply
‑
and
‑
accumulation)
操作占据了计算总量的
90
%以上,面向乘加算子的存算一体单元和宏设计大量涌现
。
从存储介质层面看,基于传统存储器
Flash、DRAM、SRAM
和基于新型非易失存储器
RRAM、MRAM、PCM
等的存算一体设计均已有大量报道
。
其中,由于
SRAM
的工艺成熟度和基于先进工艺的可扩展性,
SRAM
存算一体成为当前学术界和产业界研究的热点
。
在现有的
SRAM
存算一体架构中,由于
SRAM
单元面积较大,权重数据不能全部保存在
SRAM ...
【技术保护点】
【技术特征摘要】
1.
一种具有同时数据加载和计算能力的存算一体结构,其特征在于,所述结构包括:
SRAM
存算一体单元和
SRAM
暂存单元,所述
SRAM
存算一体单元包括本地计算单元和6晶体管
SRAM
,所述
SRAM
暂存单元耦合在所述本地计算单元和所述6晶体管
SRAM
之间,所述
SRAM
暂存单元为所述本地计算单元提供本周期的权重信息的同时,所述6晶体管
SRAM
从片外存储单元加载下一周期所需的权重信息,并在所述本地计算单元完成本周期计算的同时,将下一周期所需的权重信息同步导入所述
SRAM
暂存单元
。2.
如权利要求1所述的具有同时数据加载和计算能力的存算一体结构,其特征在于,所述
SRAM
存算一体单元包括电流域
SRAM
存算一体单元或电荷域
SRAM
存算一体单元
。3.
如权利要求2所述的具有同时数据加载和计算能力的存算一体结构,其特征在于,当所述
SRAM
存算一体单元为电流域
SRAM
存算一体单元时,所述6晶体管
SRAM
包括晶体管
T1、T2、T3、T4、T5
和
T6
,其中晶体管
T1、T2
构成反相器
INV1
,晶体管
T3
和
T4
构成反相器
INV2
,
INV1
和
INV2
相互耦合,晶体管
T5
和
T6
作为开关与字线
、
位线以及
INV1、INV2
相耦合,所述本地计算单元包括晶体管
T7
和
T8
,所述
SRAM
暂存单元包括晶体管
T9
和节点寄生电容
C0,所述晶体管
T9
的漏极连接至晶体管
T1
和
T2
的栅极,源极连接至晶体管
T8
的栅极,栅极连接至
WEN
,所述晶体管
T8
的源极输出
CBL
,漏极连接至晶体管
T7
的源极,所述晶体管
T7
的栅极连接至激活信号
ACT
,漏极连接电源电压或固定电位,所述节点寄生电容
C0一端接地,另一端连接至晶体管
T8
栅极,所述节点寄生电容
C0用于完成权重信息的暂存,所述晶体管
T9
用来隔离参与计算的权重信号和正在加载的权重信号
。4.
如权利要求2所述的具有同时数据加载和计算能力的存算一体结构,其特征在于,当所述
SRAM
存算一体单元为电荷域
SRAM
存算一体单元时,所述6晶体管
SRAM
包括晶体管
T1、T2、T3、T4、T5
和
T6
,其中晶体管
T1、T2
构成反相器
INV1
,晶体管
T3
和
T4
构成反相器
INV2
,
INV1
和
INV2
相互耦合,晶体管
T5
和
T6
作为开关与字线
、
位线以及
INV1、INV2
相耦合,所述本地计算单元包括晶体管
T7、T8
和电容
C
c
,所述
SRAM
暂存单元包括晶体管
T9、T10、
节点寄生电容
C0和
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。