【技术实现步骤摘要】
一种基于存内CNN的调度存储方法
[0001]本专利技术涉及复用CNN调度运算
,尤其涉及一种基于存内CNN的调度存储方法。
技术介绍
[0002]大数据时代下,现有的计算结构在面对数据密集型的应用时,会因为大量的数据搬运和带宽的限制带来能耗和延迟上的提高,使得数据上的向量并行受制于存储器读写带宽。为了解决访存和数据搬运造成的能耗和延迟,存内计算突破了传统冯诺依曼瓶颈,实现了存储单元与逻辑单元的融合,是实现智能计算的主要技术路线之一。学界提出了基于SRAM的算术逻辑运算电路,在存储器中实现算术逻辑运算。现有基于SRAM的算术逻辑运算电路因为计算模式比较单一,在面对外界输入和存储单元之间运算的场景时,电路的性能会受到限制,当前的存内计算技术主要面临着硬件资源复用等问题。
[0003]卷积神经网络是一种带有卷积结构的深度神经网络,卷积结构可以减少深层网络占用的内存量,也可以减少网络的参数个数,缓解模型的过拟合问题。卷积核是卷积层的重要组成部分。特征提取器是卷积核的本质,其主要作用是自动提取输入信号的深层信息。卷积层由多个特征面组成,每个特征面由多个神经元组成,它的每一个神经元通过卷积核与上一层特征面的局部区域相连。上一层的特征图被一个可学习的卷积核进行卷积,然后通过一个激活函数,就可以得到输出特征图。每个神经元局部连接上一层的神经元,并且共享权值,然后输出数据里的每个神经元通过共享权重去卷积图像后再加上共享偏置得到的,如果没有用共享权值,那么一个神经元需要对应一个卷积核一个偏置,而现在是每个神经元对应的是同 ...
【技术保护点】
【技术特征摘要】
1.一种基于存内CNN的调度存储方法,其特征在于,包括以下步骤:对输入数组的元素和卷积核的权重进行卷积运算得到卷积结果;根据选择信号输出选择结果;所述选择结果包括卷积结果或加和结果;其中,所述加和结果为卷积结果和中间FIFO缓存单元输出的数据之和;根据使能信号选择是否将选择结果写入中间FIFO缓存单元以及选择是否输出中间FIFO缓存单元所存储的最前面的数据;基于使能取反信号输出加和结果,作为一次缓存调度的输出结果;基于外部指令信号和存储地址将所述输出结果写入memory存储模块;其中,所述选择信号、使能信号基于时钟信号和外部输入的有效标志信号得到。2.根据权利要求1所述的一种基于存内CNN的调度存储方法,其特征在于,所述基于外部指令信号和存储地址将所述输出结果写入memory存储模块包括:所述输出结果根据外部指令信号和存储地址写入memory存储单元或读取memory存储单元中的各部分部分积进行加和并重新存入memory存储单元;其中,所述输出结果按卷积行在memory存储单元中存储为多部分部分积。3.根据权利要求2所述的一种基于存内CNN的调度存储方法,其特征在于,所述外部指令信号包括memory读指令信号memory
‑
rd和memory写指令信号memory
‑
wr;当memory
‑
rd=1,memory
‑
wr=0时,分别按顺序读取memory存储单元中元素与每一个卷积核卷积后的n部分部分积进行加和运算并缓存;当memory
‑
rd=0,memory
‑
wr=1时,所述缓存数据存储至memory存储单元中;当memory
‑
rd=0,memory
‑
wr=0时,memory存储单元不操作。4.根据权利要求3所述的一种基于存内CNN的调度存储方法,其特征在于,所述memory读指令信号memory
‑
rd和memory写指令信号memory
‑
wr:当memory
‑
rd=1时,读取memory存储单元中的各部分部分积;当memory
‑
rd=0时,不读取memory存储单元中的各部分部分积;当memory
‑
wr=1时,所述输出结果写入memory存储单元;当memory
‑
wr=0时,所述输出结果不写入memory存储单元。5.根据权利要求4所述的一种基于存内CNN的调度存储方法,其特征在于,根据缓存运算逻辑确定输入数组的元素和卷积核的权重;所述有效标志信号用于控制是否写入元素、卷积核的权重;所述有效标志信号为0时,不写入,为1时写入。6.根据权利要...
【专利技术属性】
技术研发人员:张盛,孙惜阳,李政,
申请(专利权)人:晶铁半导体技术广东有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。