【技术实现步骤摘要】
神经网络近存计算系统
[0001]本专利技术涉及计算机
,尤其涉及一种神经网络近存计算系统。
技术介绍
[0002]目前深度神经网络在计算机视觉、自然语言处理、网站信息个性化推荐系统等诸多领域中发挥着至关重要的作用。根据网络结构的不同,目前常用的神经网络包括卷积神经网络、循环神经网络、图神经网络等等。
[0003]随着任务复杂度的大大提升,应用场景的增多,以及推理(inference)准确率的提高,神经网络所需的计算量也大大增加。当下大规模存储开销与大规模计算量的需求,使得“存储墙”问题越发严重,对硬件的计算与存储能力提出了新的挑战。“存储墙”(Memory wall)是在冯诺依曼架构下微处理器时钟频率增长的速度远远超过了存储器频率的增长速度所导致。目前可行的解决“存储墙”问题的有效方法是存算一体化。存算一体化结构主要包括存外结构、近存结构和存内结构。
[0004]对于更具优势的近存结构应用于神经网络计算时,现有技术中采用权重分布式存储和计算、特征图集中式存储的结构。但是这种结构特征图集中式存储导致数据 ...
【技术保护点】
【技术特征摘要】
1.一种神经网络近存计算系统,其特征在于,包括至少两个存算模块、图像存储广播模块和控制器模块;所述图像存储广播模块,用于缓存外部输入的原始图像,以及将所述原始图像广播至各个所述存算模块;各个所述存算模块,用于分布式存储神经网络的权重数据,以及分布式存储所述神经网络计算得到的特征图数据,以及基于所述权重数据、所述原始图像和所述特征图数据进行所述神经网络中的计算;所述控制器模块,用于控制各个所述存算模块的运行,以及控制所述图像存储广播模块的运行。2.根据权利要求1所述的神经网络近存计算系统,其特征在于,所述神经网络包括至少一个卷积层,每一个所述存算模块对应至少一个所述卷积层,每一个所述卷积层包括至少一个卷积核;每一个所述存算模块包括权重存储器、特征图存储器、计算阵列、路由和数据通信线路;对于每一个所述存储模块对应的所述卷积层:每一个所述卷积核的所述权重数据,分别存储于所述权重存储器中不同的位线上,每一个通道的所述特征图数据分别存储于所述特征图存储器中不同的位线上;所述计算阵列,用于进行所述神经网络中的卷积和非线性计算;所述路由,用于与相邻所述存算模块之间的数据传输;所述数据通信线路,用于所述权重存储器与所述计算阵列之间的数据传输,以及所述特征图存储器和所述计算阵列之间的数据传输。3.根据权利要求2所述的神经网络近存计算系统,其特征在于,所述控制器模块包括每一个所述存算模块分别对应的存算控制器;所述计算阵列包括至少一个计算单元;所述数据通信线路包括特征图传输总线;所述存算控制器,用于依次对所述特征图存储器中每一根字线进行如下操作:基于所述特征图传输总线,读取一根所述字线上的所述特征图数据;基于所述路由和所述特征图传输总线,将读取出的一根字线上的所述特征图数据,广播至每一个所述计算单元,以及通过所述路由,将读取出的一根字线上的所述特征图数据,传输至相邻的所述存算模块;基于所述特征图传输总线,将所述计算单元输出的新特征图数据,更新至所述特征图存储器。4.根据权利要求2所述的神经网络近存计算系统,其特征在于,所述控制器模块包括每一个所述存算模块分别对应的存算控制器;所述计算阵列包括至少一个计算单元,其中,所述计算单元与所述存储模块对应所述卷积层中所述通道一一对应;所述数据通信线路包括每一个所述计算单元分别对应的特征图传输线路;所述存算控制器,依次对所述特征图数据中每一根所述字线进行如下操作:基于所述特征图传输线路,读取一根所述字线上每一个所述通道分别对应的所述特征图数据,并将所述特征图数据分别传输给对应的所述计算单元;基于各个所述通道分别对应的所述特征图传输线路,将各个所述计算单元分别输出的新特征图数据分别存储至所述特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。