The invention provides a hybrid memory cube storage system, comprising a mixing cube and a computing controller, a multiplier, an accelerator and a cache, which are arranged on the circuit logic layer of the mixed cube. The calculated controller in response to receiving to multiply computing instructions through the hybrid memory controller to calculate the cube to read data into to cache, and instructs the multiply add accelerator calculation; the multiplier accelerator in response to calculate from the controller's instructions, read the data in the cache. Parallel multiplex multiply computing results are written to the cache. So, in the calculation of convolution neural network when a large number of parallel computing and the frequent access to the interior of the hybrid memory cube, make full use of the hybrid memory cube internal high memory bandwidth and low latency, speed up the calculation, the convolutional neural network to improve the overall computational efficiency.
【技术实现步骤摘要】
用于卷积神经网络的混合立方体存储系统及加速计算方法
本专利技术涉及神经网络及硬件加速技术,尤其涉及支持神经网络计算的加速方法及存储结构。
技术介绍
卷积神经网络具有良好的容错能力、并行处理能力和自学习能力,被广泛应用在深度学习中作为基准神经网络架构。卷积神经网络的计算通常会涉及频繁的访存,降低访存延迟和提高访存带宽对于提高卷积神经网络的计算效率、降低计算功耗都有极大的好处。传统基于DRAM或SRAM的方式存储权重和中间计算结果的方法,并不能得到很好的效果。对于DRAM,其访存速度相较于SRAM要慢,访存带宽也相较于SRAM要小,对于神经网络的计算效率有很大的限制作用。而对于SRAM,虽然在访存速度和访存带宽上要略胜一筹,但是因为其高昂的价格,并不能提供很大的内存容量,也不适合具有大量计算数据的卷积神经网络计算。HMC(HybridMemoryCube,混合内存立方体)是一种新型的3D内存结构,由于其具有存储容量大、片上访存延迟小等特点,可能是一种合适应用于卷积神经网络计算中的存储计算载体,但如何利用这种新型内存结构更好地支持卷积神经网络计算,仍是亟需解决的问题。
技术实现思路
因此,本专利技术的目的是提供一种能较好地支持卷积神经网络计算的混合内存立方体结构及加速卷积神经网络计算的方法。本专利技术的目的是通过以下技术方案实现的:一方面,本专利技术提供了一种混合内存立方体存储系统,包括混合立方体和设置在所述混合立方体的电路逻辑层上的计算控制器、乘加加速器及缓存,其中所述计算控制器用于响应于接收的指令指示所述混合立方体的内存控制器对所述混合立方体中的数据进行存取,读 ...
【技术保护点】
一种混合内存立方体存储系统,包括混合立方体和设置在所述混合立方体的电路逻辑层上的计算控制器、乘加加速器及缓存,其中所述计算控制器用于响应于接收的指令指示所述混合立方体的内存控制器对所述混合立方体中的数据进行存取,读写缓存以及指示乘加加速器进行计算;所述乘加加速器用于响应于来自所述计算控制器的指令,读取缓存中的数据来并行地进行多路乘加计算并将计算结果写入至缓存。
【技术特征摘要】
1.一种混合内存立方体存储系统,包括混合立方体和设置在所述混合立方体的电路逻辑层上的计算控制器、乘加加速器及缓存,其中所述计算控制器用于响应于接收的指令指示所述混合立方体的内存控制器对所述混合立方体中的数据进行存取,读写缓存以及指示乘加加速器进行计算;所述乘加加速器用于响应于来自所述计算控制器的指令,读取缓存中的数据来并行地进行多路乘加计算并将计算结果写入至缓存。2.根据权利要求1所述的系统,其中所述乘加加速器包括并行乘加器、寄存器和状态机,其中状态机响应于来自计算控制器的指令控制并行乘加器进行运算;并行乘加器响应于状态机的控制,基于从寄存器读取的数据并行地进行多路乘加计算并将计算结果写入到寄存器;寄存器用于存储从缓存读取的数据和来自并行乘加器的计算结果。3.根据权利要求2所述的系统,其中所述并行乘加器由多个并联的乘加器构成。4.根据权利要求2所述的系统,其中所述寄存器大小取决于并行乘加器一次计算所需的数据的最大容量。5.根据权利要求1所述的系统,其中所述计算控制器为轻量级处理器。6.根据权利要求1所述的系统,其中所述计算控制器响应于收到要进行存取数据的指令时,通过内存控制器从混合立方体中存取相关数据,并返回对所...
【专利技术属性】
技术研发人员:韩银和,翁凯衡,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。