The invention discloses a data mapping system and a method for realizing parallel convolution computation, belonging to the technical field of neural networks. The data mapping system for realizing parallel convolution computation of the invention comprises an input feature buffer module, a mapping logic module, an output feature graph buffer module, a weight buffer module, a convolution computing array and a control logic module. The input feature graph buffer module is connected with the control logic module and the mapping logic module respectively, and the weight buffer module is connected with the control logic module. Re-caching module is connected with control logic module and mapping logic module respectively. The computing array is connected with control logic module, mapping logic module and output characteristic graph cache module. The output characteristic graph cache module is connected with control logic module. The invention realizes the data mapping system of parallel convolution computing and can eliminate the invalid or non-participating computing resources, improve the utilization ratio of computing resources, and has good popularization and application value.
【技术实现步骤摘要】
一种实现并行卷积计算的数据映射系统及方法
本专利技术涉及神经网络
,具体提供一种实现并行卷积计算的数据映射系统及方法。
技术介绍
随着人工智能(AI)领域的发展,CNN(ConvolutionalNeuralNetwork即卷积神经网络)得到了充分利用。目前主流卷积神经网络模型不但结构复杂,计算数据量大,而且各层架构差异也很大,硬件电路实现高性能同时实现高通用性并不轻松,既要考虑资源利用率,又要考虑能效比。用硬件电路同时实现整个网络模型各层并不现实,功耗、面积、资源利用率等难以得到满意的结果,通常解决该问题的做法是用时间换取面积,也即将整个模型进行分层分块处理,把电路设计成通用的基本单元,通过控制电路分时构造整个模型,同时通过高效的数据映射手段提高资源利用率,以此提高电路工作性能。现有技术中在硬件电路实现某些卷积神经网络模型计算中存在卷积核滑动步长大于1的情况下,存在无效计算,降低了资源利用率;另一方面,计算阵列电路设计固定的情况下,若存在输出特征图与计算阵列尺寸不匹配的情况,存在不参与计算的资源,资源利用率也存在浪费,计算资源浪费会使整体性能得不到理想的结果。
技术实现思路
本专利技术的技术任务是针对上述存在的问题,提供一种能够消除无效或不参与的计算资源,提高计算资源利用率的实现并行卷积计算的数据映射系统。本专利技术进一步的技术任务是提供一种实现并行卷积计算的数据映射方法。为实现上述目的,本专利技术提供了如下技术方案:一种实现并行卷积计算的数据映射系统,该系统包括输入特征缓存模块、映射逻辑模块、输出特征图缓存模块、权重缓存模块、卷积计算阵列和控制逻辑模 ...
【技术保护点】
1.一种实现并行卷积计算的数据映射系统,其特征在于:该系统包括输入特征缓存模块、映射逻辑模块、输出特征图缓存模块、权重缓存模块、卷积计算阵列和控制逻辑模块,所述输入特征图缓存模块与控制逻辑模块、映射逻辑模块分别连接,权重缓存模块与控制逻辑模块、映射逻辑模块分别连接,卷积计算阵列与控制逻辑模块、映射逻辑模块、输出特征图缓存模块相连,输出特征图缓存模块与控制逻辑模块相连。
【技术特征摘要】
1.一种实现并行卷积计算的数据映射系统,其特征在于:该系统包括输入特征缓存模块、映射逻辑模块、输出特征图缓存模块、权重缓存模块、卷积计算阵列和控制逻辑模块,所述输入特征图缓存模块与控制逻辑模块、映射逻辑模块分别连接,权重缓存模块与控制逻辑模块、映射逻辑模块分别连接,卷积计算阵列与控制逻辑模块、映射逻辑模块、输出特征图缓存模块相连,输出特征图缓存模块与控制逻辑模块相连。2.根据权利要求1所述的实现并行卷积计算的数据映射系统,其特征在于:所述输入特征图缓存模块作为外部输入数据的缓存,映射逻辑模块按照控制逻辑模块下发的命令从输入特征图缓存模块和权重缓存模块获取数据,映射逻辑模块将获取的数据送至卷积计算阵列,卷积计算阵列将计算完成的数据送至输出特征图缓存模块。3.根据权利要求1或2所述的实现并行卷积计算的数据映射系统,其特征在于:所述卷积计算阵列采用N行乘N列个卷积计算单元,相邻卷积计算单元互联。4.一种实现并行卷积计算的数据映射的方法,其特征在于:所述方法将输入特征图进行有规则的分块,通过映射手段,重新组合输入特征图,增加卷积计算的并行度,映射逻辑将从重新组合的输入特征图获取的数据送至卷积计算阵列,卷积计算阵列将计算完成的数据送至输出特征图缓存模块。...
【专利技术属性】
技术研发人员:聂林川,姜凯,王子彤,
申请(专利权)人:济南浪潮高新科技投资发展有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。